institut für physik physikalisches grundpraktikum · einfache lineare regression ist das...

49
Institut für Physik Institut für Physik Physikalisches Grundpraktikum Physikalisches Grundpraktikum Regressionsanalyse: Anpassung von Regressionsanalyse: Anpassung von Modellfunktionen an Messwerte und Modellfunktionen an Messwerte und Extraktion physikalisch relevanter Extraktion physikalisch relevanter Größen/Parameter Größen/Parameter

Upload: lamxuyen

Post on 30-Aug-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Institut für PhysikInstitut für PhysikPhysikalisches GrundpraktikumPhysikalisches Grundpraktikum

Regressionsanalyse: Anpassung von Regressionsanalyse: Anpassung von Modellfunktionen an Messwerte und Modellfunktionen an Messwerte und Extraktion physikalisch relevanter Extraktion physikalisch relevanter

Größen/ParameterGrößen/Parameter

Page 2: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Notwendige Vorbemerkungen INotwendige Vorbemerkungen I

Datenanalyse: oft Erhebung von Daten, die einen bestimmten bzw. vermuteten funktionalenZusammenhang zwischen den gemessenen Variablen (Eingangsgröße x, Aus-gangsgröße y) aufweisen

Mathematiker vermuten, Physiker wissen (bzw. glauben zu wissen)….Regressionsanalyse:statistisches Analyseverfahren zur Feststellung funktionaler Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen

Anmerkungen:Nur im einfachsten Fall ist das Modell eine Gerade y = a·x + b !Grundsätzlich sollte man den Typ der Modellfunktion y = f(x) immer vorher

festlegen und auch gute Gründe haben, eine bestimmte Funktion zur „Kurven-anpassung“ zu verwenden!

Die hochproblematische Vorgehensweise, alle möglichen Funktionen „auf Verdacht“ durchzuprobieren und dann die "beste" auszuwählen, liefert häufig (z.B. bedingt durch „Ausreißer“) unbrauchbare Approximationen bzw. wissenschaftlich falsche (unsinnige) Ergebnisinterpretationen!

Ein tiefer gehendes Verständnis erfordert eine kritische und intensive Auseinandersetzung mit mathematisch-statistischen Begriffen und Methoden; für die uns hier aber leider nur (viel zu) wenig Zeit zur Verfügung steht! → CP, SP

Page 3: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Notwendige Vorbemerkungen IINotwendige Vorbemerkungen IIEs gibt verschiedene Kenngrößen der Statistik, um die Beziehung zwischen zwei Variablen zu beschreiben.

Kovarianz: ungeeignet, abhängig von Skalierung!

Pearsonscher Korrelationskoeffizient als Maß für (lineare!) Korrelation:

Bedeutung der Korrelation oft überbewertet: Ein hoher Korrelationskoeffizient bedeutet nicht immer eine hohe Korrelation!

Fatale Wirkung eines einzigen„Ausreißers“!

Karl Pearson(1857-1936)

Page 4: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Notwendige Vorbemerkungen IIINotwendige Vorbemerkungen IIIBedeutung der Korrelation oft überbewertet: Ein kleiner Korrelationskoeffizient bedeutet notwendigerweise auch nicht, dass es keinerlei Beziehung zwischen zwei Variablen gibt!

Eine Korrelation zwischen zwei Variablen zu beobachten, kann sehr leicht dazu verleiten, eine kausale Beziehung zwischen diesen Variablen zu sehen.Oft ist allerdings kein kausaler Zusammenhang vorhanden, wie im folgenden Beispiel:Die Schuhgröße ist zum Kalziumgehalt der Knochen korreliert. (Kinder haben weniger Kalzium in den Knochen als Erwachsene und natürlich ist die Schuhgröße von Kindern i.d.R. auch viel kleiner als die von Erwachsenen…..)

unkorrelierter Datensatz offensichtlicherZusammenhang

Datenvisualisierung ist sinnvoll!Datenvisualisierung ist sinnvoll!

Page 5: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Notwendige Vorbemerkungen IVNotwendige Vorbemerkungen IVBerechnung eines Regressionsmodells:Brauchen objektives Maß für die Zuverlässigkeit!Bestimmtheitsmaß (engl. coefficient of determination, auch goodness of fit):

Bestimmung der Verkleinerung des Vorhersagefehlers der Ausgangsgröße y, wenn man die Information aus den Werten der Eingangsgröße x in das Modell aufnimmt

definiert die Größe der Streuung von y, die durch x erklärt werden kann (Für die einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten)

Kritikpunkte:zeigt zwar die Qualität der linearen Approximation, jedoch nicht, ob das Modell

richtig spezifiziert wurde (Modelle, die mittels kleinster Quadrate geschätzt wurden, werden die höchsten r2 erhalten)

sagt nichts über die statistische Signifikanz des ermittelten Zusammenhangs und der einzelnen Regressoren aus (zusätzlicher Signifikanztest notwendig)

hohe Empfindlichkeit gegenüber Trends→ Residuenanalyse, Signifikanztest (insbes. Χ2-Test) und VisualisierungBrauchbare Online-Bücher zum Nachschlagen und Lesen:http://www.statistics4u.info/fundstat_germ/index.htmlhttp://de.wikibooks.org/wiki/Mathematik:_Statistik:_Regressionsanalysehttp://de.wikibooks.org/wiki/Mathematik:_Numerik

( ) ( )

( )( )10 2

1

2

1

2

1

2

2 ≤≤−

−−−==

∑∑

=

== rySchätzwertundyMittelwertmityy

yyyyrB in

ii

n

iii

n

ii

Page 6: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

ProblemstellungProblemstellungVollständige Messung:Eingangsgröße x; Ausgangsgröße yErfassung einer endlichen Menge von Messwertepaaren xi,yi = f(xi),einschließlich der vorhandenen Messunsicherheiten ∆xi und ∆yi(die auch abgeschätzt sein können)

Untersuchung/Ermittlung derModellfunktion bzw. physikalischen Gesetzmäßigkeit

y = f(x) als Hypothese

Prüfung einer Hypothesey = f(x) ist bekannt

mit physikalisch relevanten Parametern

Aufstellung einer Hypothesey = f(x) ist unbekannt

mit Parametern unbekannter Bedeutung

Ermittlung aller Parameter mitzugehörigen Unsicherheiten;

Extraktion physikalisch relevanterParameter/Größen

Ermittlung von Parametern mitzugehörigen Unsicherheiten;

Prüfung auf physikalisch relevanteInformation

Bestätigung oder Verwerfen der HypotheseAA BB

Page 7: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Beispiele aus VeröffentlichungenBeispiele aus Veröffentlichungen

Quelle: eigene Arbeiten in PHYSICAL REVIEW B

AA

AA

BB

Page 8: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Beispiel im Grundpraktikum IIBeispiel im Grundpraktikum II

Untersuchung des Verhaltens eines Drehspulmessinstrumentes;Bestimmung des realen Innenwiderstandes RA;

Prüfung der Gültigkeit von Knotensatz und Maschensatz

Schaltungsaufbau

Eingangsgröße

Ausgangsgröße

Page 9: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Erfassung einer MessreiheErfassung einer MessreiheVollständige Datentabelle:

Amperemeter: Messbereich 100 µA, 5 µA Teilung, Genauigkeitsklasse 1,5%½ Skalenteil Ableseunsicherheit → ∆I ≈ 3 µA GesamtunsicherheitDekadenwiderstände:10 x 10 Ω; 10 x 100 Ω; 10 x 1 kΩ; 10 x 10 kΩ mit jeweils 0,1% Fehlerklasse(größter Teilwiderstand der kaskadierten Dekaden dominiert Messunsicherheit!)

i Rx (Ω) Kombination I (µA) ∆Rx (Ω) ∆I (µA)1 480 4x100+8x10 30.0 1 32 990 9x100+9x10 47.5 1 33 1470 1x1k+4x100+7x10 57.0 10 34 1970 1x1k+9x100+7x10 65.0 10 35 3780 3x1k+7x100+8x10 78.0 10 36 4770 4x1k+7x100+7x10 82.0 10 37 10100 1x10k+1x100 90.0 100 38 13880 1x10k+3x1k+8x100+8x10 92.0 100 39 21900 2x10k+1x1k+9x100 95.0 100 3

10 68300 6x10k+8x1k+3x100 97.5 100 3

cov(Rx,I) = 251617.9 und r(Rx,I) = 0.59384881Syntax in EXCEL: KOVAR(x;y) und PEARSON(x;y)

Bestenfalls Tendenz erkennbar, aber Beziehung zwischen Bestenfalls Tendenz erkennbar, aber Beziehung zwischen RRxx und I ?und I ?

Page 10: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

0

50

100

0 20000 40000 60000

Dekadenwiderstandswert Rx (Ω)

Stro

mst

ärke

I (µ

A)

Grafische DarstellungGrafische Darstellung

„Streudiagramm“ mit Messunsicherheiten („Fehlerkreuzen“) der Einzelpunkte:

Funktionale Beziehung (svw. physikalische Gesetzmäßigkeit) I = Funktionale Beziehung (svw. physikalische Gesetzmäßigkeit) I = f(Rf(R) ) zwischen Stromstärke und Widerstand gesucht!zwischen Stromstärke und Widerstand gesucht!

??

Page 11: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Einfachster (aber Einfachster (aber völlig unsinnigervöllig unsinniger) Ansatz) Ansatz

Regression mithilfe eines Polynoms der Ordnung N-1 bei einer Anzahl von N Stützstellen: „mathematisch exakte“ Lösung möglich (Regressionspolynom „trifft“ alle Stützstellen exakt)

-200

-100

0

100

200

0 25 50

Widerstand R (kΩ)

Stro

mst

ärke

I (µ

A)

Anpassung für 10 Stützstellen mit Polynom 9. Grades:"exakte" Beschreibung mit Bestimmtheitsmaß R2 = 1

„Oszillatorisches“ Verhalten von Polyno-men hoher Ordnung; Sinn und physika-lische Relevanz dieser Modellfunktion ist äußerst fragwürdig! Quatsch!

→→ „…„…Physiker wissenPhysiker wissen…“…“

∑−

=

⋅=1

0

)(N

i

ii RaRI

Page 12: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

„„Erraten“ der Abhängigkeit I = Erraten“ der Abhängigkeit I = f(Rf(R))Linearisierung der empirischen Versuchsdaten durch geeignete Skalierung oder Koordi-natentransformation:R → R-1 und I → I-1 (meist nicht einfach erkennbar bzw. elementar!)Hypothese über die Modellfunktion:I-1 ~ R-1 bzw. I-1 = a·R-1 + b; b mit Einheit (A-1), a mit Einheit (V·A-2)Aufgaben:Numerische Bestimmung der Modellparameter a und b (einschließlich Unsicherheiten), Validierung des Modells (mathematisch-statistische Beurteilung der „Güte“, Betrachtung der Betrachtung der physikalischen Relevanz!physikalischen Relevanz!)

0

0.01

0.02

0.03

0 0.0005 0.001 0.0015 0.002

Leitfähigkeit G = R-1 (S)

Inve

rse

Stro

mst

ärke

I-1 (1

06 A-1)

"steilste" Gerade

"flachste" Gerade

"beste" (ausgleichende) Gerade

III

∆⋅=⎟⎠⎞

⎜⎝⎛∆ 2

11 RRR

∆⋅=⎟⎠⎞

⎜⎝⎛∆ 2

11

Einfaches grafisches Verfahren möglich für eine grobe Abschätzung:Die ausgleichende Gerade muss durch den Schwerpunkt der Punktwolke verlaufen, ihre Lage ist aber sehr subjektiv!

Page 13: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Transformation der MessreiheTransformation der Messreihe

Veränderte Datentabelle:

i Rx-1 (Ω-1) I-1 (µA-1) ∆Rx

-1 (Ω-1) ∆I-1 (µA-1)1 0.002083333 0.033333333 4.34028E-06 0.0033333332 0.001010101 0.021052632 1.0203E-06 0.001329643 0.000680272 0.01754386 4.6277E-06 0.0009233614 0.000507614 0.015384615 2.57672E-06 0.0007100595 0.00026455 0.012820513 6.99868E-07 0.0004930976 0.000209644 0.012195122 4.39504E-07 0.0004461637 9.90099E-05 0.011111111 9.80296E-07 0.000370378 7.20461E-05 0.010869565 5.19064E-07 0.0003544429 4.56621E-05 0.010526316 2.08503E-07 0.00033241

10 1.46413E-05 0.01025641 2.14367E-08 0.000315582

r(Rr(Rxx--11,I,I--11) = 0.999831421 ) = 0.999831421 ≈≈ 11

Klare positive lineare Korrelation! Klare positive lineare Korrelation! →→ Beziehung zwischen Beziehung zwischen RRxx

--11 und Iund I--11 existent;existent;wahrscheinlich linear mit positivem Anstiegwahrscheinlich linear mit positivem Anstieg

Hier nur aus Bequemlichkeit nicht sachgerecht gerundet…

Page 14: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Ableitung der Abhängigkeit IAbleitung der Abhängigkeit I--11 = f(R= f(R--11))

Die folgerichtige Anwendung von • Knotensatz, • Maschensatz und • Ohmschem Gesetzliefert eine physikalisch begründete Modellfunktion (Gesetzmäßigkeit) I-1 = f(R-1).Die bisher noch unbekannten Parameter „Steigung“ und „Achsenabschnitt“ haben eine reale physikalische Bedeutung.

IA-1

Rx-1

I0-1

~ RAI0-1

Page 15: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Problemstellung der linearen RegressionProblemstellung der linearen Regression

Eingangsgröße x

Aus

gang

sgrö

ße y „Messpunkt“ (xi; yi)

„Schätzpunkt“ (xi; ŷi)

Messunsicherheiten hier noch unberücksichtigt!

Funktion y = f(x) = a·x+b mit den Parametern a und b für „beste Beschreibung“ gesucht: Was heißt „beste Beschreibung“? Offensichtlich für die geringste (mittlere) Abweichung der ausgleichenden Geraden von den Messwerten!Residuum als „Vorhersagefehler“: εi = yi – ŷi = yi – (a·xi+b)Bedingung ∑ εi = 0 hinreichend und sinnvoll? Nein!!! Keine eindeutige Lösung…Idee von Laplace mit ∑εi= min. sehr „unhandlich“….

→ Methode der kleinsten Quadrate nach C.F. Gauß (mit 18 J. schon!): ∑ εi2 = min.

Page 16: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Lösungsverfahren für lineare RegressionLösungsverfahren für lineare RegressionAnnahmen bzw. Voraussetzungen:•Zusammenhang zwischen x und y ist linear (Unterscheidung zwischen linearen, krummlinigen bzw. kurvilinearen und nichtlinearen Zusammenhängen; kurvilineareZusammenhänge in lineare transformierbar, nichtlineare nicht!)•einzelne Messungen voneinander unabhängig; zeitlicher Trend während der Messun-gen oder eine gemeinsame Korrelation mit dritter Variabler nicht existent•Eigenschaft der „Homoskedastizität“ (gut an Residuen sichtbar): Werte der Ausgangs-größe y sind für jede Eingangsgröße x „normal verteilt“ (Gauß); die zugehörige Standardabweichung sy ist von x unabhängig bzw. konstant und x ist „fehlerfrei“ (giltbeides „streng genommen“ nicht!) → wird gern „stillschweigend“ übergangenBerechnung:Berücksichtigung von sy als (konstanter) „Störgröße“Minimierung der Summe der „Fehlerquadrate“

liefert lineares Gleichungssystem in a und b (vgl. lineare Algebra)Berechnung und Lösung im „blauen Skript“ (Nachlesen!)Wichtiger allgemeingültiger Hinweis:Eine „Gewichtung“ ist bei konstantem sy zwar für die numerischen Werte von a und b wirkungslos – aber nicht für ihre Unsicherheiten (Standardabweichungen) sa und sb!!!

ysbxay ++⋅=ˆ

( )( )

00

min22

=∂∂

=∂∂

→++⋅−== ∑∑

bSund

aS

sbxaySi

yiii

Page 17: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

1. Beispiel für Bedeutung der Gewichtung1. Beispiel für Bedeutung der Gewichtung

0.0000 0.0005 0.0010 0.0015 0.00200.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

Ergebnis mit Gewichtung: a = (11.16 ± 0.35)b = (0.0099 ± 0.0002)

Ergebnis ohne Gewichtung:a = (11.16 ± 0.07)b = (0.00994±0.00006)

Aus

gang

sgrö

ße y

Eingangsgröße xVergleich zeigt:Ohne „Gewichtung“ (d.h. Berücksichtigung von sy) völlig unrealistische Unsicherheiten (Standardabweichungen) für die Parameter!

Page 18: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

2. Beispiel für Bedeutung der Gewichtung2. Beispiel für Bedeutung der Gewichtung

Vergleich zeigt:„Gewichtung“ (d.h. Berücksichtigung von variablen sy) berücksichtigt Messpunkte unterschiedlicher Messunsicherheit entsprechend → Gerade mit anderen Parametern (andere Lage)→ Achsenabschnitt „sicherer“ wegen „besserer“ Messwerte in Achsnähe; Anstieg auch „sicherer“

0.0000 0.0005 0.0010 0.0015 0.00200.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

Ergebnis mit variabler Gewichtung: a = (10.8 ± 0.2)b = (0.01004 ± 0.00009)

Ergebnis mit gemittelter konstanter Gewichtung:a = (11.16 ± 0.35)b = (0.0099±0.0002)

Aus

gang

sgrö

ße y

Eingangsgröße x

Page 19: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Weitere AnmerkungenWeitere AnmerkungenStandardabweichungen (Unsicherheiten) siIn der Praxis „echte“ Statistik meist nicht üblich bzw. viel zu aufwändig (im Grund-praktikum ohnehin!) - deshalb eher grobe Abschätzung „nach oben“ als pythagoräischeSumme von unkorrelierten systematischen und zufälligen Messunsicherheiten („kombinierte Standardabweichung) als i.a. „Überschätzung“ (vgl. Versuch F1)Residuenanalyse in grafischer Form:

Bestätigt die Überschätzung und zeigt kein „Muster“!

-0.004

-0.002

0

0.002

0.004

0 0.001 0.002

Eingangsgröße x

Abw

eich

ung

der

Aus

gang

sgrö

ßeAbschätzung

Residuum

Page 20: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Ergebnis der RegressionErgebnis der Regression

Feststellungen:offensichtlich Modellfunktion bzw. physikalische Gesetzmäßigkeit anhand der Messdaten bestätigtausgleichende Funktion beschreibt charakteristischen Verlauf innerhalb der Grenzen der

Messunsicherheiten hinreichend „exakt“ („Fehlerkreuze werden alle geschnitten; vgl. statistische Sicherheit bei Annahme der Gültigkeit der Normalverteilung für die Unsicherheiten der Messwerte)

Residuen (Abweichung zwischen Messwert und Prognose lt. Modellfunktion) sind alle geringer als die abgeschätzte Unsicherheit; Abschätzung „nach oben“ also realistisch

kritische Messgröße ist hier die Stromstärke, nicht der Widerstand

0

50

100

0 25 50

Widerstand Rx (kΩ)

Stro

mst

ärke

I (µ

A)

1

0

+=

RR

IIA

Page 21: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Institut für PhysikInstitut für PhysikPhysikalisches GrundpraktikumPhysikalisches Grundpraktikum

Regressionsanalyse: Anpassung von Regressionsanalyse: Anpassung von Modellfunktionen an Messwerte und Modellfunktionen an Messwerte und Extraktion physikalisch relevanter Extraktion physikalisch relevanter

Größen/ParameterGrößen/Parameter

Fortsetzung und „Fortsetzung und „DemystifizierungDemystifizierung“ von “ von numerischen Anpassungsergebnissennumerischen Anpassungsergebnissen

Page 22: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Rückgriff auf vorige VorlesungRückgriff auf vorige VorlesungUnter den Annahmen bzw. Voraussetzungen:„streuende“ Werte der Ausgangsgröße y sind für jede (festgehaltene) Eingangsgröße x normal verteilt (Gauß); zugehörige Standardabweichungen sy sind für jeden Wert von von x voneinander unabhängig (also auch wieder Zufallsvariablen)

ysbxay ++⋅=ˆ

Homoskedastizität HeteroskedastizitätAbweichungen der Datenpunkte von der Modelfunktion (hier Gerade):als Störterme bzw. Residuen bezeichnet, wahrscheinlichkeitstheoretisch jeweils Zufalls-variablenaber Heteroskedastizität: einfache Kleinstquadratmethode liefert nicht effizienteste Schätzwerte (d.h. kleinstmögliche Varianz bzw. Standardabweichung) für die Regres-sionsparameterAusweg: Normierung der Daten bzw. Varianzen → Gewichtung mit (variablen) sy

-2 im linearen Gleichungssystem für die Regressionsparameter (s. Skript!)

Page 23: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

ResiduenbetrachtungResiduenbetrachtungStandardabweichungen (Unsicherheiten) siIn der Praxis „echte“ Statistik meist nicht üblich bzw. viel zu aufwändig - deshalb eher grobe Abschätzung „nach oben“ als pythagoräische Summe von unkorrelierten systematischen und zufälligen Messunsicherheiten („kombinierte Standardabweichung“) Residuenanalyse in grafischer Form:

Offene Probleme:•Sind die Residuen im statistischen Sinne tatsächlich „zufällig“ verteilt?•Welche Wahrscheinlichkeitsdichte beschreibt adäquat die (renormierte) Residuen-verteilung am besten? Ist das eine Gaußsche Normalverteilung (als Hypothese)?•Wie kann man das testen und quantitativ „messen“? → χ2-Test

-0.004

-0.002

0

0.002

0.004

0 0.001 0.002

Eingangsgröße x

Abw

eich

ung

der

Aus

gang

sgrö

ße

Abschätzung

Residuum

Page 24: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Überlegungen zum χÜberlegungen zum χ22--TestTestMotivation:Vergleich empirischer Daten mit einer angenommenen (theoretischen) Wahrscheinlich-keitsverteilung und Bestimmung der zugehörigen VerteilungsparameterHier ganz konkret:empirische Daten = renormierte Residuentheoretische Verteilung = Gaußsche Normalverteilung (Mittelwert 0?) als zu überprüfende sog. Nullhypothese

Einfachste Möglichkeit zur Überprüfung:grafischer „Vergleich“ eines Häufigkeits-Histogramms der renormierten Residuen mit einer angepassten Verteilung, die aus der Gaußschen Normalverteilung berechnet wurde

Schon ähnlich gezeigt:

„Suggestivfrage“:Ist dieses einfache „Verfahren“ genügend zuverlässig und aussagekräftig?

Page 25: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Überlegungen zum χÜberlegungen zum χ22--TestTest

Probleme:i.a. doch viel zu wenig Datenpunkte bzw. Residuen für ein Histogrammvisueller Vergleich nur erster Anhaltspunkt und nicht wirklich objektivfehlende statistische Rechtfertigung und fehlendes quantitatives Maß für die Richtigkeit der NullhypotheseSchlussfolgerung:→ objektive quantitative Prüfgröße, die den Grad der Übereinstimmung zwischen empirischer und theoretischer (parametrischer) Verteilung beziffert→ χ2-Test als statistisch begründeter Verteilungs- oder Anpassungstest

Page 26: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Grundlagen zum χGrundlagen zum χ22--TestTestDefinition der Prüfgröße χ2

misst die Größe der Abweichung von der Nullhypothese

k(xj) als empirisch ermittelte absolute Häufigkeiten undhj=n·Pj als theoretisch zu erwartende Häufigkeiten gemäß der Wahrscheinlichkeitsdichte

unmittelbare Folgerungen aus der Nullhypothese:→ wenn beide Verteilungen identisch, dann auftretende Differenzen durch rein zufällige Abweichungen (d.h. bei Wiederholung von Messreihen unterschiedliche Werte von χ2) → weichen empirische Häufigkeiten k(xj) „zu stark“ von den mit hj=n·Pj zu erwartenden ab, so wird die Nullhypothese abgelehnt werden müssen

Wahrscheinlichkeitsdichtefunktion f(χ2) der χ2-Werte:nicht analytisch berechenbar, nur mit numerischen Methoden zu ermitteln und i.a. tabellarisch angegeben

( )∑

= ⋅

⋅−=

N

j j

jjp Pn

Pnxk

1

22 )(

χ

⎟⎟⎠

⎞⎜⎜⎝

⎛⋅−

−⋅⋅

== 2

2

2 2)(exp

21)()(

sxx

sxfxP

π

Page 27: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Wahrscheinlichkeitsdichte f(χWahrscheinlichkeitsdichte f(χ22))

Wahrscheinlichkeitsdichtefunktion f(χ2)für verschiedene Freiheitsgrade f

Wahrscheinlichkeitsdichtefunktion f(χ2) hat nur einen einzigen Parameter:Anzahl der Freiheitsgrade

N als Klassenanzahl r als Anzahl von Parametern der theoretischen Verteilung

Mittelwert und Varianz

Konvergenz für wachsende f gegen die Gaußsche Normalverteilung mit Parametern wie oben

Additivität: zwei unabhängige Größen χ2-verteilt (jeweils mit den Freiheits-graden f1 und f2) → Summe beider Größen χ2-verteilt mit dem Freiheits-grad f1+f2

rNf −−= 1

f=2χ fs ⋅= 22

Page 28: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Irrtumswahrscheinlichkeit Irrtumswahrscheinlichkeit αα

Zuordnung zwischen (vorgegebenem) Freiheitsgrad f und einer bestimmten Irrtums-wahrscheinlichkeit α (nur mit numerischen Verfahren bestimmbar, tabelliert)

→ statistische Betrachtungsweise: keine einfachen „Ja/Nein-Aussagen“, sondern stets Wahrscheinlichkeitsaussagen!

Definition mit

( ) 22

2

χχαχ

dfp

∫∞

=

6,064,353,001,611,150,8310,5545

4,883,362,191,060,7110,4840,2974

3,672,371,420,5840,3520,2160,1153

2,411,390,7130,2110,1030,0510,0202

1,070,4550,1480,0163,93(-3)0,82(-4)1,57(-4)1

0,300,500,700,900,950,9750,99αf

Page 29: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Zurück zum „Rechenbeispiel“Zurück zum „Rechenbeispiel“

Wir irren uns hier mit einer sehr geringen Wahrscheinlichkeit!→ Hypothese ist „mit hoher Wahrscheinlichkeit“ richtig für Normalverteilung und folgerichtig auch für die gewählte Modellfunktion→ Größe „Chi^2“ muss möglichst minimiert werden

0.0000 0.0005 0.0010 0.0015 0.0020

0.010

0.015

0.020

0.025

0.030

0.035Modell: Gerade y = ax + bChi^2 = 0.03382R^2 = 0.99868a = (10.8 ± 0.2)b = (0.01004 ± 0.00009)

Aus

gang

sgrö

ße y

Eingangsgröße x

Page 30: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Vorsätzlich „unrichtiges“ ModellVorsätzlich „unrichtiges“ Modell

Wir irren uns hier mit einer um Größenordnungen höheren Wahrscheinlichkeit!→ Hypothese ist „mit hoher Wahrscheinlichkeit“ falsch für Normalverteilung und folgerichtig auch für die gewählte Modellfunktion (wie zu erwarten!)

0.0000 0.0005 0.0010 0.0015 0.00200.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

Modell: UrsprungsgeradeChi^2 = 350.58953R^2 = -14.37778a = 33.1UNSINNIG! ITERATION NICHT KONVERGENT!

Aus

gang

sgrö

ße y

Eingangsgröße x

Page 31: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

„„Subtileres“ Beispiel: Beugung am GitterSubtileres“ Beispiel: Beugung am Gitter

gkk

λα ⋅=)sin(

Beziehung zwischen Gitterperiode g, Wellenlänge λ und Beugungsordnung k (↑ Wellenoptik im 3. Fachsemester)

Page 32: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Oberflächliche AuswertungOberflächliche Auswertungder Beugung am Gitterder Beugung am Gitter

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

-10 -5 0 5 10

Beugungsordnung k

Beug

ungs

win

kel s

in (α

k') Lineare Regression mit sin(αk') = k·g-1·546,074 nm

g = (10,0010 ± 0,0017) µmχ2 = 82,13778R2 = 0,99994

Auf den „ersten flüchtigen Blick“ ein wunderschönes Ergebnis:g liegt sehr nahe am Referenzwert und hat eine sehr kleine UnsicherheitBestimmtheitsmaß R2 liegt sehr dicht am IdealwertAusgleichsgerade liegt praktisch ideal→ Aber der Wert von χ2 „stimmt den aufmerksamen Physiker sehr misstrauisch“!

Page 33: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Nähere BetrachtungNähere Betrachtung

In dieser Darstellung wird das bestehende Problem schon viel deutlicher – der Unterschied zeigt sich mit zunehmender Beugungsordnung k. Man erhält man für beide Seiten „ganz unerwartet“ deutlich verschiedene Ergebnisse für den Anstieg der Ursprungsgeraden! Woran liegt es, dass das verwendete Modell so unbefriedigend ist?

0

0.2

0.4

0 5 10

Beugungsordnung ‌‌k‌‌‌‌

Beug

ungs

win

kel ‌‌

sin (α k

) ‌‌linke Seiterechte Seite

Lineare Regression für linke Seite:sin(αk') = 0.054965 k

R2 = 0.999991

Lineare Regression für rechte Seite:sin(αk') = 0.054239 k

R2 = 0.999992

Page 34: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Neue Überlegungen zum ModellNeue Überlegungen zum ModellIm vorhandenen experimentellen Aufbau ist es praktisch unmöglich, das Beugungsgitter so auszurichten, dass die Gitterebene exakt senkrecht zur optischen Achse steht. Durch die Verkippung werden alle Beugungsordnungen systematisch versetzt.

gGitternormale

optische Achse

Gittersubstrat (Glas)

Gitter

virtuelles Gitter

β

0. Ordnung

1. Ordnung

-1. Ordnung

gkk

λβα ⋅=+ )sin()sin(Neues Modell:

Page 35: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Neues ZwischenergebnisNeues Zwischenergebnis

gkk

λβα ⋅=+ )sin()sin(Neues Modell:

bg

kk +⋅=λα )sin(

Vereinfachung wegen konstantem Winkel β zu:

Numerische Resultate:χ2 = 15,62443R2 = 0,99998b = (-0,00193 ± 0,00008)g = (10,0008 ± 0,0024) µm

Auf die grafische Darstellung wurde hier (ausnahmsweise) verzichtet…

Dieses Ergebnis ist wegen der erheblichen Reduzierung von χ2 qualitativ deutlich besser bzw. erheblich vertrauenswürdiger – auch wenn g etwas „unsicherer“ geworden ist (alles im Vergleich zum ersten Ergebnis).

Page 36: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Der letzte „Feinschliff“ des ModellsDer letzte „Feinschliff“ des Modells

gGitternormale

optische Achse

Gittersubstrat (Glas)

Gitter

virtuelles Gitter

β

0. Ordnung

1. Ordnung

-1. Ordnung

Berücksichtigung des Parallelversatzes für die 0. Beugungsordnung:

( )⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅−= βλαα sinarcsin0 g

kk( ) ( )g

kkλβαα ⋅=+− sinsin '

0

Page 37: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Das EndergebnisDas Endergebnis

0.7

0.9

1.1

1.3

1.5

1.7

1.9

-10 -5 0 5 10

Beugungsordnung k

Sche

inba

rer

Beu

gung

swin

kel

α k'

-0.0006

-0.0003

0

0.0003

0.0006

Res

iduu

m

MesswerteAnpassungResiduen

g = (10,0053 ± 0,0017) µmGitterkonstante

α0 = (1,2730 ± 0,0011) = (72,94 ± 0,06)°Scheinbarer Winkel der Nullposition

β = (0,026 ± 0,001) = (1,51 ± 0,06)°Neigungswinkel der Gitternormalen

χ2 = 1,18916Chi-Quadrat-Test

σn = 0,00029Standardabweichung der Anpassung

R2 = 1Güte der Anpassung

Mathematiker vermuten, Physiker wissen (bzw. glauben zu wissen)….

Page 38: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

KonfidenzKonfidenz-- und und PrädiktionsintervallePrädiktionsintervalle

Wenn man das Konfidenzintervall für eine Regressionsgerade grafisch darstellt, erhält man dafür einen hyperbolischen Verlauf: Das Konfidenzintervall hängt ganz offensichtlich vom x-Wert ab. Je weiter er sich vom Schwerpunkt der „Datenpunkt-wolke“ entfernt, desto breiter wird der „Konfidenzschlauch“ (begrenzt durch innere blaue Kurven). Damit ist auch klar, warum eine Extrapolation stets unsicherer ist als eine Interpolation. Allgemein kann die „Schlauchbreite“ auch noch lokal variieren; insbesondere bei sehr inhomogen über x verteilten Datenpunkten!(Für beliebige Anpassungen mit anderen Funktionen gilt sinngemäß dasselbe.)

svw. Prädiktions- bzw. Vorhersage-Intervall

Konfidenz = Vertrauen

Page 39: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Ein anderes schönes Beispiel:Ein anderes schönes Beispiel:Brechung an einem PrismaBrechung an einem Prisma

Metalldampflampe

Vgl. Versuche „O9 Reflexion und Brechung“ bzw. „O3 Prismenspektrometer“

Spektralzerlegung von weißem polychromatischem Licht

natürliches Tageslicht

Glühlampe

Wellenlänge (nm)

Page 40: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Optische Dispersion: n = n (Optische Dispersion: n = n (λλ))

allg. Beziehung

minimale Ablenkung

Bessere Lösung, da nur eine Messgröße (außer ε)!Möglichst präzise Winkelmessung erforderlich!

Page 41: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Orientierungsdarstellung n = n(Orientierungsdarstellung n = n(λλ))

1.70

1.71

1.72

1.73

1.74

1.75

1.76

1.77

400 450 500 550 600 650 700

Wellenlänge (nm)

Bre

chun

gsin

dex

n

Eingezeichnete Kurve nur zur Orientierung!

4min

min

108)()()( −⋅≈∂∂

+∂

∂≤ ε

εδ

δununnu

%05.07.1

108)( 4

≈⋅

≤−

nnu

Page 42: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Anpassung n = n(Anpassung n = n(λλ))

Physikalisch begründete benutzerdefinierte Funktion auszuwählen!

Page 43: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Anpassung n = n(Anpassung n = n(λλ) mit Gewichtung) mit Gewichtung

Page 44: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Vergleich mit ReferenzwertenVergleich mit Referenzwerten

1.61

1.62

1.63

1.64

1.65

400 450 500 550 600 650 700

Wellenlänge λ (nm)

Bre

chun

gsin

dex

n Referenzdaten

Messdaten

Sellmeier-Modellfunktion (ein Term)

Messergebnisse an Flintglas SCHOTT F2

Manipuliert oder mit Sachargumenten überzeugt Manipuliert oder mit Sachargumenten überzeugt worden?worden?

Page 45: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Vollständige Gewichtung:Vollständige Gewichtung:mit Unsicherheiten behaftete Eingangsmit Unsicherheiten behaftete Eingangs-- und und

AusgangsgrößenAusgangsgrößen

Bisherige Betrachtungen:für die Regression mit Gewichtung y = f(x) nur die Unsicherheiten der Ausgangsgröße sy berücksichtigtEingangsgröße hat aber (objektiv bedingt) ebenso eine Unsicherheit sx (nur in ganz seltenen Fällen nicht), die nicht „ad hoc“ vernachlässigt werden darf(Feststellungen gelten für die allermeisten verfügbaren Software-Lösungen zur Regressionsrechnung, auch für QtiPlot und ORIGIN™!)Problem:Wie wirkt sich eine Unsicherheit sx auf die Ausgangsgröße y aus und wie kann man das in der Regressionsanalyse berücksichtigen?Lösungsansatz:bekannte und physikalisch begründete funktionale Abhängigkeit y = f(x)„Störung“ der Eingangsgröße x um δx → „Störung“ der Ausgangsgröße y um δy gemäß der Beziehung δy = f‘(x)·δx

Mit der (hypothetischen) Annahme, dass y „fehlerfrei“ vzw. „beliebig genau und sicher“ gemessen werden könnte: Allein aus der Unsicherheit sx von x folgt über den eindeutigen kausalen Zusammenhang y = f(x) eine Unsicherheit in y von f‘(x)·sx !

Page 46: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Vollständige Gewichtung:Vollständige Gewichtung:mit Unsicherheiten behaftete Eingangsmit Unsicherheiten behaftete Eingangs-- und und

AusgangsgrößenAusgangsgrößenWeitere Annahme:Die beiden Größen x und y werden z.B. mit verschiedenen Messgeräten oder Messmethoden erfasst. Dann gibt es gute Gründe dafür, ihre jeweiligen (ursprüng-lichen) Messunsicherheiten als unkorrelierte Größen anzusehen!Folgerung:Zur Messunsicherheit sy der Ausgangsgröße kann pythagoräisch ein Beitrag der Form f‘(x)·sx addiert werden, so dass sich daraus eine „resultierende“ (kombinierte) Unsicherheit ergibt. Diese Größe kann zur (vollständigen) Gewichtung in der Regression eingesetzt werden.

Anmerkung:Beim Geradenausgleich y = a·x+b ist selbstverständlich f‘(x) = aProblematisch ist aber, dass uns f‘(x) nicht „ad hoc“ bekannt ist, sondern erst mithilfe der Regression berechnet wird…Idee:Wir machen eine erste Abschätzung für f‘(x), berechnen die sy‘ und gehen damit in die Regression (0. Iterationsschritt). Den so verbesserten Wert von f‘(x) verwenden wir im nächsten Iterationsschritt für dieselbe Prozedur usw. usf. Und die Abbruchbedingung?Sehr „kitzlig“ wird es für nichtlineare Funktionen y = f(x), weil mehr zu berechnen ist…

( ) ( )22 )('' xyy sxfss ⋅+=

Page 47: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

IterationsprozedurIterationsprozedurDatenvorbereitung:

Eingabe von x und y (ggf. Linearisierung)Berechnung von sx und sy

Vorgabe der parametrischen Modellfunktion f(x)

Erste Schätzung für Parameter und f‘(x)

Berechnung der sy‘Regression mit Gewichtung nach den sy‘

Neuberechnung von f‘(x) entsprechendden verbesserten Parametern

Überprüfung der Abbruchbedingung(zweckmäßig: Veränderung der Unsicherheiten von Parametern)

Abbruch bei „Erfolg“ Schleife

Konvergenzverhalten?!

Page 48: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

Manueller Test für die Manueller Test für die GeradenanpassungGeradenanpassung

0

10

20

30

40

50

0 50 100

Eingangsgröße x

Aus

gang

sgrö

ße y

Hier „gutartiges“ Konvergenzverhalten zu beobachten gewesen:Abbruchbedingung (unveränderte 2. signifikante Ziffer der Unsicherheit im Anstieg) bereits nach 4 Iterationsschritten erfüllt!

schwarz: Fehlerbalken für ursprüngliche Unsicherheitenrot: Fehlerbalken mit Beitrag der a·sx

Page 49: Institut für Physik Physikalisches Grundpraktikum · einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten) Kritikpunkte:

FazitFazit des Problemsdes Problems

Die uns unmittelbar zur Verfügung stehende Software leistet diese Form der Gewichtung nicht. Auch eine entsprechende kommerzielle Lösung ist nicht bekannt.

Eine fertige Lösung existiert derzeit (noch) nicht und erfordert einen ganz erheblichen Arbeitsaufwand für die Programmierung.

In Einzelfällen kann auf diese spezielle Gewichtung u.U. ganz verzichtet werden, weil die Eingangsgrößen x „fehlerfrei“ bzw. „sicher“ sind (z.B. Ganzzahligkeit bei Beugungsordnungen) oder auch dann, wenn die Bedingung sy>>f‘(x)·sx erfüllt ist (sehr schwache Abhängigkeit f(x)).

Im Grundpraktikum werden wir uns mit der Gewichtung nach den Unsicherheiten der Ausgangsgrößen begnügen müssen.

Dieses numerische Problem bleibt ggf. der LV CP I+II vorbehalten.