stks statistische tests in kleinen stichproben Übersicht über nichtparametrische verfahren und...
Post on 06-Apr-2015
118 Views
Preview:
TRANSCRIPT
STKS
Statistische Tests in kleinen Stichproben
Übersicht über nichtparametrische Verfahren und Anpassungstests
STKS
Fahrplan 3. Einheit
Nichtparametrische Verfahren"Vokabel"Vor- und Nachteile nichtparametrischer VerfahrenÜberblick über die nichtparam. Verfahren
Anpassungstests (Einstichprobenfall)Ziele der AnpassungstestsBinomialtestChi-Quadrat-Test für eine StichprobeKolmogorov-Smirnov (KS)-Test
STKS
Nichtparametrische Verfahren: Wichtige "Vokabel"
"Teststärke" (Power, Macht, Trennsschärfe): Wahrscheinlichkeit, bei gegebenem Stichprobenumfang eine falsche H0 zu verwerfen = 1 - beta
"Stärkeeffizienz": Vergleich eines Tests X mit dem stärksten bekannten Test für die selbe Fragestellung ---> wieviel muß n bei Test X höher sein als beim stärksten bekannten Test, um die selbe Teststärke zu erreichen. Bsp.: Eine Stärkeeffizienz von 0,8 bedeutet, daß Test X 125 Apn. braucht, um die selbe Stärke wie der stärkste Test mit 100 Personen zu erreichen.
"Abhängige" vs. "unabhängige" Stichproben: "abhängig" z. B. bei Vorher-Nachhermessung oder "statistischen Zwillingen"
STKS
Vor- und Nachteile der nichtparametrischen Verfahren
auch bei nichtmetrischen Daten (nominal und ordinal) und kleinen Stichproben einsetzbar
bei metrischen Daten keine Annahmen über zugrundeliegende Verteilungen in der Grundgesamheit
geringere Teststärke als parametrische Verfahren
+
+
STKS
Aber ...
bei kleinen Stichproben (qual. Marktforschung) sind nicht Meßniveau oder Verteilungsannahmen, sondern die Frage der Repräsentativität der Stichprobe das größte Problem
parametrische Verfahren sind gegen Verletzungen der Verteilungsannahmen relativ robust
Nachteile in der Teststärke sind oft relativ gering
STKS
Nichtparametrische Verfahren
1 Stichprobe("Anpassungstests")
3 und mehr Stichproben
2 Stichproben
nominal ordinal
unabhängig abhängig unabhängig abhängig
BinomialtestChi-Quadrat- Test für 1 Stpr.
Chi-Quadrat- Test
KS-Test
MediantestMann-Whitney U-TestKS-Test
FriedmanChi-Quadrat-Test
McNemar VorzeichenWilcoxon
MedianKruskal- Wallis
Cochran Qnominal ordinal nominal ordinalnominal nominal ordinalordinal
STKS
Nichtparametrische Verfahren
1 Stichprobe("Anpassungstests")
3 und mehr Stichproben
2 Stichproben
nominal ordinal
unabhängig abhängig unabhängig abhängig
BinomialtestChi-Quadrat- Test für 1 Stpr.
Chi-Quadrat- Test
KS-Test
MediantestMann-Whitney U-TestKS-Test
FriedmanChi-Quadrat-Test
McNemar VorzeichenWilcoxon
MedianKruskal- Wallis
Cochran Qnominal ordinal nominal ordinalnominal nominal ordinalordinal
STKS
Nichtparametrische Verfahren
1 Stichprobe("Anpassungstests")
3 und mehr Stichproben
2 Stichproben
nominal ordinal
unabhängig abhängig unabhängig abhängig
BinomialtestChi-Quadrat- Test für 1 Stpr.
Chi-Quadrat- Test
KS-Test
MediantestMann-Whitney U-TestKS-Test
FriedmanChi-Quadrat-Test
McNemar VorzeichenWilcoxon
MedianKruskal- Wallis
Cochran Qnominal ordinal nominal ordinalnominal nominal ordinalordinal
STKS
Anpassungstests
testen, ob Stichprobe aus einer Grundgesamtheit mit einer bestimmten theoretischen Verteilung stammt (Normalverteilung, Gleichverteilung etc.)
Nullhypothese: Stichprobe stammt aus einer Grundgesamtheit mit dieser theoretischen Verteilung
gängige Testverfahren: Binomialtest, Chi-Quadrat-Test für eine Stichprobe, Kolmogorov-Smirnov (KS)-Test
STKS
Binomialtest
anwendbar, wenn nur zwei Kategorien, auch bei kleinen Fallzahlen
Berechnung:
Wahrscheinlichkeit, daß unter der Nullhypothese "P erwarteter Anteil der Fälle der ersten Kategorie und Q erwarteter Anteil der Fälle der zweiten Kategorie" bei N Versuchen x Mal die erste Kategorien gezogen wird
Beispiel: Wahrscheinlichkeit, daß unter der Nullhypothese "Erwarteter Anteil von Sechsern bei einem regelmäßigen Würfel: 1/6 (=P), andere Zahlen 5/6 (=Q)" bei 5 Würfen (=N) 2 (=x) Mal ein Sechser kommt.
p xN
xP Qx N x( )
STKS
Beispiel: Verteilung des Geschlechts der befragten Mineralwasserkäufer in der Stichprobe 1994
Bekannte Verteilung der Mineralwasserkäufer: 63% weiblich, 37% männlich
Verteilung in der Stichprobe: 59,4% Frauen, 40,6% Männer --> Ist die Stichprobe hinsichtlich des Geschlechts ein getreues Abbild der Grundgesamtheit aller Mineralwasserkäufer?
Eingabe in SPSS: erwarteter Anteil der ersten Kategorie (1=weiblich, 2=männlich --> Eingabe: 0,63)
STKS
Test auf Binomialverteilung
weiblich 107 ,59 ,63 ,181a,b
männlich 73 ,41
180 1,00
Gruppe 1
Gruppe 2
Gesamt
Geschlecht der APNKategorie N
BeobachteterAnteil Testanteil
Asymptotische Signifikanz
(1-seitig)
Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,63.a.
Basiert auf der Z-Approximation.b.
Nichtparametrische Tests
NPAR TEST
/BINOMIAL (.63)= geschl
/MISSING ANALYSIS.
STKS
22
1
( )O E
Ei i
ii
k
Chi-Quadrat-Test für eine Stichprobe
anwendbar beinominalem Datenniveau (zwei oder mehr Kategorien) und ausreichend großer Zahl erwarteter Fälle in jeder der Kategorien: bei 2 Kategorien kein E kleiner als 5, bei 3 und mehr Kategorien kein E kleiner als 1 und weniger als 20% der E s kleiner als 5
Testgröße:
ii
i
Berechnung von Chi-Quadrat: Für jede Gruppe Differenz zwischen beobachteter Fallzahl (O i) und erwarteter Fallzahl (Ei) ermittelt, diese quadriert und dann durch die erwartete Fallzahl dividiert. Dann Aufsummierung über alle Gruppen.
STKS
Berechnung der erwarteten Häufigkeiten
Erwartete Häufigkeit:
E = Zeilensumme * Spaltensumme / N
Frauen Männer
Raucher 50
Nichtraucher 50
50 50 100
rauchende Frauen = 50 * 50 / 100 = 25
STKS
Berechnung der erwarteten Häufigkeiten
Erwartete Häufigkeit:
E = Zeilensumme * Spaltensumme / N
Frauen Männer
Raucher 50
Nichtraucher 50
50 50 100
Frauen Männer
Raucher 25 25 50
Nichtraucher 25 25 50
50 50 100
STKS
Beispiel: Anteile der Mineralwassermarken in der Stichprobe 1994
Bekannte Marktanteile in Wien 1994: Römerquelle 27%, Vöslauer 30%, Juvina 10%, Waldquelle 8%, Sonstige 25%
"Marktanteile" in der Stichprobe: RQ 26,7%, Vöslauer 29,4%, Juvina 10%, Waldquelle 8,3%, Sonstige 25,6% --> Ist die Stichprobe hinsichtlich Markenkauf ein getreues Abbild der Grundgesamtheit aller Mineralwasserkäufer?
Eingabe in SPSS: erwarteter Anteil für jede Marke
STKS
Nichtparametrische TestsChi-Quadrat-TestHäufigkeiten
KAUF
48 48,6 -,6
53 54,0 -1,0
18 18,0 ,0
15 14,4 ,6
46 45,0 1,0
180
Römerquelle
Vöslauer
Juvina
Waldquelle
Sonstige
Gesamt
BeobachtetesN
ErwarteteAnzahl Residuum
Statistik für Test
,073
4
,999
Chi-Quadrata
df
Asymptotische Signifikanz
KAUF
Bei 0 Zellen (,0%) werden weniger als5 Häufigkeiten erwartet. Die kleinsteerwartete Zellenhäufigkeit ist 14,4.
a.
NPAR TEST
/CHISQUARE=kauf
/EXPECTED=0.27 0.3 0.1 0.08 0.25
/MISSING ANALYSIS.
STKS
KS-Testanwendbar, wenn
Meßniveau der Daten mindestens ordinalskaliert undzugrundeliegendes Merkmal stetig
kann auch bei kleinen Zellenbesetzungen eingesetzt werden
größere Teststärke als Chi-Quadrat-Test --> ist daher bei Erfüllung der Voraussetzungen diesem vorzuziehen
Testgröße:
Prüfgröße D: Maximale Differenz zwischen der unter H 0(in SPSS: Normalverteilung, Gleichverteilung, Poissonverteilung, Exponentialverteilung) erwarteten kumulierten Häufigkeitsverteilung (=F0(X)) und der in der Stichprobe beobachteten Verteilung (=S N(X)).
D F X S XN max ( ) ( )0
STKS
Modifikationen des KS-TestsKS-Test hat statistische und praktische Nachteile --> Korrekturen und Alternativtests:
unkorrigierter KS-Test: wenn Mittelwert und Standard- abweichung in der Grundgesamtheit bekannt. Bei Test auf Normalverteilung und n>100 allerdings auch hier zumindest zusätzlich alternativen Test durchführen: Wenn sowohl Schiefe +/- 1,96 * S.E. der Schiefe als auch Wölbung +/- 1,96 * S.E. der Wölbung die Zahl 0 miteinschließen, keine signifikante Abweichung von Normalverteilung.
KS-Test mit Lilliefors-Korrektur: wenn Mittelwert und Standardabweichung in der Grundgesamtheit nicht bekannt. Wenn n<50 stattdessen Shapiro-Wilkes. Achtung: beide Tests in SPSS nicht unter Menüpunkt "NPar", sondern unter "Summarize / Explore". Wahl zwischen KS/Lilliefors und SW nimmt SPSS automatisch vor. Bei n>100 und Test auf Normalverteilung: s. o.
STKS
Übersicht KS-Tests (Modifikationen)
KS Test
KS Testohne Korrektur
KS Testmit Korrektur
KS TestShapiro-Wilks
KS TestLilliefors
KS TestLilliefors
+ Ersatztest
(Schiefe/Wölbung)
Mittelwert und Verteilung bekannt
n < 50 50 < n <= 100 n > 100
ja nein
n > 100
+ Ersatztest
(Schiefe/Wölbung)
STKS
Übersicht KS-Tests (Modifikationen)
KS Test
KS Testohne Korrektur
KS Testmit Korrektur
KS TestShapiro-Wilks
KS TestLilliefors
KS TestLilliefors
+ Ersatztest
(Schiefe/Wölbung)
Mittelwert und Verteilung bekannt
n < 50 50 < n <= 100 n > 100
ja nein
n > 100
+ Ersatztest
(Schiefe/Wölbung)
STKS
Explorative Datenanalyse
Verarbeitete Fälle
180 100,0% 0 ,0% 180 100,0%QualitätseinschätzungRömerquelle
N Prozent N Prozent N Prozent
Gültig Fehlend Gesamt
Fälle
Univariate Statistiken
6,31 7,89E-02
6,16
6,47
6,47
7,00
1,121
1,06
1
7
6
1,00
-2,394 ,181
6,856 ,360
Mittelwert
Untergrenze
Obergrenze
95% Konfidenzintervalldes Mittelwerts
5% getrimmtes Mittel
Median
Varianz
Standardabweichung
Minimum
Maximum
Spannweite
Interquartilbereich
Schiefe
Kurtosis
QualitätseinschätzungRömerquelle
StatistikStandardf
ehler
STKS
Tests auf Normalverteilung
,287 180 ,000QualitätseinschätzungRömerquelle
Statistik df Signifikanz
Kolmogorov-Smirnova
Signifikanzkorrektur nach Lillieforsa.
STKS
Qualitätseinschätzung Römerquelle
Qualitätseinschätzung Römerquelle
7,06,05,04,03,02,01,0
Histogramm
Hä
ufig
keit
120
100
80
60
40
20
0
Std.abw. = 1,06
Mittel = 6,3
N = 180,00
STKS
Q-Q-Diagramm von Qualitätseinschätzung Römerquelle
Beobachteter Wert
876543210
Erw
art
ete
r N
orm
alw
ert
1,0
,5
0,0
-,5
-1,0
-1,5
-2,0
-2,5
-3,0
STKS
Trendbereinigtes Q-Q-Diagramm von Qualitätseinschätzung Römerquelle
Beobachteter Wert
876543210
Ab
we
ich
un
g v
on
No
rma
l
,5
0,0
-,5
-1,0
-1,5
-2,0
-2,5
-3,0
STKS
Zusammenfassung
Wahl des konkreten nichtparam. Verfahrens: nach den 3 Kriterien
Zahl der Stichprobenabhängige vs. unabhängige StichprobenSkalenniveau
Anpassungstests: Stammt die Stichprobe aus einer Grundgesamtheit mit einer bestimmten theoretischen Verteilung? --> Binomialtest, Chi-Quadrattest für eine Stichprobe, KS-Test
Bei KS-Test Modifikationen beachten!
STKS
Statistische Tests in kleinen Stichproben
Tests für 2 abhängige Stichproben
STKS
Fahrplan 4. EinheitWas sind abhängige Stichproben?
McNemar-TestAnwendungsbedingungenTestverfahrenFallbeispiel und SPSS-Printout
Wilcoxon-TestAnwendungsbedingungenTestverfahrenFallbeispiel und SPSS-Printout
Vorzeichentest
STKS
Abhängige vs. unabhängige Stichprobenabhängige Stichproben: Elemente von zwei Stichproben können jeweils paarweise zugeordnet werden
Zweimal bei einer Person gemessen Vorher-Nachher-Messung (z. B. Einstellung zu Marke A vor und nach einem Werbespot) oder Vergleich zweier Antworten von einer Person (z. B. Einstellung zu Marke A verglichen mit Einstellung zu Marke B)
Auskunftspersonen jeweils paarweise zusammengefaßt
Inhaltliche Paarbildung (z. B. jeweils Ehemann und Ehefrau) oder "statistischer Zwilling" (z. B. 50jährige Hausfrau mit Matura aus Gruppe 1 wird 50jähriger Hausfrau mit Matura aus Gruppe 2 zugeordnet)
STKS
Der McNemar-Test
anzuwenden bei
zwei abhängigen Stichproben
nominalem Meßniveau (dichotom)
keine Annahme, daß das zugrundeliegende Merkmal stetig verteilt ist
+
STKS
Testprinzip des McNemar-Tests
vorher
+
+-
-
nachher
C
A
D
B
Testgröße:
2
21
A D
A D
STKS
Beispiel: Zuordnung von "High-Tech" zu VOEST vor und nach einem Werbefilm
vor Film
nein
neinja
ja
nach Film
6
16
4
4
STKS
Nichtparametrische Tests
McNemar-Test
Kreuztabellen
1 & 2
6 4
16 4
VORFILM1
2
1 2
NACHFILM
Statistik für Testb
30
,012a
N
Exakte Signifikanz(2-seitig)
1 & 2
Verwendetete Binomialverteilung.a.
McNemar-Testb.
STKS
Der Wilcoxon-Testanwendbar bei
2 abhängigen Stichproben
ordinalem Datenniveau
Annahme, daß das zugrundeliegende Merkmal stetig verteilt ist
+
+
STKS
Testprinzip des Wilcoxon-TestsFür jede Apn. Ermittlung der Differenz der zwei Werte, diese Differenzbeträge ohne Berücksichtigung des Vorzeichens (d. h. nach ihrer absoluten Höhe) in eine Rangreihenfolge gebracht, dann getrennte Aufsummierung der positiven und negativen Rangplatzsummen, kleinerer Wert davon ist die Testgröße T
Verbundwerte ("ties"): Wenn bei einer Person keine Unterschiede zwischen den beiden Messungen, fällt sie aus der Analyse vollständig heraus
gleiche Differenzen: z. B. zwei Personen haben ex aequo zweitgrößte Differenz --> für beide Durchschnittsrang 2,5 dann weiter mit 4
STKS
Fallbeispiel: Rangreihung von Mineralwassermarken zu unterschiedlichen
Preisen (Wien 1994)
5 Marken zu je 4 verschiedenen Preisen = 20 Angebote --> diese von den Auskunftspersonen in eine Präferenzreihenfolge gebracht
Wird Römerquelle trotz eines Preises von öS 5,20 vor Vöslauer zu öS 4,50 gereiht?
STKS
Apn. Rangplatz
Römer-quelle zu öS 5,20
Rangplatz Vöslauer zu
öS 4,50
Differenz der beiden Rangplätze
Rangplatz der
Differenz (Vergleich der
Werte zwischen den Apn!)
Summe pos.
Vorzeichen
Summe negatives
Vorzeichen
1 17 11 6 9 (+) 9 (+) 2 16 12 4 6 (+) 6 (+) 3 15 12 3 3 (+) 3 (+) 4 17 12 5 8 (+) 8 (+) 5 14 11 3 3 (+) 3 (+) 6 7 6 1 1 (+) 1 (+) 7 4 12 -8 10 (-) 10 (-) 8 15 11 4 6 (+) 6 (+) 9 8 5 3 3 (+) 3 (+) 10 16 12 4 6 (+) 6 (+) Summe 45 10
T= 10
Fallbeispiel Wilcoxon-Test
Berechnung (auf die ersten 10 Apn. beschränkt)
STKS
NPAR TEST
/WILCOXON=flnr1 WITH flnr6 (PAIRED)
/MISSING ANALYSIS.
Nichtparametrische Tests
Wilcoxon-Test
Ränge
148a 90,12 13337,50
31b 89,44 2772,50
0c
179
Negative Ränge
Positive Ränge
Bindungen
Gesamt
Fl.Nr. 6, Vöslauer zu4,50 - Fl.Nr. 1,Römerquelle zu 5,20
N Mittlerer Rang Rangsumme
Fl.Nr. 6, Vöslauer zu 4,50 < Fl.Nr. 1, Römerquelle zu 5,20a.
Fl.Nr. 6, Vöslauer zu 4,50 > Fl.Nr. 1, Römerquelle zu 5,20b.
Fl.Nr. 1, Römerquelle zu 5,20 = Fl.Nr. 6, Vöslauer zu 4,50c.
Statistik für Testb
-7,626a
,000
Z
AsymptotischeSignifikanz (2-seitig)
Fl.Nr. 6,Vöslauer zu
4,50 - Fl.Nr. 1,Römerquelle
zu 5,20
Basiert auf positiven Rängen.a.
Wilcoxon-Testb.
STKS
Vorzeichen-Test ("sign test")
vereinfachte Variante des Wilcoxon-Test
vergleicht nur die Zahl der größer (+)-Fälle mit jener der kleiner (-)-Fälle. d. h. er nimmt keine Rücksicht darauf, wie groß der Unterschied ist --> deutlich schwächer als der Wilcoxon-Test
daher nur dann einzusetzen, wenn man Höhe der Unterschiede zwischen den Apn./Fällen nicht vergleichen kann
STKS
Zusammenfassung
abhängige Stichproben
Tests für 2 abhängige Stichproben: McNemar, wenn nominales DatenniveauWilcoxon, wenn ordinales DatenniveauVorzeichentest (fast nie)parametrischer Test: t-Test für abhängige Stichproben
top related