stks statistische tests in kleinen stichproben Übersicht über nichtparametrische verfahren und...

Statistische Tests in kleinen Stichproben

Übersicht über nichtparametrische Verfahren und Anpassungstests

Fahrplan 3. Einheit

Nichtparametrische Verfahren"Vokabel"Vor- und Nachteile nichtparametrischer VerfahrenÜberblick über die nichtparam. Verfahren

Anpassungstests (Einstichprobenfall)Ziele der AnpassungstestsBinomialtestChi-Quadrat-Test für eine StichprobeKolmogorov-Smirnov (KS)-Test

Nichtparametrische Verfahren: Wichtige "Vokabel"

"Teststärke" (Power, Macht, Trennsschärfe): Wahrscheinlichkeit, bei gegebenem Stichprobenumfang eine falsche H0 zu verwerfen = 1 - beta

"Stärkeeffizienz": Vergleich eines Tests X mit dem stärksten bekannten Test für die selbe Fragestellung ---> wieviel muß n bei Test X höher sein als beim stärksten bekannten Test, um die selbe Teststärke zu erreichen. Bsp.: Eine Stärkeeffizienz von 0,8 bedeutet, daß Test X 125 Apn. braucht, um die selbe Stärke wie der stärkste Test mit 100 Personen zu erreichen.

"Abhängige" vs. "unabhängige" Stichproben: "abhängig" z. B. bei Vorher-Nachhermessung oder "statistischen Zwillingen"

Vor- und Nachteile der nichtparametrischen Verfahren

auch bei nichtmetrischen Daten (nominal und ordinal) und kleinen Stichproben einsetzbar

bei metrischen Daten keine Annahmen über zugrundeliegende Verteilungen in der Grundgesamheit

geringere Teststärke als parametrische Verfahren

Aber ...

bei kleinen Stichproben (qual. Marktforschung) sind nicht Meßniveau oder Verteilungsannahmen, sondern die Frage der Repräsentativität der Stichprobe das größte Problem

parametrische Verfahren sind gegen Verletzungen der Verteilungsannahmen relativ robust

Nachteile in der Teststärke sind oft relativ gering

Nichtparametrische Verfahren

1 Stichprobe("Anpassungstests")

3 und mehr Stichproben

2 Stichproben

nominal ordinal

unabhängig abhängig unabhängig abhängig

BinomialtestChi-Quadrat- Test für 1 Stpr.

Chi-Quadrat- Test

KS-Test

MediantestMann-Whitney U-TestKS-Test

FriedmanChi-Quadrat-Test

McNemar VorzeichenWilcoxon

MedianKruskal- Wallis

Cochran Qnominal ordinal nominal ordinalnominal nominal ordinalordinal

2 Stichproben

nominal ordinal

Chi-Quadrat- Test

KS-Test

2 Stichproben

nominal ordinal

Chi-Quadrat- Test

KS-Test

Anpassungstests

testen, ob Stichprobe aus einer Grundgesamtheit mit einer bestimmten theoretischen Verteilung stammt (Normalverteilung, Gleichverteilung etc.)

Nullhypothese: Stichprobe stammt aus einer Grundgesamtheit mit dieser theoretischen Verteilung

gängige Testverfahren: Binomialtest, Chi-Quadrat-Test für eine Stichprobe, Kolmogorov-Smirnov (KS)-Test

Binomialtest

anwendbar, wenn nur zwei Kategorien, auch bei kleinen Fallzahlen

Berechnung:

Wahrscheinlichkeit, daß unter der Nullhypothese "P erwarteter Anteil der Fälle der ersten Kategorie und Q erwarteter Anteil der Fälle der zweiten Kategorie" bei N Versuchen x Mal die erste Kategorien gezogen wird

Beispiel: Wahrscheinlichkeit, daß unter der Nullhypothese "Erwarteter Anteil von Sechsern bei einem regelmäßigen Würfel: 1/6 (=P), andere Zahlen 5/6 (=Q)" bei 5 Würfen (=N) 2 (=x) Mal ein Sechser kommt.

xP Qx N x( )

Beispiel: Verteilung des Geschlechts der befragten Mineralwasserkäufer in der Stichprobe 1994

Bekannte Verteilung der Mineralwasserkäufer: 63% weiblich, 37% männlich

Verteilung in der Stichprobe: 59,4% Frauen, 40,6% Männer --> Ist die Stichprobe hinsichtlich des Geschlechts ein getreues Abbild der Grundgesamtheit aller Mineralwasserkäufer?

Eingabe in SPSS: erwarteter Anteil der ersten Kategorie (1=weiblich, 2=männlich --> Eingabe: 0,63)

Test auf Binomialverteilung

weiblich 107 ,59 ,63 ,181a,b

männlich 73 ,41

180 1,00

Gruppe 1

Gruppe 2

Gesamt

Geschlecht der APNKategorie N

BeobachteterAnteil Testanteil

Asymptotische Signifikanz

(1-seitig)

Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,63.a.

Basiert auf der Z-Approximation.b.

Nichtparametrische Tests

NPAR TEST

/BINOMIAL (.63)= geschl

/MISSING ANALYSIS.

( )O E

Chi-Quadrat-Test für eine Stichprobe

anwendbar beinominalem Datenniveau (zwei oder mehr Kategorien) und ausreichend großer Zahl erwarteter Fälle in jeder der Kategorien: bei 2 Kategorien kein E kleiner als 5, bei 3 und mehr Kategorien kein E kleiner als 1 und weniger als 20% der E s kleiner als 5

Testgröße:

Berechnung von Chi-Quadrat: Für jede Gruppe Differenz zwischen beobachteter Fallzahl (O i) und erwarteter Fallzahl (Ei) ermittelt, diese quadriert und dann durch die erwartete Fallzahl dividiert. Dann Aufsummierung über alle Gruppen.

Berechnung der erwarteten Häufigkeiten

Erwartete Häufigkeit:

E = Zeilensumme * Spaltensumme / N

Frauen Männer

Raucher 50

Nichtraucher 50

50 50 100

rauchende Frauen = 50 * 50 / 100 = 25

Berechnung der erwarteten Häufigkeiten

Erwartete Häufigkeit:

E = Zeilensumme * Spaltensumme / N

Frauen Männer

Raucher 50

Nichtraucher 50

50 50 100

Frauen Männer

Raucher 25 25 50

Nichtraucher 25 25 50

50 50 100

Beispiel: Anteile der Mineralwassermarken in der Stichprobe 1994

Bekannte Marktanteile in Wien 1994: Römerquelle 27%, Vöslauer 30%, Juvina 10%, Waldquelle 8%, Sonstige 25%

"Marktanteile" in der Stichprobe: RQ 26,7%, Vöslauer 29,4%, Juvina 10%, Waldquelle 8,3%, Sonstige 25,6% --> Ist die Stichprobe hinsichtlich Markenkauf ein getreues Abbild der Grundgesamtheit aller Mineralwasserkäufer?

Eingabe in SPSS: erwarteter Anteil für jede Marke

Nichtparametrische TestsChi-Quadrat-TestHäufigkeiten

48 48,6 -,6

53 54,0 -1,0

18 18,0 ,0

15 14,4 ,6

46 45,0 1,0

Römerquelle

Vöslauer

Juvina

Waldquelle

Sonstige

Gesamt

BeobachtetesN

ErwarteteAnzahl Residuum

Statistik für Test

Chi-Quadrata

Asymptotische Signifikanz

Bei 0 Zellen (,0%) werden weniger als5 Häufigkeiten erwartet. Die kleinsteerwartete Zellenhäufigkeit ist 14,4.

NPAR TEST

/CHISQUARE=kauf

/EXPECTED=0.27 0.3 0.1 0.08 0.25

/MISSING ANALYSIS.

KS-Testanwendbar, wenn

Meßniveau der Daten mindestens ordinalskaliert undzugrundeliegendes Merkmal stetig

kann auch bei kleinen Zellenbesetzungen eingesetzt werden

größere Teststärke als Chi-Quadrat-Test --> ist daher bei Erfüllung der Voraussetzungen diesem vorzuziehen

Testgröße:

Prüfgröße D: Maximale Differenz zwischen der unter H 0(in SPSS: Normalverteilung, Gleichverteilung, Poissonverteilung, Exponentialverteilung) erwarteten kumulierten Häufigkeitsverteilung (=F0(X)) und der in der Stichprobe beobachteten Verteilung (=S N(X)).

D F X S XN max ( ) ( )0

Modifikationen des KS-TestsKS-Test hat statistische und praktische Nachteile --> Korrekturen und Alternativtests:

unkorrigierter KS-Test: wenn Mittelwert und Standard- abweichung in der Grundgesamtheit bekannt. Bei Test auf Normalverteilung und n>100 allerdings auch hier zumindest zusätzlich alternativen Test durchführen: Wenn sowohl Schiefe +/- 1,96 * S.E. der Schiefe als auch Wölbung +/- 1,96 * S.E. der Wölbung die Zahl 0 miteinschließen, keine signifikante Abweichung von Normalverteilung.

KS-Test mit Lilliefors-Korrektur: wenn Mittelwert und Standardabweichung in der Grundgesamtheit nicht bekannt. Wenn n<50 stattdessen Shapiro-Wilkes. Achtung: beide Tests in SPSS nicht unter Menüpunkt "NPar", sondern unter "Summarize / Explore". Wahl zwischen KS/Lilliefors und SW nimmt SPSS automatisch vor. Bei n>100 und Test auf Normalverteilung: s. o.

Übersicht KS-Tests (Modifikationen)

KS Test

KS Testohne Korrektur

KS Testmit Korrektur

KS TestShapiro-Wilks

KS TestLilliefors

+ Ersatztest

(Schiefe/Wölbung)

Mittelwert und Verteilung bekannt

n < 50 50 < n <= 100 n > 100

ja nein

n > 100

+ Ersatztest

(Schiefe/Wölbung)

Übersicht KS-Tests (Modifikationen)

KS Test

KS Testohne Korrektur

KS Testmit Korrektur

KS TestShapiro-Wilks

KS TestLilliefors

+ Ersatztest

(Schiefe/Wölbung)

Mittelwert und Verteilung bekannt

n < 50 50 < n <= 100 n > 100

ja nein

n > 100

+ Ersatztest

(Schiefe/Wölbung)

Explorative Datenanalyse

Verarbeitete Fälle

180 100,0% 0 ,0% 180 100,0%QualitätseinschätzungRömerquelle

N Prozent N Prozent N Prozent

Gültig Fehlend Gesamt

Fälle

Univariate Statistiken

6,31 7,89E-02

-2,394 ,181

6,856 ,360

Mittelwert

Untergrenze

Obergrenze

95% Konfidenzintervalldes Mittelwerts

5% getrimmtes Mittel

Median

Varianz

Standardabweichung

Minimum

Maximum

Spannweite

Interquartilbereich

Schiefe

Kurtosis

QualitätseinschätzungRömerquelle

StatistikStandardf

Tests auf Normalverteilung

,287 180 ,000QualitätseinschätzungRömerquelle

Statistik df Signifikanz

Kolmogorov-Smirnova

Signifikanzkorrektur nach Lillieforsa.

Qualitätseinschätzung Römerquelle

7,06,05,04,03,02,01,0

Histogramm

Std.abw. = 1,06

Mittel = 6,3

N = 180,00

Q-Q-Diagramm von Qualitätseinschätzung Römerquelle

Beobachteter Wert

876543210

Trendbereinigtes Q-Q-Diagramm von Qualitätseinschätzung Römerquelle

Beobachteter Wert

876543210

Zusammenfassung

Wahl des konkreten nichtparam. Verfahrens: nach den 3 Kriterien

Zahl der Stichprobenabhängige vs. unabhängige StichprobenSkalenniveau

Anpassungstests: Stammt die Stichprobe aus einer Grundgesamtheit mit einer bestimmten theoretischen Verteilung? --> Binomialtest, Chi-Quadrattest für eine Stichprobe, KS-Test

Bei KS-Test Modifikationen beachten!

Statistische Tests in kleinen Stichproben

Tests für 2 abhängige Stichproben

Fahrplan 4. EinheitWas sind abhängige Stichproben?

McNemar-TestAnwendungsbedingungenTestverfahrenFallbeispiel und SPSS-Printout

Wilcoxon-TestAnwendungsbedingungenTestverfahrenFallbeispiel und SPSS-Printout

Vorzeichentest

Abhängige vs. unabhängige Stichprobenabhängige Stichproben: Elemente von zwei Stichproben können jeweils paarweise zugeordnet werden

Zweimal bei einer Person gemessen Vorher-Nachher-Messung (z. B. Einstellung zu Marke A vor und nach einem Werbespot) oder Vergleich zweier Antworten von einer Person (z. B. Einstellung zu Marke A verglichen mit Einstellung zu Marke B)

Auskunftspersonen jeweils paarweise zusammengefaßt

Inhaltliche Paarbildung (z. B. jeweils Ehemann und Ehefrau) oder "statistischer Zwilling" (z. B. 50jährige Hausfrau mit Matura aus Gruppe 1 wird 50jähriger Hausfrau mit Matura aus Gruppe 2 zugeordnet)

Der McNemar-Test

anzuwenden bei

zwei abhängigen Stichproben

nominalem Meßniveau (dichotom)

keine Annahme, daß das zugrundeliegende Merkmal stetig verteilt ist

Testprinzip des McNemar-Tests

vorher

nachher

Testgröße:

Beispiel: Zuordnung von "High-Tech" zu VOEST vor und nach einem Werbefilm

vor Film

neinja

nach Film

McNemar-Test

Kreuztabellen

VORFILM1

NACHFILM

Statistik für Testb

Exakte Signifikanz(2-seitig)

Verwendetete Binomialverteilung.a.

McNemar-Testb.

Der Wilcoxon-Testanwendbar bei

2 abhängigen Stichproben

ordinalem Datenniveau

Annahme, daß das zugrundeliegende Merkmal stetig verteilt ist

Testprinzip des Wilcoxon-TestsFür jede Apn. Ermittlung der Differenz der zwei Werte, diese Differenzbeträge ohne Berücksichtigung des Vorzeichens (d. h. nach ihrer absoluten Höhe) in eine Rangreihenfolge gebracht, dann getrennte Aufsummierung der positiven und negativen Rangplatzsummen, kleinerer Wert davon ist die Testgröße T

Verbundwerte ("ties"): Wenn bei einer Person keine Unterschiede zwischen den beiden Messungen, fällt sie aus der Analyse vollständig heraus

gleiche Differenzen: z. B. zwei Personen haben ex aequo zweitgrößte Differenz --> für beide Durchschnittsrang 2,5 dann weiter mit 4

Fallbeispiel: Rangreihung von Mineralwassermarken zu unterschiedlichen

Preisen (Wien 1994)

5 Marken zu je 4 verschiedenen Preisen = 20 Angebote --> diese von den Auskunftspersonen in eine Präferenzreihenfolge gebracht

Wird Römerquelle trotz eines Preises von öS 5,20 vor Vöslauer zu öS 4,50 gereiht?

Apn. Rangplatz

Römer-quelle zu öS 5,20

Rangplatz Vöslauer zu

öS 4,50

Differenz der beiden Rangplätze

Rangplatz der

Differenz (Vergleich der

Werte zwischen den Apn!)

Summe pos.

Vorzeichen

Summe negatives

Vorzeichen

1 17 11 6 9 (+) 9 (+) 2 16 12 4 6 (+) 6 (+) 3 15 12 3 3 (+) 3 (+) 4 17 12 5 8 (+) 8 (+) 5 14 11 3 3 (+) 3 (+) 6 7 6 1 1 (+) 1 (+) 7 4 12 -8 10 (-) 10 (-) 8 15 11 4 6 (+) 6 (+) 9 8 5 3 3 (+) 3 (+) 10 16 12 4 6 (+) 6 (+) Summe 45 10

Fallbeispiel Wilcoxon-Test

Berechnung (auf die ersten 10 Apn. beschränkt)

NPAR TEST

/WILCOXON=flnr1 WITH flnr6 (PAIRED)

/MISSING ANALYSIS.

Wilcoxon-Test

Ränge

148a 90,12 13337,50

31b 89,44 2772,50

Negative Ränge

Positive Ränge

Bindungen

Gesamt

Fl.Nr. 6, Vöslauer zu4,50 - Fl.Nr. 1,Römerquelle zu 5,20

N Mittlerer Rang Rangsumme

Fl.Nr. 6, Vöslauer zu 4,50 < Fl.Nr. 1, Römerquelle zu 5,20a.

Fl.Nr. 6, Vöslauer zu 4,50 > Fl.Nr. 1, Römerquelle zu 5,20b.

Fl.Nr. 1, Römerquelle zu 5,20 = Fl.Nr. 6, Vöslauer zu 4,50c.

Statistik für Testb

-7,626a

AsymptotischeSignifikanz (2-seitig)

Fl.Nr. 6,Vöslauer zu

4,50 - Fl.Nr. 1,Römerquelle

zu 5,20

Basiert auf positiven Rängen.a.

Wilcoxon-Testb.

Vorzeichen-Test ("sign test")

vereinfachte Variante des Wilcoxon-Test

vergleicht nur die Zahl der größer (+)-Fälle mit jener der kleiner (-)-Fälle. d. h. er nimmt keine Rücksicht darauf, wie groß der Unterschied ist --> deutlich schwächer als der Wilcoxon-Test

daher nur dann einzusetzen, wenn man Höhe der Unterschiede zwischen den Apn./Fällen nicht vergleichen kann

Zusammenfassung

abhängige Stichproben

Tests für 2 abhängige Stichproben: McNemar, wenn nominales DatenniveauWilcoxon, wenn ordinales DatenniveauVorzeichentest (fast nie)parametrischer Test: t-Test für abhängige Stichproben

stks statistische tests in kleinen stichproben Übersicht über nichtparametrische verfahren und...

Documents

stks handbook

______________________________________________________...

permensos no. 08 tahun 2013 tentang otk stks bandung

stks il 2015_h

stks open source & freeware

stks statistische tests in kleinen stichproben tests für 2...

deskriptive statistik 2 2.1 darstellung univariater...

2009 stks-annual-report

sportwissenschaftliche forschungsmethoden ss 2008 2. design...

3 nichtparametrische dichteschätzung · 3...

a miscarriage of revolution: cameroonian women - stichproben

soal tes akademik pmb stks 2014.2015 2

biostatistik, ws 2015/2016 - staff.uni-mainz.de · t-test...

schließende statistik - med uni...

kapitel 8: verfahren für rangdaten · der wilcoxon-test...

stks brochure

tests auf standardabweichungen (bei zwei oder mehr ... ·...

biostatistik, sommer 2017 - nichtparametrische statistik...

gaussfilter / kalmanfilter / nichtparametrische filter

20100825 stks vaja