p-test - fernuni-hagen.de · werden. applet exakter test auf p (b59.jar) nach diesem exakten test...

27
P-Test Motivation: Einsatz des Tests auf p im Krankenhausmanagement Theorie zum Test auf p Test A: Beispiel zur Erfolgsmessung von Therapien Test B: Beispiel zur Überwachung des Patientenanteils mit zu hohem Blutdruck Test C: Beispiel zur Überprüfung der Euromünze Übungen zum p-Test Motivation: Durchführung des Tests auf p beim Einsatz im Krankenhausmanagement Animation zum Test auf p Motivation: Einsatz des Tests auf p im Krankenhausmanagement In einer Klinik fallen täglich große Mengen an verschmutztem Geschirr an. Der für diesen Bereich zuständige Qualitätsbeauftragte der Klinik möchte wissen, ob das in der Klinik installierte Reinigungssystem optimal arbeitet. Nach Befragung von Fachleuten stellt er fest, dass ein solches System unter optimalen Bedingungen mit einer Ausschussquote von 3% bei der Geschirreinigung arbeitet. Er möchte nun das in seiner Klinik vorhandene System untersuchen und eventuell vorhandene Mängel aufdecken. Hierzu lässt er bei einer Stichprobe von 1000 gereinigten Gegenständen eine Sichtprüfung vornehmen. Es stellt sich heraus, das bei 35 gereinigten Gegenständen Beanstandungen auftraten. Für den Qualitätsbeauftragten stellt sich nun die Frage, ob dieses Ergebnis Anlass zu Verbesserungsmaßnahmen gibt, oder ob die gefundenen Beanstandungen zufallsbedingt sind. Theorie zum Test auf p Wie das Schätzen eines Anteilswertes p ) so gibt es auch für einen Test auf p eine Fülle von Anwendungen. Ein Beispiel haben wir oben im Fall des Krankenhausmanagements mit dem Test auf eine Ausschussquote von (höchstens) p=0.03 kennen gelernt. Weitere Beispiele sind: -Test auf den Anteil p abgegebener Stimmen für eine bestimmte Partei -Test auf den Anteil p von Patienten mit einer erfolgreichen Therapie -Test auf den Anteil p von Mädchengeburten in einem bestimmten Land -Test auf den Anteil p von Rauchern unter den Studierenden. Siehe dazu auch die Beispiele 5,6 und 7 aus dem Abschnitt . (c) Projekt Neue Statistik 2003 - Lernmodul: P-Test Page 1

Upload: vokiet

Post on 16-Aug-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

P-Test

Motivation: Einsatz des Tests auf p im KrankenhausmanagementTheorie zum Test auf p

Test A: Beispiel zur Erfolgsmessung von TherapienTest B: Beispiel zur Überwachung des Patientenanteils mit zu hohem Blutdruck

Test C: Beispiel zur Überprüfung der EuromünzeÜbungen zum p-Test

Motivation: Durchführung des Tests auf p beim Einsatz im KrankenhausmanagementAnimation zum Test auf p

Motivation: Einsatz des Tests auf p im Krankenhausmanagement

In einer Klinik fallen täglich große Mengen an verschmutztem Geschirr an. Der fürdiesen Bereich zuständige Qualitätsbeauftragte der Klinik möchte wissen, ob das in derKlinik installierte Reinigungssystem optimal arbeitet. Nach Befragung von Fachleutenstellt er fest, dass ein solches System unter optimalen Bedingungen mit einerAusschussquote von 3% bei der Geschirreinigung arbeitet. Er möchte nun das in seinerKlinik vorhandene System untersuchen und eventuell vorhandene Mängel aufdecken.Hierzu lässt er bei einer Stichprobe von 1000 gereinigten Gegenständen eineSichtprüfung vornehmen. Es stellt sich heraus, das bei 35 gereinigten GegenständenBeanstandungen auftraten. Für den Qualitätsbeauftragten stellt sich nun die Frage, obdieses Ergebnis Anlass zu Verbesserungsmaßnahmen gibt, oder ob die gefundenenBeanstandungen zufallsbedingt sind.

Theorie zum Test auf p

Wie das Schätzen eines Anteilswertes p ) so gibt es auch für einen Test auf p eine Füllevon Anwendungen. Ein Beispiel haben wir oben im Fall des Krankenhausmanagementsmit dem Test auf eine Ausschussquote von (höchstens) p=0.03 kennen gelernt.Weitere Beispiele sind:

-Test auf den Anteil p abgegebener Stimmen für eine bestimmte Partei-Test auf den Anteil p von Patienten mit einer erfolgreichen Therapie-Test auf den Anteil p von Mädchengeburten in einem bestimmten Land-Test auf den Anteil p von Rauchern unter den Studierenden.Siehe dazu auch die Beispiele 5,6 und 7 aus dem Abschnitt .

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 1

Annahmen

Dem Test auf einen Anteilswert p liegt das folgende so genannte Bernoulli-Experimentmit zwei möglichen Ereignissen zu Grunde, dem Ereignis und dem

Komplementärereignis ; die unbekannten Eintrittswahrscheinlichkeiten seien mit

bzw. bezeichnet. Um das statistische Testproblem zu

formalisieren, führen wir folgende Bezeichnungen ein: Es seien

Bernoulli-Variablen mit d.h.

und

Hypothesen

Die im obigen und in den noch folgenden Beispielen betrachteten Testprobleme könnenallgemein mit einem in der konkreten Anwendung noch zu spezifizierenden Anteilswert

wie folgt formuliert werden:

Test Hypothesen

Test Agegen .

Test Bgegen .

Test Cgegen .

Exakte Tests

Prüfgröße

Als Prüfgröße (Teststatistik) für die obigen Hypothesenprobleme wählen wir die

Summe der Bernoulli-Variablen: .

Da keinen Beitrag zur Summe liefert, gibt also die Anzahl der "Zahl 1"

unter den Beobachtungen und damit die absolute Häufigkeit des Auftretens von

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 2

, d.h. die relative Häufigkeit des Auftretens von wählen.

Wir entscheiden uns für die Prüfgröße , weil eine uns schon bekannte

Verteilung, nämlich die Binomialverteilung mit den Parametern und hat, denn

wir wissen, das eine Summe Bernoulli-verteilter Zufallsvariablen binomialverteilt ist.Die Wahrscheinlichkeitsfunktion für lautet also:

Unter den Nullhypothesen in

Test A, Bund C ist dann binomialverteilt (s.

Applet Binomialverteilung (ace.jar)) mit Parametern und .

Testentscheidung

Als Entscheidungsregeln für die obigen drei Testprobleme ergeben sich damit:

Test Testentscheidung

Test Aablehnen, falls

Test Bablehnen, falls

Test C

ablehnen, falls oder

Die kritischen Werte (Quantile) werden durch

Eingabe von und am Rechner bestimmt. Dabei wird deutlich, dass eine

diskrete Prüfgröße ist und somit das Testniveau i.d.R. nicht exakt eingehalten wird.

Statt der Bestimmung eines kritischen Wertes kann auch der -Wert nach Berechnung

des Wertes der Prüfgröße angegeben werden. Das heißt z.B. für Test A, falls

beobachtet wurde: .

Für den Fall können in dem folgenden Applet für verschiedene

Stichprobengrößen in einem Zufallsexperiment die kritischen Werte veranschaulicht

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 3

werden.Applet exakter Test auf p (b59.jar)

Nach diesem exakten Test auf p soll nun der approximative Test auf p behandeltwerden. Dazu wird daran erinnert, dass für die binomialverteilte Prüfgröße gilt:

und . Das kann noch einmal über die Summe

Bernoulli-verteilter Variablen verdeutlicht werden.

Prüfgröße

Dann ist für beliebiges die Prüfgröße approximativ

-verteilt d.h. unter ist approximativ

-verteilt.

Hinweis:Die Güte der Approximation hängt von und ab. Faustregel:

und . Beispiel: . Sie kann mit

dem folgenden Applet veranschaulicht werden.Applet Normalverteilungs-Approximation (bbc.jar)

Testentscheidung

Das bedeutet für die Entscheidungsregeln bei den drei Testproblemen, zum einenformuliert über die standardisierte Prüfgröße Z und zum anderen über die Prüfgröße T;für die Tests B und C dann analog:

Test Testentscheidung

Test A:

ablehnen, falls oder

Test B:ablehnen, falls

Test C:

ablehnen, falls oder

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 4

Die kritischen Werte und können der Tabelle der

Standardnormal-verteilung entnommen werden.Statt über die diskrete Binomialverteilung von werden hier also die kritischen Werte

approximativ über die stetige Standardnormalverteilung von bestimmt.

Das folgende Applet kann am Beispiel eines fairen Münzwerf die Funktion des Testsverdeutlichen.Applet approximativer Test auf p (c2e.jar)

Test A: Beispiel zur Erfolgsmessung von Therapien

Im Folgenden wird der Test A an einem Beispiel erläutert.

Beispiel: Test A: Beispiel zur Erfolgsmessung von Therapien

MedikamentQuelle: Microsoft

Hier wird ein Beispiel aufgegriffen, in dem der Anteil von Patienten mit einererfolgreichen Therapie zu testen ist. So könnte die Hypothese eines Krankenhauseslauten, dass die Wahrscheinlichkeit für den Erfolg einer bestimmten Therapie(Operation, Medikament) mindestens 90% beträgt, d.h. zu testen ist

gegen .

Es stellte sich heraus, dass bei 86 Patienten unter zufällig ausgewählten

Patienten die Therapie erfolgreich war. Ist dieser Beobachtungsbefund mit derNullhypothese verträglich?

Hypothesen

Wir wollen nun zunächst den Test auf den Parameter mit den im obigen Beispiel

angegebenen einseitigen Hypothesen beschreiben:

Test A

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 5

gegen

Im obigen Beispiel ist .

Prüfgröße

Als Prüfgröße (Teststatistik) für das obige Hypothesenproblem wählen wir die

Summe der Bernoulli-Variablen: . Da keinen Beitrag zur

Summe liefert, gibt also die Anzahl der "Zahl 1" unter den Beobachtungen und

damit die absolute Häufigkeit des Auftretens von an. Da unter der

Nullhypothese binomialverteilt mit Parametern und ist, lautet die

Wahrscheinlichkeitsfunktion für :

Im obigen Beispiel gibt

die Anzahl der Patienten unter den ausgewählten Patienten an, bei

denen die Therapie erfolgreich war.

Testentscheidung (exakter Test)

Die Testentscheidung lautet:

Test A

ablehnen, falls

Es ist unmittelbar einleuchtend, dass man an der Nullhypothese festhielte, wenn alle100 Patienten oder auch 90 der 100 Patenten erfolgreich behandelt wurden. Dann ist derAnteil der Patienten mit einer erfolgreichen Therapie 100% bzw. 90%. Was ist jedochwenn- wie im Beispiel 1- nur 86 erfolgreich behandelt wurden oder wenn es nur 80 odergar nur 75 Patienten gewesen wären? Sind solche Beobachtungsbefunde noch mit derHypothese verträglich?

Hierzu betrachten wir zunächst die Wahrscheinlichkeitsfunktion.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 6

WahrscheinlichkeitsfunktionQuelle: eigene Gestaltung

Sie zeigt, dass für Werte von 75 oder 80 nur sehr kleine Auftretenswahrscheinlichkeitenexistieren. Um eine genaue Aussage über einen kritischen Wert von zu machen,

betrachten wir die aufsummierten Wahrscheinlichkeiten.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 7

VerteilungsfunktionQuelle: eigene Gestaltung

Für ergibt sich und damit eine

Irrtumswahrscheinlichkeit von 4% und für ist und

damit die Irrtumswahrscheinlichkeit 7%. Da unsere Irrtumswahrscheinlichkeit 5% nichtüberschreiten soll, wird 84 als kritischer Wert gewählt. Somit kann die Nullhypothesenicht abgelehnt werden. Damit wird allerdings unterschritten.

Exkurs: Testentscheidung (approximativer Test)

Die Testentscheidung im Falle des approximativen Tests lautet:

Test A

ablehnen, falls

Für ergibt sich für das Beispiel . Da dieser

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 8

Wert größer als ist, wird die Nullhypothese beibehalten.

Für die Werbung betreibende Industrie ist die Fernsehquote ein entscheidendesKriterium der Preisgestaltung. Für eine große Krimiserie wird von der Sendeanstaltbehauptet, dass ihre Einschaltquote bei mindestens 25% liegt. Eine Beobachtung von1000 Zuschauern zeigt, dass die letzte ausgestrahlte Sendung nur von 210 Zuschauerngesehen wurde. Ist es aufgrund dieses Ergebnisses für die Werbung betreibendeIndustrie sinnvoll, neue Preisverhandlungen zu führen?

Test B: Beispiel zur Überwachung des Patientenanteils mit zu hohem Blutdruck

Im folgenden wird der Test B mit einem Beispiel erläutert.

Beispiel: Test B: Beispiel zur Überwachung des Patientenanteils mit zu hohem

Blutdruck

MessgerätQuelle: Microsoft

Der Anteil von Patienten in einem Krankenhaus, die an zu hohem Blutdruck leiden(Ereignis ), ist höchstens 20 %, d.h. zu testen ist

gegen .

Hypothesen

Wir wollen nun zunächst einen Test auf den Parameter mit den im obigen Beispiel

angegebenen einseitigen Hypothesen beschreiben:

Test B

gegen .

Im obigen Beispiel ist .

Prüfgröße

Die Teststatistik hat eine Binomialverteilung mit den Parametern und , denn

wir wissen, das eine Summe Bernoulli-verteilter Zufallsvariablen binomialverteilt ist.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 9

. Die Wahrscheinlichkeitsfunktion für lautet also:

Im obigen Beispiel wurde unter zufällig ausgewählten Patienten bei 17

Patienten ein zu hoher Blutdruck diagnostiziert. Somit gilt .

Testentscheidung (exakter Test)

Die Testentscheidung lautet:

Test B

ablehnen, falls

Ist der obige Beobachtungsbefund mit der Nullhypothese verträglich?Hierzu betrachten wir zunächst die Wahrscheinlichkeitsfunktion. Es zeigt sich, dass für

und kleine Wahrscheinlichkeitswerte vorliegen.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 10

WahrscheinlichkeitsfunktionQuelle: eigene Gestaltung

Da uns aber die Wahrscheinlichkeit interessiert, schauen wir uns die

aufsummierten Wahrscheinlichkeiten an.

VerteilungsfunktionQuelle: eigene Gestaltung

Für ergibt sich und für ist

. Da die Nullhypothese bei einer Irrtumswahrscheinlichkeit

von abgelehnt werden soll, wählen wir als kritischen Wert

können die Nullhypothese ablehnen.

Exkurs: Testentscheidung (approximativer Test)Die Testentscheidung im Falle des approximativen Tests lautet:

Test B

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 11

Im Blutdruckbeispiel ist Da dieser Wert größer

ist als , wird die Nullhypothese abgelehnt.

In einer Stichprobe bei 50 Studenten der Wirtschaftswissenschaft zeigt sich, dass 15Studenten die Abschlussnoten 1 oder 2 erreicht hatten. Für die gesamte Universität lagdieser Anteil bei 25%. Kann behauptet werden, dass Studenten derWirtschaftswissenschaft bessere Noten erlangen?

Test C: Beispiel zur Überprüfung der Euromünze

Im Folgenden wird der Test C mit einem Beispiel erklärt.

Beispiel: Test C: Beispiel zur Überprüfung der Euromünze

MünzwurfQuelle: Microsoft

Eine 2-Euro-Münze werde mal geworfen. Wir wollen testen, ob die Münze

fair in dem Sinne ist, dass die Wahrscheinlichkeit für das Auftreten von Kopf (Ereignis) gleich der Wahrscheinlichkeit für das Auftreten von Zahl ( ) ist, d.h. zu testen ist

:gegen .

Bei Würfen trat 61mal "Kopf” auf. Ist dieser Beobachtungsbefund mit der

Nullhypothese verträglich?

Prüfgröße

Als Prüfgröße für das obige Hypothesenproblem wählen wir die Summe der

Bernoulli-Variablen: . Da keinen Beitrag zur Summe liefert,

gibt also die Anzahl der "Zahl 1" unter den Beobachtungen und damit die

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 12

an.

Im obigen Beispiel gibt die Anzahl der Ereignisse "Kopf" unter den

durchgeführten Würfen an.

Hypothesen

Wir wollen nun zunächst einen Test auf den Parameter mit den im obigen Beispiel

angegebenen zweiseitigen Hypothesen beschreiben:

Test C

gegen .

Im Beispiel ist .

Testentscheidung (exakter Test)

Die Testentscheidung lautet:

Test C

ablehnen, falls oder .

Unter der Nullhypothese wäre bei n=100 Münzwürfen mal "Kopf”

zu erwarten, d.h. es sprechen zu kleine Werte oder zu große Werte von gegen die

Nullhypothese. Es stellt sich also die Frage, ab welchen (zu kleinen oder zu großen)Werten von die Nullhypothese bei einer Irrtumswahrscheinlichkeit von

abgelehnt werden muss. Hier wird nun die Hälfte der

Irrtumswahrscheinlichkeit auf beide Ränder verteilt, d.h. für den unteren

kritischen Wert und für den oberen kritischen Wert. Um die Entscheidung zu

treffen, ist es nötig die kritischen Werte zu bestimmen. Hierzu betrachten wir zuerst dieWahrscheinlichkeitsfunktion.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 13

WahrscheinlichkeitsfunktionQuelle: eigene Gestaltung

Für die Testentscheidung benötigen wir die kumulierten Wahrscheinlichkeiten.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 14

VerteilungsfunktionQuelle: eigene Gestaltung

Bei der Ermittlung des oberen kritischen Wertes ergibt sich für der Wert

, d.h. mit einer Wahrscheinlichkeit von finden

sich Werte von T, die gleich 61 oder größer sind. Für ergibt sich der Wert

. Somit sind mit einer Wahrscheinlichkeit von

Werte von T größer oder gleich 60. Da wir den Wert für suchen, für den

ist, müssen wir als kritischen Wert wählen.

Bei der Bestimmung des unteren kritischen Wertes ergibt sich für k=40 der Wertund für k=39 der Wert . Da wir den

Wert für suchen, für den ist, setzen wir als kritischen Wert

k=39 fest.

Wir schöpfen mit diesen kritischen Werten 39 und 61 allerdings das -Fehlerniveau

nicht voll aus.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 15

Da in unserem Experiment 61mal "Kopf” aufgetreten ist, lehnen wir die Nullhypothese(gerade noch) ab.

Exkurs: Testentscheidung (approximativer Test)

Die Testentscheidung im Falle des approximativen Tests lautet:

Test C

ablehnen, falls oder .

Im Münzwurfbeispiel ergibt sich . Da dieser

Wert größer ist als , wird die Nullhypothese abgelehnt.

Ein Produzent von Verpackungsmaschinen behauptet, dass der Anteil p vonAusschusstücken (zu große oder zu kleine verpackte Menge) höchstens 4% beträgt.Eine Stichprobe von n=500 überprüften Mengen ergab 30 falsche Füllungen. Ist demHersteller noch zu trauen?

Um einen Vergleich zwischen beiden Tests darzustellen, werden zuerst für das BeispielTest B die Wahrscheinlichkeiten exakt über die Binomialverteilung und

approximativ über die Normalverteilung für n=20 dargestellt.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 16

Vergleich exakt/approximativQuelle: eigene Gestaltung

Es zeigt sich, dass die Werte der approximativen Verteilung teilweise erheblich unterden exakten Werten liegen. Bei einer Erhöhung von auf zeigt sich,

dass die approximativen Werte die exakten Werte geringer unterschätzen.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 17

Vergleich exakt/approximativQuelle: eigene Gestaltung

Jetzt wird variiert. Wir verlassen das Beispiel und nehmen an. Unter

diesen Bedingungen arbeitet die Approximation besser, weil dann T wie Z symmetrischverteilt ist.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 18

Vergleich exakt/approximativQuelle: eigene Gestaltung

Als weitere Parametervariation wird der Stichprobenumfang erhöht. Bei

zeigt sich, dass die Werte der approximativen Verteilung sehr nah an den Werte derexakten Verteilung liegen.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 19

Vergleich exakt/approximativQuelle: eigene Gestaltung

Übungen zum p-Test

Im Folgenden werden Übungen und Lösungen zum Test auf p gezeigt

Die Aufgaben 1 bis 6 sind Multiple Aufgaben.

Aufgabe1:

Es seien Bernoulli-Variablen mit und

, i=1,...,n.

Dann ist:(a) Bernoulli-verteilt mit Parametern und

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 20

(b) Bernoulli-verteilt

(c) binomialverteilt mit Parametern und

(d) binomialverteilt mit Parametern und .

Lösungen ( : f46.doc )

Aufgabe 2:

Für eine binomialverteilte Zufallsvariable X mit Parametern und gilt:

(a)

(b)

(c) ,

(d) .

Lösungen ( : f69.doc )

Aufgabe 3:

Es sei , dann ist der kritische Wert der

Prüfgröße :

(a)

(b)

(c)

(d) .

Lösungen ( : f8c.doc )

Aufgabe 4:

Beim Test auf gegen führen zur Ablehnung von

(a) zu große Werte der Prüfgröße

(b) zu kleine Werte der Prüfgröße

(c) zu kleine und zu große Werte der Prüfgröße

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 21

.

Lösungen ( : faf.doc )

Aufgabe 5:

Bei einem festen Stichprobenumfang sei zu testen: gegen

. Dann werden mit wachsendem

(a) die kritischen Werte und kleiner

(b) die kritischen Werte und größer

(c) der kritische Wert größer und der kritische Wert kleiner

(d) der kritische Wert kleiner und der kritische Wert größer.

Lösungen ( : fe6.doc )

Aufgabe 6:

Die Güte der Approximation der Binomialverteilung mit Parametern und durch

die Normalverteilung steigt

(a) mit wachsendem bei festem

(b) mit wachsendem bei wachsendem

(c) mit wachsendem bei festem

(d) ist unabhängig von und .

Lösungen ( : I1015.doc )

Aufgabe 7:

Ein Dozent der Statistik behauptet, dass die Durchfallquote bei seinenStatistik-Klausuren generell höchstens 20% beträgt. An einer Klausur im SS 2002nahmen 120 Studierende teil, von denen 30 die Klausur nicht bestanden.(a) Testen Sie gegen , und zwar

(i) exakt über die Binomialverteilung(ii) approximativ über die Normalverteilung ( )

(b) Vergleichen Sie die kritischen Werte in (i) und (ii).(c) Führen Sie die Tests in (i) und (ii) auch für und durch.

Lösungen ( : I1030.doc )

Aufgabe 8:

Ein Student der Statistik hält den Dozenten in Aufgabe 7 für einen "harten" Prüfer und

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 22

behauptet daher, dass die Durchfallquote bei besagtem Dozenten generell mindestens30% beträgt. An der Klausur im SS 2002 nahmen - wie in Aufgabe 7 angegeben- 120Studierende teil, von denen 30 die Klausur nicht bestanden.(a) Testen Sie gegen , und zwar

(i) exakt über die Binomialverteilung(ii) approximativ über die Normalverteilung ( )

(b) Vergleichen Sie die kritischen Werte in (i) und (ii).(c) Führen Sie die Tests in (i) und (ii) auch für und durch.

Lösungen ( : I104b.doc )

Aufgabe 9:

Ein Würfel wird n=10 mal geworfen. Dabei ergab sich mal eine gerade Zahl

und mal eine ungerade Zahl.

Es soll untersucht werden , ob der Würfel "fair" im Sinne gleicher Wahrscheinlichkeitenfür "gerade Zahl" und "ungerade Zahl" ist.

(a) Wie lautet das Hypothesen-Problem?(b) Führen Sie den Test für obige Daten durch, und zwar(i) exakt über die Binomialverteilung und(ii) approximativ über die Normalverteilung (

(c)Der Würfel werde nun n=100 mal mit den Ergebnissen und

sowie n=1000 mal geworfen mit den Ergebnissen und

.

Führen Sie die Tests für obige Daten durch, und zwar wieder(i) exakt über die Binomialverteilung und(ii) approximativ über die Normalverteilung ( )

(d) Führen Sie die Tests in (b) und (c) auch für und durch.

Lösungen ( : I107a.doc )

Laboraufgabe:

Labordatei öffnen ( I107f.zmpf )

Motivation: Durchführung des Tests auf p beim Einsatz im

Krankenhausmanagement

Überprüfung der Leistung einer Geschirrspülanlage

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 23

gegen getestet werden. Der Qualitätsbeauftragte

möchte durch den Test wissen, ob die festgestellte Anzahl von 35 Beanstandungen unterden 1000 Sichtprüfungen gegen seine Hypothese spricht. Diese

Entscheidung möchte er mit einer Irrtumswahrscheinlichkeit von 5% treffen.

Würde die maximale Quote von 0.03 unter der Nullhypothese auch in der

Stichprobe gelten, würden wir höchstens 30 Beanstandungen erwarten. Es befinden sichin der Stichprobe jedoch 35 Fälle von mangelhaft gereinigtem Geschirr.

AnzahlQuelle: eigene Gestaltung

Der Qualitätsbeauftragte muss nun herausfinden, ob die 35 Mängel in der StichprobeAnlass dazu geben, Gegenmaßnahmen einzuleiten oder die 35 unzureichendenSpülergebnisse noch mit der Hypothese verträglich sind.

Hierzu führt er den Einstichprobentest auf durch. Um den Test anzuwenden,

benötigt man die Parameter und , wobei der Umfang der Stichprobe, in

unserem Fall gleich 1000 ist. Die zu kontrollierende Ausschussquote ist maximal auffestgelegt.

Werden die Größen und in die Formel für die Verteilungsfunktion einer

binomialverteilten Zufallsgröße eingesetzt, kann der kritische Wert für diese

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 24

Testentscheidung ermittelt werden. Für das Entscheidungs- oder Testproblem war eineIrrtumswahrscheinlichkeit von gefordert. Nach der Entscheidungsregel:

mit ,

muss also der Wert gesucht werden. Da es sich bei der Binomialverteilung um

keine stetige Verteilung handelt, kann der kritische Wert nur näherungsweise bestimmtwerden. Für ergibt sich

und somit , d.h. eine deutlich größere

Wahrscheinlichkeit als die geforderten 5%, falls gewählt wird.

Beim nächstgrößeren Wert für

ergibt sich

,

und somit ist , d.h. für erhalten wir eine kleinere

Wahrscheinlichkeit als die geforderten 5%.Um dieses Vorgehen nochmals zu verdeutlichen, sind im Folgenden die zu jedem

passenden Wahrscheinlichkeiten dargestellt. Daraus ergeben sich die

Wahrscheinlichkeiten für , da gilt: . Hier

zeigt sich wieder, dass das gesuchte zwischen 39 und 40 liegen muss. Da aber T

nur ganze Zahlen annehmen kann, wird k=40 als kritischer Wert gewählt.

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 25

VerteilungsfunktionQuelle: eigene Gestaltung

Ein Vergleich mit der Stichprobe zeigt hier, dass die Anzahl der Beanstandungen in derStichprobe mit kleiner ist als der kritische Wert. Für ergibt sich

und damit .

Die Nullhypothese wird daher beibehalten, es besteht kein Grund zu einem

Eingriff.

Der Test kann auch über die Normalverteilungsapproximation durchgeführt werden.Wird die oben genannte Entscheidungsregel zugrunde gelegt, abzulehnen, falls

ist, muss zuerst ermittelt werden. Hierzu werden in die obige Formel

die Werte für und eingesetzt. Damit ergibt sich

Der kritische Wert bezieht sich

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 26

auf die Standardnormalverteilung und beträgt 1.645. Auch hier zeigt ein Vergleichzwischen kritischem Wert (1.645) und Stichprobenwert (0.927), dass die Nullhypothesebeibehalten wird.

Animation zum Test auf p

In der folgenden Animation wird die Durchführung des Test auf p in einer Animationdemonstriert.

: Flashanimation ' Animation Test auf p ' siehe Online-Version

Bernoulli-VariablenErklärungBinomialverteilungErklärungTest auf pErklärung

(c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale SystemeKontakt: http://www.neuestatistik.de

(c) Projekt Neue Statistik 2003 - Lernmodul: P-Test

Page 27