les tests statistiques en pratique : comparaison de … › c4x › upsud › 42001s02 › asset ›...
TRANSCRIPT
Pr. Bruno Falissard
Les tests statistiques en pratique :comparaison de deux moyennes
Introduction à la statistique avec R
Chapitre 11
Pr. Bruno Falissard
Introduction à la statistique avec R > Comparaison de 2 moyennes
Le test t de Student
• Comparer deux moyennes avec un test t de
Student
Pr. Bruno Falissard
Introduction à la statistique avec R > Comparaison de 2 moyennes
Le test t de Student
• Comparer deux moyennes avec un test t de
Student
• Conditions de validité :
– n > 30 ou distribution normale, en fait ces deux
conditions sont à considérer ensemble
– Variances égales (sinon approximation de Welch)
Pr. Bruno Falissard
Introduction à la statistique avec R > Comparaison de 2 moyennes
Le test t de Student
Existe-t-il, en moyenne, une différence
significative d’âge entre les détenus ayant un
haut niveau d’évitement du danger et les
autres ?
Pr. Bruno Falissard
Test t de Student : normalité de la variable
age
Fre
qu
en
cy
20 30 40 50 60 70 80
02
04
06
08
01
00
12
0
Introduction à la statistique avec R > Comparaison de 2 moyennes
> hist(smp.c$age)
Pr. Bruno Falissard
Test t de Student : normalité de la variable
Introduction à la statistique avec R > Comparaison de 2 moyennes
• L’inspection visuelle de l’histogramme est
informative, mais pas très rigoureuse
Pr. Bruno Falissard
Test t de Student : normalité de la variable
Introduction à la statistique avec R > Comparaison de 2 moyennes
• L’inspection visuelle de l’histogramme est
informative, mais pas très rigoureuse
• Tester la normalité de la variable ?
– Ces tests existent
– Mais ils ne répondent pas à la question !
– Les tests de normalité sont fait pour affirmer qu’une
distribution n’est pas normale, et pas le contraire…
Pr. Bruno Falissard
Test t de Student : normalité de la variable
-3 -2 -1 0 1 2 3
20
30
40
50
60
70
80
Normal Q-Q Plot
Theoretical Quantiles
Sa
mp
le Q
ua
ntile
s
> qqnorm(smp.c$age); qqline(smp.c$age)
Introduction à la statistique avec R > Comparaison de 2 moyennes
Pr. Bruno Falissard
Test t de Student : égalité des variances
Introduction à la statistique avec R > Comparaison de 2 moyennes
> by(smp.c$age, smp.c$ed.b, sd, na.rm=TRUE)
smp.c$ed.b: 0
[1] 13.38593
-------------------------------------------
smp.c$ed.b: 1
[1] 13.29636
Pr. Bruno Falissard
Test t de Student
Introduction à la statistique avec R > Comparaison de 2 moyennes
> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)
Two Sample t-test
data: smp.c$age by smp.c$ed.b
t = 1.7142, df = 690, p-value = 0.08694
alternative hypothesis: true difference in means is not equal
to 0
95 percent confidence interval:
-0.2710524 4.0005138
sample estimates:
mean in group 0 mean in group 1
39.46383 37.59910
Pr. Bruno Falissard
Test t de Student
Introduction à la statistique avec R > Comparaison de 2 moyennes
> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)
Two Sample t-test
data: smp.c$age by smp.c$ed.b
t = 1.7142, df = 690, p-value = 0.08694
alternative hypothesis: true difference in means is not equal
to 0
95 percent confidence interval:
-0.2710524 4.0005138
sample estimates:
mean in group 0 mean in group 1
39.46383 37.59910
Pr. Bruno Falissard
Test t de Student
Introduction à la statistique avec R > Comparaison de 2 moyennes
> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)
Two Sample t-test
data: smp.c$age by smp.c$ed.b
t = 1.7142, df = 690, p-value = 0.08694
alternative hypothesis: true difference in means is not equal
to 0
95 percent confidence interval:
-0.2710524 4.0005138
sample estimates:
mean in group 0 mean in group 1
39.46383 37.59910
Pr. Bruno Falissard
Le test de Mann-Whitney (Wilcoxon)
Introduction à la statistique avec R > Comparaison de 2 moyennes
> wilcox.test(smp.c$age~smp.c$ed.b)
Wilcoxon rank sum test with continuity correction
data: smp.c$age by smp.c$ed.b
W = 56769.5, p-value = 0.06091
alternative hypothesis: true location shift is not equal to 0
Pr. Bruno Falissard
Conclusion
qqnorm(smp.c$age); qqline(smp.c$age)
by(smp.c$age, smp.c$ed.b, sd, na.rm=TRUE)
t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)
wilcox.test(smp.c$age~smp.c$ed.b)
Introduction à la statistique avec R > Comparaison de 2 moyennes