test du 2 : test d'indépendance et test d'homogénéité...
TRANSCRIPT
Principe Adequation Independance Cas part.
Test du χ2 :test d’independance et test d’homogeneite
PCEM2 — Biostatistique
Pr. Nicolas MEYER
———————Laboratoire de Biostatistique et Informatique Medicale
Fac. de Medecine de Strasbourg———————
Fevrier 2011
Principe Adequation Independance Cas part.
Site internet du LBIM
http ://udsmed.u-strasbg.fr/labiostat/spip.php ?article2
Principe Adequation Independance Cas part.
Plan
1 Principe du test
2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique
3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales
4 Cas particuliersCas des series apparieesCas des petits effectifs
Principe Adequation Independance Cas part.
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independance
4 Cas particuliers
Principe Adequation Independance Cas part.
Contexte
Cours precedent : comparaison de deux proportions
peut se formaliser differement
comme la comparaison de la repartition de deux distributionsbinomiales
peut s’etendre a plus de deux proportions : comparaisons detrois proportions de succes
peut s’etendre a la comparaisons de distributionsmultinomiales : au moins deux groupes ayant au moins deuxmodalites pour chaque variable : comparaison de la repartitionde l’intensite d’un symptome en 3 classes selon l’exposition atrois toxiques differents
Principe Adequation Independance Cas part.
Notion de tableau de contingence
Exemple : Comparaison de deux proportions
• dans les cours precedents : pA = 110/200 et pB = 80/190 etcomparaison (( directe )) par le test z
• Une autre presentation est possible :
TMT A TMT B Total
Succes 110 80 190Echecs 90 110 200
Total 200 190 390
Soit un tableau a 4 cases.
Principe Adequation Independance Cas part.
Notion de tableau de contingence
Exemple : Comparaison de deux proportions
• dans les cours precedents : pA = 110/200 et pB = 80/190 etcomparaison (( directe )) par le test z
• Une autre presentation est possible :
TMT A TMT B Total
Succes 110 80 190Echecs 90 110 200
Total 200 190 390
Soit un tableau a 4 cases.
Principe Adequation Independance Cas part.
Notion de loi multinomiale
Rappel :
• la loi binomiale : B(n; p) : nombre de succes parmi n sujetsayant chacun une probabilite p d’avoir un succes.
• si resultat de l’experience aleatoire a plus que deux issues (doncautre que succes-echec) → loi multinomiale
• Ex. : groupes sanguins : un sujet appartient a l’un des 4 groupespossibles.
• modelise par la loi multinomiale
• distribution multinomiale : quand les sujets peuvent etre classesdans une parmi plus de deux modalites.
Principe Adequation Independance Cas part.
Notion de table de contingence
• Forme generale : un tableau donnant le croisement de deuxvariables multinomiales
F1 F2 F3 F4 F5
Gr .1 . . . . . . . . . . . . . . . n1.
Gr .2 . . . . . . . . . . . . . . . n2.
Gr .3 . . . . . . . . . . . . . . . n3.
Gr .4 . . . . . . . . . . . . . . . n4.
Total n.1 n.2 n.3 n.4 n.5 n..
Principe Adequation Independance Cas part.
Notion de table de contingence
Forme generale du tableau de contingence (TC)
I lignes et J colonnes soit I · J cases ou cellules
deux marges : effectifs marginaux / distributions marginales
cellules indexees par ligne i et colonne j : cijun effectif par case : nijun effectif marginal en ligne : ni .un effectif marginal en colonne : n.jun effectif total n..
Dans la case i ,j , il y a nij sujets ayant la caracteristique i de lavariable de ligne et la caracteristique j de la variable en colonne.
Principe Adequation Independance Cas part.
Exemple 1 : cas general
Soit un tableau de I lignes et de J colonnes.On note nij l’effectif de la cellule i ,j , avec i ∈ (1, . . . ,I ) etj ∈ (1, . . . ,J )
1 . . . j . . . J
1 . . . . . . . . . . . . . . . n1.
. . . . . . . . . . . . . . . . . .i . . . . . . nij . . . . . . ni .
. . . . . . . . . . . . . . . . . .I . . . . . . . . . . . . . . . nI .
Total n.1 n.j n.J
Principe Adequation Independance Cas part.
Exemple 2 : cas le plus courant
Pour un tableau de deux lignes et deux colonnes :
col. 1 col. 2 total
ligne 1 n11 n12 n1.
ligne 2 n21 n22 n2.
total n.1 n.2 n..
Principe Adequation Independance Cas part.
Taille du tableau et degres de liberte
Notion de degres de liberte (ddl)
soit une table 2× 2 : une fois les marges et une case connues,on peut completer le tableau → un ddl, pour la case a fixer
pour une table 3× 3 : une fois les marges connues, il faut fixer4 cases pour pouvoir determiner les 5 cases restantes : 4 ddl
loi du χ2 : caracterisee par des ddl
calcul du nombre de ddl pour un tableau de taille I · J :nddl = (I − 1) · (J − 1)
Principe Adequation Independance Cas part.
Contexte et commentaires
Utilisation du TC :
le tableau contient generalement des effectifs et pas desproportions
comparer deux proportions ⇔ comparer deux series d’effectifs
dans le test du χ2, on compare des repartitions d’effectifs(entre 0 et ∞) et pas directement des proportions (entre 0 et1)
une proportion = rapport de deux nombres : succes / echec
mais la question est la meme : les proportions different-elles ?
Principe Adequation Independance Cas part.
Construction du test
On souhaite comparer deux proportions observees
• les effectifs observes subissent des fluctuations d’echantillonnage
• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.
• Par exemple, sous egalite parfaite (H0) on observe :
col. 1 col. 2 total
ligne 1 10 10 20ligne 2 84 84 168
total 94 94 188
dans cet exemple :
la repartition en colonne est lameme d’une ligne a l’autre
la repartition en ligne est lameme d’une colonne a l’autre
Principe Adequation Independance Cas part.
Construction du test
On souhaite comparer deux proportions observees
• les effectifs observes subissent des fluctuations d’echantillonnage
• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.
• Par exemple, sous egalite parfaite (H0) on observe :
col. 1 col. 2 total
ligne 1 10 10 20ligne 2 84 84 168
total 94 94 188
dans cet exemple :
la repartition en colonne est lameme d’une ligne a l’autre
la repartition en ligne est lameme d’une colonne a l’autre
Principe Adequation Independance Cas part.
Construction du test
On souhaite comparer deux proportions observees
• les effectifs observes subissent des fluctuations d’echantillonnage
• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.
• Par exemple, sous egalite parfaite (H0) on observe :
col. 1 col. 2 total
ligne 1 10 10 20ligne 2 84 84 168
total 94 94 188
dans cet exemple :
la repartition en colonne est lameme d’une ligne a l’autre
la repartition en ligne est lameme d’une colonne a l’autre
Principe Adequation Independance Cas part.
Attention !
L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
col. 1 col. 2 total
0,106 0,106 0,1060,894 0,894 0,894
1 1 1
col. 1 col. 2 total
0,667 0,333 10,667 0,333 1
0,667 0,333 1
Principe Adequation Independance Cas part.
Attention !
L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
col. 1 col. 2 total
0,106 0,106 0,1060,894 0,894 0,894
1 1 1
col. 1 col. 2 total
0,667 0,333 10,667 0,333 1
0,667 0,333 1
Principe Adequation Independance Cas part.
Attention !
L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
col. 1 col. 2 total
0,106 0,106 0,1060,894 0,894 0,894
1 1 1
col. 1 col. 2 total
0,667 0,333 10,667 0,333 1
0,667 0,333 1
Principe Adequation Independance Cas part.
Attention !
L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
col. 1 col. 2 total
0,106 0,106 0,1060,894 0,894 0,894
1 1 1
col. 1 col. 2 total
0,667 0,333 10,667 0,333 1
0,667 0,333 1
Principe Adequation Independance Cas part.
Construction du test
Sous H0 : egalite des repartitions en lignes / colonnes
• Les effectifs observes sont tels que les proportions differentnumeriquement
• le test suppose la comparaison des effectifs observes et deseffectifs sous H0
• comment obtenir les effectifs sous H0, i.e. effectifs theoriques(attendus) sous H0 ?
Principe Adequation Independance Cas part.
Construction du test
Comment obtenir les effectifs theoriques ?
• en l’absence de difference entre les repartitions entre lignes /entre colonnes, les meilleures estimations des proportions de succes/ echec sont obtenues a partir des effectifs marginaux.
• s’il n’y a pas de difference entre les groupes, les repartitions enlignes / colonnes sont en moyenne identiques entre elles etidentiques a la distribution marginale ligne/colonne
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
Principe Adequation Independance Cas part.
Construction du test
Comment obtenir les effectifs theoriques ?
• en l’absence de difference entre les repartitions entre lignes /entre colonnes, les meilleures estimations des proportions de succes/ echec sont obtenues a partir des effectifs marginaux.
• s’il n’y a pas de difference entre les groupes, les repartitions enlignes / colonnes sont en moyenne identiques entre elles etidentiques a la distribution marginale ligne/colonne
col. 1 col. 2 total
ligne 1 10 5 15ligne 2 84 42 126
total 94 47 141
Principe Adequation Independance Cas part.
Construction du test
(.../... Comment obtenir les effectifs theoriques ?)
• sous H0, les repartitions marginales doivent etre identiques pourchaque ligne/colonne
• donc l’effectif theorique d’une cellule sous H0 est la valeurattendue sous H0
• les valeurs attendues obtenues sous H0 sont estimees a partir duproduit des marges
• soit une repartition de chaque ligne/colonne au prorata dechaque colonne/ligne
Principe Adequation Independance Cas part.
Construction du test
Soit sur un tableau :
col. 1 col. 2 total
ligne 1 e11 o1.
ligne 2 o2.
total o.1 o.2 o..
sous H0 : e11 = o1. · o.1/o..de facon generale :
eij = oi . · o.j/o..
Principe Adequation Independance Cas part.
Construction du test
Soit sur un tableau :
col. 1 col. 2 total
ligne 1 e11 o1.
ligne 2 o2.
total o.1 o.2 o..
sous H0 : e11 = o1. · o.1/o..de facon generale :
eij = oi . · o.j/o..
Principe Adequation Independance Cas part.
Construction du test
Soit sur un tableau :
col. 1 col. 2 total
ligne 1 e11 o1.
ligne 2 o2.
total o.1 o.2 o..
sous H0 : e11 = o1. · o.1/o..de facon generale :
eij = oi . · o.j/o..
Principe Adequation Independance Cas part.
Construction du test
Soit pour un tableau a 4 cases :
col. 1 col. 2 total
ligne 1 e11 = o1.·o.1o..
e12 = o1.·o.2o..
o1.
ligne 2 e21 = o2.·o.1o..
e22 = o2.·o.2o..
o2.
total o.1 o.2 o..
Principe Adequation Independance Cas part.
Construction du test
On se retrouve avec deux tableaux !
valeurs observees
col. 1 col. 2 total
ligne 1 o11 o12 o1.
ligne 2 o21 o22 o2.
total o.1 o.2 o..
valeurs theoriques
col. 1 col. 2 total
ligne 1 e11 e12 o1.
ligne 2 e21 e22 o2.
total o.1 o.2 o..
Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0
Principe Adequation Independance Cas part.
Construction du test
On se retrouve avec deux tableaux !
valeurs observees
col. 1 col. 2 total
ligne 1 o11 o12 o1.
ligne 2 o21 o22 o2.
total o.1 o.2 o..
valeurs theoriques
col. 1 col. 2 total
ligne 1 e11 e12 o1.
ligne 2 e21 e22 o2.
total o.1 o.2 o..
Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0
Principe Adequation Independance Cas part.
Construction du test
On se retrouve avec deux tableaux !
valeurs observees
col. 1 col. 2 total
ligne 1 o11 o12 o1.
ligne 2 o21 o22 o2.
total o.1 o.2 o..
valeurs theoriques
col. 1 col. 2 total
ligne 1 e11 e12 o1.
ligne 2 e21 e22 o2.
total o.1 o.2 o..
Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0
Principe Adequation Independance Cas part.
Construction du test
• Le probleme de la comparaison de deux proportions devient leprobleme de la comparaison de deux repartitions
• qui se ramene a la comparaison de deux tableaux : l’un observeet l’autre theorique
• Comment calculer l’ecart entre ces deux tableaux ?
• dans une cellule ij , ecart entre obs et theo :
(oij − eij )2
eij
Principe Adequation Independance Cas part.
Construction du test
• cet ecart par cellule est somme sur l’ensemble des cellules :∑ij
(oij − eij )2
eij
• on montre que(oij−eij )2
eij→ N (0 ; 1)
• or une somme de N (µ;σ)→ χ2
test du χ2
la comparaison de la repartition des lignes et des colonnes d’untableau se fait par un test du χ2 a k ddl.
Principe Adequation Independance Cas part.
Construction du test
Synthese : la logique du test :
en l’absence de difference de repartition (i.e. absence dedifference de proportions), les valeurs observees sont egalesaux valeurs theoriques sur l’ensemble des cellules
Donc, sous H0 : oij = eij , ∀i ,j et∑
ij(oij−eij )2
eij= 0
• Si H0 est fausse :
les ecarts sont d’autant plus importants que les distributionsdifferent et donc :
plus les proportions / repartitions different
plus les ecarts oij − eij augmentent
plus la valeur de χ2 augmente
Principe Adequation Independance Cas part.
Construction du test
La valeur du χ2obs sera comparee a une valeur seuil χ2
α
Principe Adequation Independance Cas part.
Construction du test
Les hypotheses du test :
H0 : les repartitions en lignes / en colonnes ne different pas
H1 : les repartitions en lignes / en colonnes different
→ formulation generale, a adapter a chaque cas
La procedure :
remplir le tableau de contingence
calculer le nombre de degres de liberte
calculer les effectifs theoriques
calculer la valeur du χ2obs
si χ2obs > χ2
ddl ;seuil : on rejette H0
sinon, on ne rejette pas H0
Principe Adequation Independance Cas part.
Remarques
(1) Conditions d’application du test du χ2 : tous les eij > 5
(2) dans le cas d’une table 2× 2, i.e. cas de la comparaison dedeux proportions : les deux tests sont strictements equivalents etχ2
obs = (zobs)2
Principe Adequation Independance Cas part.
Plan
1 Principe du test
2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique
3 χ2 d’independance
4 Cas particuliers
Principe Adequation Independance Cas part.
Notion d’adequation
• comparaison d’une proportion observee et d’une proportiontheorique
• comparaison d’une distribution multinomiale observee et d’unemultinomiale theorique
• notion d’adequation entre observation et theorie pre-existante
• test d’une loi de probabilite : une serie de valeur suit-elle une loimultinomiale, une loi de Poisson, une loi de Gauss, etc ?
Dans le cas d’un χ2 d’adequation :
les effectifs theoriques sont connus par ailleurs (donnes par latheorie) et il n’est pas necessaire de les definir a partir des donneesobservees
Principe Adequation Independance Cas part.
Notion d’adequation
• comparaison d’une proportion observee et d’une proportiontheorique
• comparaison d’une distribution multinomiale observee et d’unemultinomiale theorique
• notion d’adequation entre observation et theorie pre-existante
• test d’une loi de probabilite : une serie de valeur suit-elle une loimultinomiale, une loi de Poisson, une loi de Gauss, etc ?
Dans le cas d’un χ2 d’adequation :
les effectifs theoriques sont connus par ailleurs (donnes par latheorie) et il n’est pas necessaire de les definir a partir des donneesobservees
Principe Adequation Independance Cas part.
1 prop/ref
Plan
1 Principe du test
2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique
3 χ2 d’independance
4 Cas particuliers
Principe Adequation Independance Cas part.
1 prop/ref
Comparaison proportion observee / proportion theorique
On souhaite comparer une proportion observee et une proportiontheorique (exemple de la loi de Mendel)
• Les effectifs theoriques du tableau et du test sont deja connuspar construction : la loi de Mendel fournit les valeurs attendues
• il est inutile de calculer les valeurs theoriques a partir des valeursobservees
Principe Adequation Independance Cas part.
1 prop/ref
Comparaison d’une proportion a une reference
On obtient donc le tableau suivant :
Effectifs observes Effectifs Theoriques
ligne 1 130 0,75 · 200 = 150ligne 2 70 0,25 · 200 = 50
total 200 200
Principe Adequation Independance Cas part.
1 prop/ref
Realisation du test
Les hypotheses du test :
H0 : la repartition observee des phenotypes ne differe pas de larepartition theorique
H1 : la repartition observee des phenotypes differe de larepartition theorique
La procedure :
remplir le tableau de contingence X
calculer le nombre de degre de liberte = 1 (I-1)
calculer les effectifs theoriques X
calculer la valeur du χ2obs :
(130− 150)2
150+
(70− 50)2
50= 10,67
Principe Adequation Independance Cas part.
1 prop/ref
χ2obs > χ2
seuil au risque α = 5% puisque 10,67 > 3,84 :
donc on rejette H0
• Donc on rejette l’hypothese d’adequation des donnees a larepartition theorique et on peut considerer que le gene etudie n’apas une transmission mendelienne.
Remarque : 10,67 = (3,27)2, χ2obs = z 2 (voir cours prop.)
Principe Adequation Independance Cas part.
1 rep/theorique
Plan
1 Principe du test
2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique
3 χ2 d’independance
4 Cas particuliers
Principe Adequation Independance Cas part.
1 rep/theorique
Comparaison multinomiale observee / theorique
• Repartition des groupes sanguins (Beuscart et al. ) dans lapopulation francaise : connue tres fiablement par les dons du sang.
• La repartition des groupes sanguins au pays basque sur unechantillon de 150 sujets• Frequences theoriques :
0 A B AB total
Pop. francaise 0,42 0,45 0,09 0,04
• Effectifs theoriques et observes :
0 A B AB total
Eff. observes 81 64 4 0 150Eff. attendus 63,0 67,5 13,5 6,0 150
Principe Adequation Independance Cas part.
1 rep/theorique
Comparaison multinomiale observee / theorique
• H0 : la frequence des groupes sanguins ne different pas entre lapopulation basque et la population francaise
• H1 : la frequence des groupes sanguins different entre lapopulation basque et la population francaise
• Les effectifs theoriques > 5, ddl=3 (I-1).
• le χ2obs vaut :
(81− 63)2
63+
(64− 67,5)2
67,5+
(4− 13,5)2
13,5+
(0− 6)2
6= 17,92
• pour un α = 0,05 et avec 3 ddl, le χ2seuil = 7,815
• Donc χ2obs > χ2
3;α donc rejet de H0 et on conclut que larepartition des groupes sanguins dans la population basque differede celle dans la population francaise.
Principe Adequation Independance Cas part.
1 rep/theorique
Retour sur le contexte d’utilisation
• exemple precedent : comparaison d’une distribution multinomialeobservee et d’une multinomiale theorique
• illustre la notion d’adequation entre observation et theoriepre-existante
• applicable pour tester une loi de probabilite : une serie de valeursuit-elle une loi multinomiale specifiee, une loi de Poisson, une loide Gauss, etc ?
• Exemple sur une loi de Gauss : soit une concentration serique surn patient.
definir des intervalles d’interets, par ex. 10, 20, 30, 40, 50UI/mLdeterminer la proportion de sujets attendus ayant uneconcentration entre deux valeurs, a partir d’une moyenne etd’une variance theoriquescomparer les proportions theoriques et observees par un χ2
Principe Adequation Independance Cas part.
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales
4 Cas particuliers
Principe Adequation Independance Cas part.
2 prop obs.
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales
4 Cas particuliers
Principe Adequation Independance Cas part.
2 prop obs.
Comparaison de deux proportions observees
• Peut se faire par un test z (voir cours precedent)
• plus frequemment realise par un test du χ2
X Procedure du test :
poser les hypotheses comme avec le test zcalculer les effectifs theoriques
calculer la valeur du χ2obs
comparer a la valeur seuil du χ2α
rejet ou non de H0 selon la comparaison
Principe Adequation Independance Cas part.
2 prop obs.
Exemple
(A partir de l’exemple donne avec le test z , soit 52 et 38% de tauxde succes)
TMT A TMT B Total
Succes 26 19 45Echecs 24 31 55
Total 50 50 100
.../...
Principe Adequation Independance Cas part.
2 prop obs.
Exemple
.../...
• effectifs attendus sous H0 :
TMT A TMT B Total
Succes 22,50 22,50 45Echecs 27,50 27,50 55
Total 50 50 100
Valeur de la statistique de test :
χ2obs =
(26− 22,50)2
22,50+
(19− 22,50)2
22,50+
(24− 27,50)2
27,50+
(31− 27,50)2
27,50
χ2obs = 0,544 + 0,544 + 0,445 + 0,445 = 1,980
Principe Adequation Independance Cas part.
2 prop obs.
Exemple
• donc : χ2obs < χ2
seuil puisque χ2seuil = 3,84 pour 1 ddl
• on ne rejette pas H0 et on ne met pas en evidence de differenceentre les deux traitements
Principe Adequation Independance Cas part.
> 2 proportions
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales
4 Cas particuliers
Principe Adequation Independance Cas part.
> 2 proportions
Comparaison de plus de deux proportions
• On souhaite comparer les taux de succes de trois traitementssimultanement :
• On observe les donnees suivantes :
TMT A TMT B TMT C Total
Succes 26 19 32 77Echecs 24 31 18 73
Total 50 50 50 150
• Les hypotheses sont : H0 les taux de succes sont identiques dansles trois populations et H1 au moins une des populations a un tauxde succes different des autres
Principe Adequation Independance Cas part.
> 2 proportions
Comparaison de plus de deux proportions
Les effectifs theoriques sont les suivants :
TMT A TMT B TMT C Total
Succes 25,67 25,67 25,67 77Echecs 24,33 24,33 24,33 73
Total 50 50 50 150
La valeur du χobs :χobs = 0,004 + 1,732 + 1,563 + 0,005 + 1,826 + 1,648 = 6,778pour un seuil a 5% = 5,99 → on rejette H0 et on conclut quel’un au moins des traitements differe des autres.
Principe Adequation Independance Cas part.
multinom.
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales
4 Cas particuliers
Principe Adequation Independance Cas part.
multinom.
Comparaison de plusieurs multinomiales
• Le test du χ2 peut se generaliser a la comparaison de plus dedeux multinomiales (distribution a plus de deux modalites).
• comparaison de l’evolution d’une pathologie articulaire(aggravation, amelioration, stabilite) en fonction de trois types detraitements A, B et C.
• a noter : les echantillons doivent etre independants ! On ne peuta priori pas comparer la frequence de plusieurs effets secondairesentre deux ou trois medicaments car un sujet peut avoir plusieurseffets secondaires avec le meme medicament. Le cas desechantillons non-independants sera vu plus loin dans le cas de deuxseries appariees.
Principe Adequation Independance Cas part.
multinom.
Comparaison de plusieurs multinomiales
Soit le tableau suivant :
Evolution TMT A TMT B TMT C Total
Amelioration 16 20 32 68Stabilisation 24 31 18 73Aggravation 20 10 19 49
Total 60 61 69 190
• Les hypotheses sont : H0 : l’evolution est identique pour les troistraitements et H1 : au moins un des traitements se caracterise parune evolution differente
• On souhaite faire un test au risque α = 0,02
Principe Adequation Independance Cas part.
multinom.
Comparaison de plusieurs multinomiales
Les valeurs theoriques sont les suivantes :
Evolutions TMT A TMT B TMT C Total
Amelioration 21,47 21,83 24,69 68Stabilisation 23,05 23,44 26,51 73Aggravation 15,47 15,73 17,79 49
Total 60 61 69 190
Avec par exemple : e32 = 61×49190 = 15,73
Principe Adequation Independance Cas part.
multinom.
Comparaison de plusieurs multinomiales
• χ2obs = 1,395 + 0,154 + 2,161 + 0,039 + 2,441 + 2,732 + 1,324 +
2,088 + 0,082 = 12,416
• le nombre de ddl = (3− 1)× (3− 1) = 4
• la valeur seuil du χ24;α=2% = 11,67
• Rem : la valeur seuil du χ24;α=1% = 13,28
• donc on rejette l’H0 au seuil choisi
Principe Adequation Independance Cas part.
multinom.
Remarques diverses
Comparaisons de plusieurs multinomiales
probleme des comparaisons multiples et de localisation de laou des differences apres un test significatif
probleme egalement pour les comparaisons des taux de succesde plusieurs populations
pas de solutions simples
Principe Adequation Independance Cas part.
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independance
4 Cas particuliersCas des series apparieesCas des petits effectifs
Principe Adequation Independance Cas part.
Series appariees
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independance
4 Cas particuliersCas des series apparieesCas des petits effectifs
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
• series appariees : repetition d’une mesure sur un meme sujet
• mesure qualitative : presence/absence d’une caracteristique
a deux temps differents : avant-apres application d’untraitement
sur deux organes (paires : poumons),
sur deux prelevements sur un meme organe : deux biopsieshepatiques
en epidemiologie : sujets apparies → etude cas-temoins
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Exemple d’un traitement applique sur les deux mains (pommadecorticoıde pour un eczema)
Gauche Droite
Amelioration O1 O3
Pas d’amelioration O2 O4
Total n n 2n
Les hypotheses testees sont :
πD = πG
πD 6= πG
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
• La comparaison de ces deux proportions (πD et πG) ne peut passe faire avec le test du χ2 indique precedemment en raison de lanon-independance des donnees
• dans une serie appariee, les resultats sur l’une des seriesdependent des resultats sur l’autre serie
• les conditions d’applications (independance des mesures) ne sontdonc pas presentes
• changer la presentation des donnees et tenir compte de ladependance des donnees
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Cote Gauche
Cote Droit Amelioration Pas d’amelioration
Amelioration a c a + cPas d’amelioration b d
Total a + b n
Avec :
amelioration a droite : pD = (a + c)/namelioration a gauche : pG = (a + b)/n
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
D’ou la comparaison :
πD = πG
πD 6= πG
mais avec les valeurs observees suivantes :
pD = (a + c)/npG = (a + b)/n
La comparaison doit tenir compte des paires concordantes et despaires discordantes
.../...
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
.../...
paires concordantes : les deux cotes donnent le meme resultat(succes-succes ou echec-echec)
paires discordantes : les deux cotes donnent un resultatdifferent (succes-echec ou vice-versa)
Les paires concordantes n’apportent pas d’information sur la liaisonentre la maladie et le traitement : pour ces paires, le taux desucces ne differe pas.
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Cote Droit Cote gauche nombre de paires
S S aE S bS E cE E d
Total = n
Principe si H0 vraie : nb. paires (S,E) = nb paires (E,S)
⇒ tester si proportion de paires (S,E) (equiv. (E,S)) 6= 1/2
• soit comparaison proportion observee et proportion theorique
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Realisation du test :
(E,S) (S,E)
Effectifs observes b cEffectifs theoriques b+c
2b+c2
Total = n
D’ou la valeur du χ2 :
χ2obs;s.a. =
(b − b+c
2
)2b+c2
+
(c − b+c
2
)2b+c2
=
(b−c2
)2+(
c−b2
)2b+c2
.../...
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
.../... et in fine :
χ2obs;s.a. =
(b − c)2
b + c
• le nombre de ddl d’un test χ2 pour series appariees = 1
• conditions d’application : b+c2 > 5
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Exemple : etude epidemiologique, comparaison a l’exposition a untoxique entre cas (cancer) et temoin (meme service, pathologienon cancereuse). On observe :
TemoinsCas Exposes Non Exposes Total
Exposes 31 8 39Non Exposes 10 42 52
Total 41 50 91
Principe Adequation Independance Cas part.
Series appariees
Series appariees sur var. qualitatives
Procedure du test :
on pose H0 et H1 la frequence d’exposition au toxique nediffere pas / differe entre les cas et les temoins X
on fixe le risque α (par exemple 10%) X
verification des conditions d’application : (8 + 10)/2 > 5 X
calcul de χ2obs;s.a. = (8− 10)2/(8 + 10) = 0,22 X
comparaison au χ2seuil pour le risque choisi : χ2
seuil = 2,706 X
comparaison : χ2obs;s.a. < χ2
seuil : on ne rejette pas H0
conclusion : on ne met pas en evidence une difference defrequence d’exposition au toxique entre les cas et les temoins
Principe Adequation Independance Cas part.
Petits effectifs
Plan
1 Principe du test
2 χ2 d’adequation
3 χ2 d’independance
4 Cas particuliersCas des series apparieesCas des petits effectifs
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
Dans certaines situations, effectifs tres petits :
dosage tres couteux
animaux (( particuliers ))
maladie rare
protocole complexe et long
etc
Conditions de validite du test du χ2 pas toujours respectees
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
Utilisation directe des probabilites par le test exact de Fisher
A B
Succes a b m1
Echec c d m2
Total n1 n2 n
• une fois les marges fixees et une case fixee, on connait toutes lesautres valeurs du tableau
• loi hypergeometrique : constitution d’un echantillon sans remisedans l’urne.
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
• on peut calculer la probabilite d’avoir n11 = a sachant les marges
• Soit la V.A. A associee a l’effectif a : Pr(A = a) = n1!n2!m1!m2!a!b!c!d !n!
→ Principe et procedure du test :
• on test un ecart a l’equirepartition des lignes/colonnes (ecart aH0)
• l’ecart a l’H0 est quantifie directement par la probabilite d’avoirun ecart plus important que celui observe
• calcul de la probabilite de Pr(A = a),∀a• addition de toutes les probabilites telles que
Pr(A = a∗) 6 Pr(A = aobs)
.../...
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
Soit la table :
A B Total
Succes 5 0 5Echec 2 5 7
Total 7 5 12
Sachant les marges, la case c11 peut prendre les valeurs suivantes :{0, 1, 2, 3, 4, 5}.
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
d’ou les probabilites de chaque table :
Pr(A = 5) = 7!5!5!7!/5!0!2!5!12! = 0,0265∗ X
Pr(A = 4) = 7!5!5!7!/4!1!3!4!12! = 0,2210Pr(A = 3) = 7!5!5!7!/3!2!4!3!12! = 0,4420Pr(A = 2) = 7!5!5!7!/2!3!5!2!12! = 0,2651Pr(A = 1) = 7!5!5!7!/1!4!6!1!12! = 0,0442Pr(A = 0) = 7!5!5!7!/0!5!7!0!12! = 0,0013∗
soit valeur de test : p = 0,0265 + 0,0013 = 0,0278.On rejette donc l’H0.
Principe Adequation Independance Cas part.
Petits effectifs
Cas des petits effectifs
Remarques :
• peu commode
• toujours valide, meme si effectifs grands
• mais seul a etre valide si effectifs petits
Principe Adequation Independance Cas part.
Petits effectifs
Remarques diverses
Choix de la valeur de α
depend du contexte et du cout du risque
risque α : risque de declarer a tort comme present un effetinexistant
si le medicament a peu d’effets secondaires : α (( grand ))
acceptable
si le medicament a bcp d’effets secondaires : etre sur de sonefficacite avant commercialisation : prendre α (( petit ))
a moduler selon la gravite de la maladie et la disponibilited’autres medicaments
Principe Adequation Independance Cas part.
Petits effectifs
Synthese finale
Au final, nous avons vu :
dans le cas de deux proportions, le test du χ2 est equivalentau test zle test du χ2 s’etend a differents cas
comparaison de trois proportions ou pluscomparaison de deux ou plus de deux multinomiales
cas particulier des series appariees
cas particulier des petits effectifs