stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/m1stats/...1 introduction 2...

49
Introduction Principe Exemple Formules d’estimation d’une stratification a posteriori Comparaison avec un SAS Redressements sur critères multiples Stratification a posteriori Myriam Maumy-Bertrand 1 1 IRMA, Université de Strasbourg Strasbourg, France Master 1ère Année 13-11-2014 Myriam Maumy-Bertrand Stratification a posteriori

Upload: others

Post on 13-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Stratification a posteriori

Myriam Maumy-Bertrand1

1IRMA, Université de StrasbourgStrasbourg, France

Master 1ère Année 13-11-2014

Myriam Maumy-Bertrand Stratification a posteriori

Page 2: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

RéférenceCe chapitre s’appuie essentiellement sur l’ouvrage :

« Méthodes statistiques des sondages »,de Jean-Marie Grosbras,aux éditions Economica, 1987.

Myriam Maumy-Bertrand Stratification a posteriori

Page 3: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Principe fondamentalDéfinition

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 4: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Principe fondamentalDéfinition

RemarqueC’est la deuxième méthode (après le sondage stratifié) qui vautiliser une variable auxiliaire car il est rare que nous nedisposons pas d’une variable quantitative ou qualitative dont lavaleur/modalité est connue pour chacun des individus de lapopulation.

Principe fondamentalLorsque nous disposons d’une information auxiliaire, il fautchercher à l’utiliser dans le but d’obtenir des estimateurs plusprécis que les estimateurs simples de la moyenne ou du totalqui apparaissent dans le cadre du sondage à PESR ou à PISR.

Myriam Maumy-Bertrand Stratification a posteriori

Page 5: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Principe fondamentalDéfinition

L’information auxiliaire peut être utilisée au niveau de laconstruction de l’échantillon (stratification, tirage proportionnelà un critère de taille,. . .) ou au niveau de l’expression del’estimateur (techniques de redressement/calage).

Si plusieurs variables auxiliaires sont utilisées, nous pouvonsrecourir à une technique mixte dans laquelle certainesvariables servent à améliorer le tirage de l’échantillon, et lesautres à améliorer l’estimateur.

Myriam Maumy-Bertrand Stratification a posteriori

Page 6: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Principe fondamentalDéfinition

DéfinitionLa stratification a posteriori est une méthode de redressementd’échantillon sur une variable qualitative.

Cette méthode fait partie des méthodes de calage aux marges.Parmi les méthodes de calage aux marges, nous citons :

post-stratification (ce chapitre)estimation par quotient (chapitre 5)estimation par régression (chapitre 7)estimation par régression multiple (non traité)

Myriam Maumy-Bertrand Stratification a posteriori

Page 7: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 8: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

PrincipeNous étudions un caractère X sur une population. Nousconnaissons un autre caractère Y sur cette même populationet surtout sa distribution.

L’échantillon n’est pas stratifié a priori sur Y mais pourchacune des unités échantillonnées on relève le couple (xi ; yi).

Nous définissons, à posteriori, des strates selon les valeurs deY .

Nous repondérons les données par les poids véritables desstrates définies sur Y .

Myriam Maumy-Bertrand Stratification a posteriori

Page 9: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Si ce critère Y est corrélé avec X , c’est-à-dire si la variabilité deX s’explique en partie par des différences entre les classes deY , le calage de l’échantillon lui donne alors une représentativitéplus fidèle et conduit à des résultats plus fiables.

C’est pourquoi les questionnaires comportent souvent en plusdes questions qui abordent le thème de l’étude, des élémentsde description de l’unité interrogée comme par exemple, lenombre de personnes du ménage, le nombre d’enfants, la CSPdes adultes, les caractéristiques du logement...

Ces éléments permettent de juger de la qualité de l’échantillonet de suggérer des calages éventuels.

Myriam Maumy-Bertrand Stratification a posteriori

Page 10: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 11: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

ExempleUn échantillon de 1 000 personnes interrogées sur la question

« Allez-vous au cinéma au moins une fois par mois ? »

Nous avons croisé cette question avec une autre question

« Avez-vous une télévision ? »

Myriam Maumy-Bertrand Stratification a posteriori

Page 12: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Voici la répartition des réponses obtenues

Cinémaoui non total

Télé oui 20 680 700non 80 220 300total 100 900 1 000

100 personnes répondent « oui » à la première question, ce quinous permet d’estimer le pourcentage à 10%.Le calcul que nous avons fait s’écrit de la façon suivante

π̂ =20700× 700

1 000+

80300× 300

1 000= 0,10.

Myriam Maumy-Bertrand Stratification a posteriori

Page 13: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

RemarqueDans l’échantillon, il y a une sous représentation despossesseurs de télévisions. Comment le savons-nous ? Pard’autres sources qui nous indiquent qu’il y a 80% de gens quipossèdent une télévision.

ConséquenceL’estimation du pourcentage ne se calcule plus de la mêmefaçon ! Rectifions le calcul

π̂ =20

700× 800

1 000+

80300× 200

1 000= 0,076

ou encore π̂ est égal à 7,6%. Que faut-il en conclure ?

Myriam Maumy-Bertrand Stratification a posteriori

Page 14: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 15: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

DéfinitionL’estimateur d’une moyenne µ de la population U est défini par

µ̂post =k∑

h=1

Nh

Nµ̂h,

où Nh représente l’effectif des strates a posteriori et

µ̂h =1nh

nh∑i=1

Xhi .

Myriam Maumy-Bertrand Stratification a posteriori

Page 16: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

RemarqueC’est la même formule que la moyenne µ̂st d’un échantillonstratifié a priori. Mais c’est seulement une apparence !

En effetDans le calcul de µ̂st , les µ̂h sont fondés sur des tailles nhfixées à l’avance.Dans le calcul de µ̂post , les µ̂h sont fondés sur des taillesnh qui ne sont pas fixées à l’avance, mais qui sont desrésultats constatés sur l’échantillon. Donc les tailles nhsont des quantités aléatoires.

Myriam Maumy-Bertrand Stratification a posteriori

Page 17: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Comment faire dans les calculs si les nh sont aléatoires ?La démarche se fait en deux étapes.

Nous fixons d’abord les nh.Puis nous introduisons l’aléatoire sur les nh.

C’est cette démarche qui va nous permettre de calculerl’espérance de µ̂post pour savoir si µ̂post est un estimateurbiaisé ou pas.

Myriam Maumy-Bertrand Stratification a posteriori

Page 18: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Calcul de l’espérance de µ̂post

Nous avons par conditionnement

E [µ̂post ] = E [E [µ̂post |nh]] .

D’autre part, nous avons

E [µ̂post |nh] =H∑

h=1

Nh

NE [µ̂h|nh]

=H∑

h=1

Nh

Nµh

= µ.

Myriam Maumy-Bertrand Stratification a posteriori

Page 19: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

D’où, nous en concluons que

E [µ̂post ] = E [E [µ̂post |nh]]

= E [µ] d’après ce que nous venons d’établir= µ.

PropriétéNous montrons, par calcul, que µ̂post est un estimateur sansbiais d’une moyenne µ de la population U.

Myriam Maumy-Bertrand Stratification a posteriori

Page 20: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

DéfinitionL’estimateur d’un total T d’une population U est défini par

T̂post =H∑

h=1

Nhµ̂h,

où Nh représente l’effectif des strates a posteriori et

µ̂h =1nh

nh∑i=1

xhi .

Myriam Maumy-Bertrand Stratification a posteriori

Page 21: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Propriété

Nous montrons, par calcul comme précedemment, que T̂postest un estimateur sans biais d’un total T d’une population U,i.e.

E[T̂post

]= E

[k∑

h=1

Nhµ̂h

]= T .

Myriam Maumy-Bertrand Stratification a posteriori

Page 22: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Calcul de la variance de µ̂post

Nous procédons de la même manière que nous avons calculél’espérance de cet estimateur, c’est à dire en conditionnant parnh.Par conséquent, nous obtenons

Var [µ̂post ] = Var [E [µ̂post |nh]] + E [Var [µ̂post |nh]] .

Or nous avons montré précedemment que

E [µ̂post |nh] = µ.

Par conséquent, nous avons

Var [E [µ̂post |nh]] = Var [µ] = 0.Myriam Maumy-Bertrand Stratification a posteriori

Page 23: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Reste plus qu’à calculer le second membre de l’équation de lavariance.

Var [µ̂post |nh] =k∑

h=1

N2h

N2 Var [µ̂h|nh]

=k∑

h=1

N2h

N2Nh − nh

NhnhS2

h,c

=k∑

h=1

N2h

N21nh

S2h,c −

1N

k∑h=1

Nh

NS2

h,c .

Myriam Maumy-Bertrand Stratification a posteriori

Page 24: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Par conséquent, nous avons

E[Var[µ̂post |nh]] = E

[k∑

h=1

N2h

N21nh

S2h,c −

1N

k∑h=1

Nh

NS2

h,c

]

=k∑

h=1

N2h

N2 S2h,cE

[1nh

]− 1

N

k∑h=1

Nh

NS2

h,c .

Il ne reste plus qu’à calculer

E[

1nh

].

Myriam Maumy-Bertrand Stratification a posteriori

Page 25: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Posonsπh =

Nh

Net π̂h =

nh

n.

Remarquons queE[π̂h] = πh.

De plus, nous avons

nh = nnh

n= nπ̂h = n(π̂h − πh + πh)

= nπh

(1 +

π̂h − πh

πh

).

Myriam Maumy-Bertrand Stratification a posteriori

Page 26: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Par conséquent nous en tirons que

1nh

=1

nπh× 1

1 +π̂h − πh

πh

.

Commeπ̂h − πh

πhtend vers 0, nous pouvons faire un

développement limité sur l’égalité ci-dessus et nous obtenonsque :

1nh

=1

nπh×

(1− π̂h − πh

πh+

(π̂h − πh)2

π2h

+ oP

((π̂h − πh)

2

π2h

)).

Myriam Maumy-Bertrand Stratification a posteriori

Page 27: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

E[

1nh

]=

1nπh

E

[(1− π̂h − πh

πh+

(π̂h − πh)2

π2h

+oP

((π̂h − πh)

2

π2h

))]

=1

nπh

(1− 0

+E

[(π̂h − πh)

2

π2h

+ oP

((π̂h − πh)

2

π2h

)]).

Myriam Maumy-Bertrand Stratification a posteriori

Page 28: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Calculons maintenant

E

[(π̂h − πh)

2

π2h

+ oP

((π̂h − πh)

2

π2h

)].

En remarquant que E[(π̂h − πh)2] est égale à la variance de

l’estimateur π̂h et que l’on est dans un cas de tirage à PESR,nous obtenons que

E

[(π̂h − πh)

2

π2h

+ oP

((π̂h − πh)

2

π2h

)]' N − n

N − 1πh(1− πh)

n× 1π2

h.

Myriam Maumy-Bertrand Stratification a posteriori

Page 29: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Finalement, nous avons

E[

1nh

]' 1

nπh

(1 +

N − nNn

(1− πh)

πh

).

Myriam Maumy-Bertrand Stratification a posteriori

Page 30: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

D’où, nous en déduisons que

Var [µ̂post ] 'k∑

h=1

π2hS2

h,c

(1

nπh+

N − nNn2

(1− πh)

π2h

)

− 1N

k∑h=1

πhS2h,c .

Myriam Maumy-Bertrand Stratification a posteriori

Page 31: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

En développant et en réorganisant les termes, nous obtenons

Var [µ̂post ] '1n

k∑h=1

πhS2h,c −

1N

k∑h=1

πhS2h,c

+1n

N − nNn

k∑h=1

(1− πh)S2h,c

' N − nNn

k∑h=1

πhS2h,c +

1n

N − nNn

k∑h=1

(1− πh)S2h,c .

Myriam Maumy-Bertrand Stratification a posteriori

Page 32: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

Finalement, nous obtenons que

Var (µ̂post) '(1− f )

n

H∑h=1

Nh

NS2

h,c +(1− f )

n2

H∑h=1

(1− Nh

N

)S2

h,c

variance de µ̂post + le prix à payer pourn’avoir pas tenu comptede la stratificationdès le départ.

RemarqueCette dernière quantité tend vers 0 lorsque n devient grand.

Myriam Maumy-Bertrand Stratification a posteriori

Page 33: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Estimation d’une moyenne par stratification a posterioriEstimation d’un total par stratification a posterioriVariance de l’estimateur de la moyenneVariance de l’estimateur du total

PropriétéNous montrons, par des calculs analogues à ceux développéspour l’estimateur de la moyenne, que

Var[

T̂post

]' N

((1− f )

n

k∑h=1

NhS2h,c

+(1− f )

n2

k∑h=1

(N − Nh)S2h,c

).

Myriam Maumy-Bertrand Stratification a posteriori

Page 34: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 35: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Comparaison avec un SASNous rappelons que

Var[µ̂] =(1− f )

nS2

c

' (1− f )n

(k∑

h=1

Nh

NS2

h,c +k∑

h=1

Nh

N(X h − µ

)2)

et

Var [µ̂post ] '(1− f )

n

(k∑

h=1

Nh

NS2

h,c +1n

k∑h=1

N − Nh

NS2

h,c

).

Myriam Maumy-Bertrand Stratification a posteriori

Page 36: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

D’où, nous en déduisons que

n(1− f )

(Var [µ̂]− Var [µ̂post ])

'k∑

h=1

Nh

N(X h − µ

)2 − 1n

k∑h=1

N − Nh

NS2

h,c .

La stratification a posteriori se justifie lorsque cette quantité estlargement positive.

Myriam Maumy-Bertrand Stratification a posteriori

Page 37: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Remarques1. La variable étudiée doit-être corrélée avec le critère de

stratification, c’est-à-dire avoir une valeur élevée durapport de corrélation inter-strate.

2. n doit être assez grand, puisque on se sert de1/n→ 0 lorsque n→ +∞. Donc c’est inutile derepondérer les petits échantillons.

3. (N − Nh)/N doit être très petit, puisque on se sert de cettehypothèse pour faire un développement limité. Il faut doncque Nh/N doit être grand. Par conséquent, c’est inutiled’avoir beaucoup de petites strates.

Myriam Maumy-Bertrand Stratification a posteriori

Page 38: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Sommaire

1 Introduction

2 Principe

3 Exemple

4 Formules d’estimation d’une stratification a posteriori

5 Comparaison avec un SAS

6 Redressements sur critères multiples

Myriam Maumy-Bertrand Stratification a posteriori

Page 39: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Retour à l’exemple « Cinéma et Télévision »Nous avons le tableau suivant :

B1 B2 totalA1 20 680 700A2 80 220 300

total 100 900 1 000

En réalité, la marge sur A est (800,200).

Myriam Maumy-Bertrand Stratification a posteriori

Page 40: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Comme nous l’avons montré au début de ce chapitre, lamoyenne calée sur A se calcule par

11 000

800700

∑i∈A1

yi +200300

∑i∈A2

yi

.Les observations de A1 sont redressées par 800/700 et cellesde A2 par 200/300.

Imaginons que l’échantillon soit déformé par rapport à B. Noussavons par d’autres sources, que la marge de B est en réalité(80,920).

Myriam Maumy-Bertrand Stratification a posteriori

Page 41: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

ProblèmeNous voulons caler l’échantillon sur les deux critèressimultanément.

Solution idéaleConnaître les effectifs théoriques croisés mais en réalité on nedispose que des marges.

Myriam Maumy-Bertrand Stratification a posteriori

Page 42: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

ProblèmeEstimer les coefficients de redressement par case, respectantles conditions à la marge.

Quatre Solutions• La méthode RAS• La méthode ASAM• L’ajustement par l’analyse des données• La méthode de Lemel (1976)

Nous ne développerons pas les deux dernières méthodes,mais nous renvoyons au livre de Jean-Marie Grosbras pour deplus amples renseignements sur ces deux méthodes.

Myriam Maumy-Bertrand Stratification a posteriori

Page 43: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

La méthode RAS : Le principe

Le tableau à ajuster est A = (aij).Le total de ligne est ai., le total théorique est ri .Le total de ligne est a.j , le total théorique est sj .On commence par ajuster les totaux en ligne :aij → aij = aij ∗ (ri/ai.).Puis on ajuste les totaux en colonne :aij → aij = aij ∗ (sj/a.j).En ajustant les totaux en colonne, on a détruit l’ajustementdes totaux en ligne. On recommence...On itère le processus jusqu’à convergence.

Myriam Maumy-Bertrand Stratification a posteriori

Page 44: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Avec les données de l’exemple « Cinéma-Télévision », nousavons

A =

15 20 45 1245 67 23 1267 23 91 1577 33 91 35

r =

100150150200

s = [170 150 190 90]

Myriam Maumy-Bertrand Stratification a posteriori

Page 45: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

La méthode RAS donne

16 24 42 18 10041 73 20 16 15051 21 62 16 15062 32 66 40 200

170 150 190 90 600

Myriam Maumy-Bertrand Stratification a posteriori

Page 46: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Ajustement Statistique et Algébrique d’une Matrice (ASAM)

Cette méthode est plus générale et englobe comme casparticulier la méthode RAS.

IdéeSi l’échantillon n’est pas trop mauvais, la structure croiséeobservée doit avoir des similitudes avec la « vraie » structure.

On a un tableau (aij) tel que T =∑

i∑

j aij .On chercher un tableau (xij), proche de (aij) tel que∑

j

xij = ri ,∑

i

xij = sj ,∑∑

xij = T .

Myriam Maumy-Bertrand Stratification a posteriori

Page 47: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

La méthode ASAM consiste en la résolution du programmesuivant

minxij

∑i

∑j

1ρij

(xij − aij)2

avec ∑j

xij = ri ,∑

i

xij = sj ,∑

i

∑j

xij = T .

Les ρij sont à choisir si nous voulons moduler l’importance dechaque case.

Myriam Maumy-Bertrand Stratification a posteriori

Page 48: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

RemarquesLa méthode ASAM est une méthode des moindres carréspondérés et contraints.Il existe des programmes traitant ce genre de problème.Le choix optimal pour les ρij est de les prendreproportionnels aux variances des aij , considérés commedes variables aléatoires

ρij = cVar[aij ].

Myriam Maumy-Bertrand Stratification a posteriori

Page 49: Stratification a posterioriirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/...1 Introduction 2 Principe 3 Exemple 4 Formules d’estimation d’une stratification a posteriori 5

IntroductionPrincipeExemple

Formules d’estimation d’une stratification a posterioriComparaison avec un SAS

Redressements sur critères multiples

Le problèmeLa méthode RASLa méthode ASAM

Suite des remarquesNous prenons dons les ρij représentatifs de ce que nouspouvons connaître des variances des effectifs aij .La méthode RAS est un cas particulier de la méthodeASAM dans le cas où les aij sont proportionnels à leurvariance.La méthode ASAM est plus satisfaisante puisqu’ellerecherche une similitude de structure.Elle est évidemment plus coûteuse.

Myriam Maumy-Bertrand Stratification a posteriori