_etude de marché

Upload: abdelhadi-rhallab

Post on 19-Jul-2015

87 views

Category:

Documents


0 download

TRANSCRIPT

Recensement Collecte des donnes Sondage

Statistique Descriptive Analyse des donnes

Infrence Statistique

Conclusions

Prise des dcisions

Dcouvrir un ensemble doutils statistiques de plus en plus largement utiliss en gestion

Connatre leurs fondements thoriques Savoir interprter leurs rsultats et valuer leur pertinence tre capable de les appliquer concrtement au travers de logiciels spcialiss

Les statistiques : par nature une discipline quantitativeStatistiques descriptives : comment organiser, rsumer, prsenter des donnes. Statistiques infrentielles : comment aboutir une conclusion sur un ensemble de donnes quand on ne possde quune partie de ces donnes (exemple des sondages).

Concepts de basePopulation : ensemble des units statistiques observes. Individu : unit statistique de base ou lment de la population tudies. Caractre ou variable : aspect particulier de lindividu auquel on sintresse et qui pourra prendre diffrentes valeurs selon lindividu concern. Mesurer une variable revient traduire sous la forme dun nombre une rponse ou une caractristique dun individu. Ordre / Distance / Origine

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales

Echelles ordinales

Echelles intervalles

Echelles de proportions

Discrtes

Continues

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales

Echelles ordinales

Echelles intervalles

Echelles de proportions

Etiquette permettant didentifier les individus comme appartenant un groupe donn (relation didentification).

Discrtes

Continues

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales

Echelles ordinales

Echelles intervalles

Echelles de proportions

Echelle de classement tablissant une relation dordre entre des individus et ce par rapport un classement prdfini.

Discrtes

Continues

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales

Echelles ordinales

Echelles dintervalles

Echelles de proportions

Echelle mtrique (quantitative) mais dont la valeur 0 (origine) est fixe arbitrairement.

Discrtes

Continues

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales

Echelles ordinales

Echelles dintervalles

Echelles de proportions

Encore appeles chelles de ratios, ces chelles respectent ratios, toutes les proprits des nombres.

Discrtes

Continues

Les variables peuvent tre de deux naturesQualitatives Quantitatives

Echelles nominales 1=Hommes 2=Femmes

Echelles ordinales 1=Citron 2=Peugeot 3=Renault Intervalles Proportions

Echelles intervalles

Echelles de proportions

Discrtes Catgories Nb denfants

Continues Tempratures Age, taille,...

ECHANTILLONNAGE

Sondage

Mthodes

TailleMarge derreur tolre Degr de confiance

ProbabilistesAlatoire simple Stratifie Par degrs Systmatique

EmpiriquesQuotas

Normalit de la population

Nature de linformation : Quanti (moyenne) ou Quali (proportion)

EnquteEnsemble des oprations de collecte et de traitement de donnes relatives quelques domaines que ce soit.

Population cibleRassemblement de tous les cas qui rpondent un ensemble de caractres spcifiques. Appele aussi univers ou ensemble statistique, cest lensemble des lments auxquels on sintresse.

SondageEnqute incomplte, enqute partielle ou enqute par chantillonnage, cest une enqute au cours de laquelle seulement une partie des units de base de la population sont observe.

EchantillonEnsemble des units de base slectionnes et rellement observes au cours dun sondage.

EchantillonnageEnsemble des oprations qui permettent de slectionner de faon organise les lments de lchantillon.

Base de sondageEnumration ou prsentation ordonne de toutes les units de base constituant la population.

Erreur dchantillonnageEcart entre les rsultats obtenus auprs dun chantillon et ce que nous apprendrait un recensement comparable de la population. Plus la taille de lchantillon est grande plus lerreur dchantillonnage diminue.

Dtermination de la taille de lchantillon

la taille dchantillon dpend essentiellement de deux facteurs : La prcision souhaite : plus on souhaite des rsultats prcis, plus lchantillon ncessaire est important. Le budget disponible : plus on augmente la taille, plus le cot de lenqute saccrot.

Cas dune population de loi inconnueTaille dchantillon pour estimer une moyenne

n

Exemple : Un parc de loisirs souhaite estimer 10dh prs le montant moyen dachats effectus par chaque visiteur. une tude pilote mene sur 50 visiteurs choisis au hasard a montr que lcart- type des achats est : = 100 dh

Si on se fixe un seuil de confiance (1-) = 95%, La taille de lchantillon est donc :

n

100 2000 100,05

Cas dune population de loi inconnueTaille dchantillon pour estimer une proportion

pq n

Exemple : Le parc souhaite estimer la proportion des visiteurs qui font des achats cinq points prs. Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

Si on se fixe un seuil de confiance (1-) = 95%, La taille de lchantillon est donc :

0,650,35 1820 n 0,050,05

Cas dune population normaleTaille dchantillon pour estimer une moyenneCas des prlvements dans une population finie avec remise ou dans une population infinie sans remise

n Z1 2

Exemple : Un parc de loisirs souhaite estimer 10dh prs le montant moyen dachats effectus par chaque visiteur. une tude pilote mene sur 50 visiteurs choisis au hasard a montr que lcart- type des achats est : = 100 dh

Si on se fixe un seuil de confiance (1-) = 95%, La taille de lchantillon est donc :

n 1,96 100 384,16 385 10

Cas dune population normaleTaille dchantillon pour estimer une proportion Cas des prlvements dans une population finie avec remise ou dans une population infinie sans remise

n Z1 2

pq

Exemple : Le parc souhaite estimer la proportion des visiteurs qui font des achats cinq points prs. Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

Si on se fixe un seuil de confiance (1-) = 95%, La taille de lchantillon est donc :

n 1,96 0,650,35 349,58 350 0,05

Cas dune population normaleTaille dchantillon pour estimer une moyenneCas des prlvements dans une population finie sans remise

Z1-2 N n N Z1-2

Cas dune population normaleTaille dchantillon pour estimer une proportion Cas des prlvements dans une population finie sans remise.

Z1- p q N 2 n N Z1-2 p q

Mthodes dchantillonnage- Mthodes dchantillonnage probabilistes - Mthodes dchantillonnage empiriques

Mthodes dchantillonnage probabilistes- Echantillonnage alatoire et simple - Echantillonnage stratifi - Echantillonnage par degrs - Echantillonnage systmatique

Echantillonnage alatoire et simpleUn chantillonnage est alatoire si tous les individus de la population ont la mme chance de faire partie de lchantillon; il est simple si les prlvements des individus sont raliss indpendamment les uns des autres.

Echantillonnage alatoire et simpleSi la population est finie, lchantillonnage alatoire et simple correspond au tirage alatoire avec remise, qui permet de traiter les populations finies comme des populations infinies.

Echantillonnage alatoire et simple- Constituer la base de sondage qui correspond la liste complte et sans rptition des lments de la population ; - Numroter ces lments de 1 N ; Procder, laide dune table de nombres alatoires ou dun gnrateur de nombres pseudo alatoires la slection des units diffrentes qui constitueront lchantillon.

Echantillonnage alatoire et simpleExemple : On souhaite avoir un chantillon alatoire et simple de 5 entreprises parmi une population de 22 entreprises. On dispose de la base de sondage cest dire la liste complte et sans rptition des 22 entreprises numrotes de 1 22. On prend un extrait dune table de nombre alatoire par exemple :

Echantillonnage alatoire et simpleOn choisit au hasard un nombre de la table, supposons ce nombre 06121. Comme N= 22, on va retenir le premier groupe de 2 chiffres, ce qui donne les N : 06, ensuite 12 ; 19 ; 17 ; les nombres (82,77 et 92) sont inutilisables. La cinquime entreprise sera le N 10. 10480 22368 24130 42167 37570 77921 15011 46573 48390 93093 39975 06907 01536 25595 22527 06243 81837 11008 02011 85393 97265 61680 16656 42751 81647 30995 76393 07856 06121 27756 91646 89198 64809 16376 91782 53498

Echantillonnage stratifiLchantillonnage stratifi est une technique qui consiste subdiviser une population htrogne, deffectif N, en P sous populations ou strates plus homognes deffectif Ni de telle sorte que N= N1+N2+. +Np. Un chantillon, deffectif ni, est par la suite, prlev indpendamment au sein de chacune des strates en appliquant un plan dchantillonnage au choix de lutilisateur. Le plus souvent, on procdera par un chantillonnage alatoire et simple lintrieur de chaque strate.

Echantillonnage stratifiLa stratification peut entraner des gains de prcision apprciables, elle facilite en outre les oprations de collecte des donnes et fournit des informations pour diffrentes parties de la population.

Echantillonnage stratifiPour la rpartition de leffectif total, n, de lchantillon dans les diffrentes strates, La premire solution, dite proportionnelle, consiste conserver la mme fraction dchantillonnage dans chaque strate. Une seconde solution, dite optimale, tient compte du budget de lenqute.

Rpartition proportionnelleLa rpartition proportionnelle consiste rpartir la taille de lchantillon n en utilisant la mme fraction de sondage f dans chacune des strates. Cette solution tient compte dun seul facteur qui est le poids de chaque strate.

Rpartition proportionnelle Dsignons par wi le poids de la strate et par f la fraction de sondage constant :

f n N

Ni et wi N

le nombre dunits choisir dans chacune des strates est donc :

ni w i n f Ni

Rpartition proportionnelleExemple : Dans une population de 10000 entreprises, rparties en 5000 petites entreprises, 3000 moyennes entreprises et 2000 grandes entreprises, on souhaite avoir un chantillon de 500 entreprises. Fraction de sondage constante : f = 500 / 10000 = 5 %

Rpartition proportionnelleStrate Petite Moyenne Grande Total Effectif 5000 3000 2000 10000 Taille de lchantillon 5000 * 0,05 = 250 3000 * 0,05 = 150 2000 * 0,05 = 100 500

Rpartition proportionnelleStrate Petite Moyenne Grande Total Effectif 5000 3000 2000 10000 Poids Taille de lchantillon 50% 30% 20% 500 * 0,5 = 250 500 * 0,3 = 150 500 * 0,2 = 100 500

Rpartition optimale- Budget total de lenqute, G - Poids de la strate, wi - Cot de la collecte de linformation dans la strate, ci - Dispersion lintrieur de la strate, mesure par lcart type i.

Rpartition optimalele nombre dunits choisir dans chacune des strates est donn par :

ni k w i i ci

k

G w i i ci

Rpartition optimaleExemple : Dans la population des 10000 entreprises, on a pu avoir les informations suivantes : Strate Petite Moyenne Grande wi 0,5 0,3 0,2 ci 50 75 100 i. 0,8 1,5 2,2

Rpartition optimalele nombre dentreprises choisir dans chacune des strates est donn par :k G 5000 449,42 wi i ci 0,50,8 50 0,31,5 75 0,22,2 100

n1 449,42 0,5 0,8 26 petites entreprises 50 n2 449,42 0,3 1,5 24 moyennes entreprises 75

n3 449,42 0,2 2,2 20 grandes entreprises 100

Echantillonnage par degrsLchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractriss par un systme ramifi et hirarchis dunits.

Echantillonnage par degrsDans le cas de deux degrs, par exemple, on considre que la population est constitue dun certain nombre dunits de sondage du premier degr (units primaires), chacune de ces units tant constitue dun certain nombre dunits du second degr. (units secondaires) On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unit slectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode de slection pouvant varier dun degr lautre.

Echantillonnage par degrsLchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments de toute la population et quil est possible dnumrer les units prleves au premier degr. Il permet une concentration du travail sur le terrain et donc une rduction des cots. Pour un mme nombre total dobservations, il faut citer sa plus faible efficacit que lchantillonnage alatoire et simple.

Echantillonnage par degrsExemple : Pour tudier le niveau de consommation des mnages dune ville, on a tir alatoirement 5 quartiers. Dans chaque quartier slectionn, on retient une rue sur 5, dans chaque rue retenue, on retient un immeuble sur 3, et dans chaque immeuble, un mnage par tage sera questionn.

Echantillonnage systmatiqueLchantillonnage systmatique est une technique qui consiste prlever des units dchantillonnage situes intervalles gaux. Le choix du premier individu dtermine la composition de tout lchantillon.

Echantillonnage systmatiqueSi on connat leffectif total de la population N et quon souhaite prlever un chantillon deffectif n, lintervalle entre deux units successives slectionner est donn par :

k N n

Echantillonnage systmatiqueConnaissant k, on choisit le plus souvent, pour dbuter, un nombre alatoire, i, compris entre 1 et k. le rang des units slectionnes est alors i, i+k, i+2k,

Echantillonnage systmatiqueLchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit le temps consacr la localisation des units slectionnes.

Echantillonnage systmatiqueSi les lments de la population se prsentent dans un ordre alatoire (pas de tendance) lchantillonnage systmatique est quivalent lchantillonnage alatoire et simple. Par contre si les lments de la population prsentent une tendance, lchantillonnage systmatique est plus prcis que lchantillonnage alatoire.

Echantillonnage systmatiqueExemple : On veut slectionner un chantillon de 30 entreprises au sein dune population de 1800 entreprises.

k 1800 60 30Ainsi on va tirer une entreprise toutes les 60 en partant dun nombre tir alatoirement entre 1 et 60. Supposons ce nombre est le 15. On va donc slectionner la 15me entreprise puis la 75me, la 135me. jusqu la 1755me ce qui nous donnera lchantillon de 30 entreprises.

Mthodes dchantillonnage empiriques- Echantillonnage accidentel (De convenance) - Echantillonnage priori - Echantillonnage Boule de neige - Echantillonnage par Quotas

Echantillonnage accidentelIl sagit dun chantillon constitu dindividus qui se trouvaient accidentellement lendroit et au moment o linformation a t collecte. Enqutes ralises dans la rue, les lieux publics, en sortie de super march Questionnaires figurant dans les magasines et renvoys spontanment. Les chantillons accidentels ne peuvent tre considrs reprsentatifs daucune population. Il est risqu de gnraliser une population donne des rsultats obtenus par un chantillon accidentel.

Echantillonnage prioriCest un chantillonnage par jugement priori. Il consiste slectionner des individus dont on pense, avant de les interroger, quils peuvent dtenir linformation. Le risque de ce type dchantillonnage est de considrer des individus, apparemment reprsentatifs de la population tudie.

Echantillonnage Boule de neige Cette mthode est rserve aux populations composes dindividus dont lidentification est difficile ou qui possdent des caractristiques rares. La mthode consiste faire construire lchantillon par les individus eux-mmes. Il suffit den identifier un petit nombre initial et de leur demander de faire appel dautres individus possdant les mmes caractristiques.

Echantillonnage par QuotasLchantillonnage par quotas est lchantillonnage non probabiliste le plus connu, et finalement le mieux accept comme substitut aux mthodes probabilistes dans le cas o ces dernires rencontreraient des contraintes de base de sondage. Mais la reprsentativit de la population tudie reste douteuse.

Echantillonnage par QuotasLchantillonnage par quotas consiste tudier la structure de la population selon des critres choisis (quotas) empiriquement. Lchantillon est ensuite construit de manire constituer une reproduction en miniature de la population sur ces critres.

Echantillonnage par QuotasLchantillonnage par quotas est une forme simplifie de lchantillonnage stratifi fraction de sondage constante. Les quotas reprsentent les variables de stratification. Une fois les quotas sont fixs, les individus sont slectionns la convenance de lenquteur.

Echantillonnage par QuotasLes critres servant de base la dfinition des quotas ne doivent pas tre nombreux. Au-del de 3 critres, la dmarche devient complexe. Les quotas doivent tre construits sur une base de donnes fiables ( statistiques disponibles ) indiquant la rpartition de la population sur les critres choisis. Les critres les plus utiliss dans les tudes de march sont conomiques et sociodmographiques en particulier lge, le sexe, la catgorie socioprofessionnelle,

Echantillonnage par Quotas : ExempleOn souhaite avoir un chantillon de 1000 individus. La structure de la population selon trois critres est la suivante : Age Structure de Rpartition de la population lchantillon 20 29 ans 30 49 ans 50 60 ans Total 40 % 35 % 25 % 100 % 400 350 250 1000

Echantillonnage par Quotas : ExempleStructure de la populationAge Sexe Masculin Fminin Total

20 29 ans

48 %

52 %

100 %

30 49 ans

49 %

51 %

100 %

50 60 ans

45 %

55 %

100 %

Echantillonnage par Quotas : ExempleRpartition de lchantillonAge Sexe Masculin Fminin Total

20 29 ans

192

208

400

30 49 ans

172

178

350

50 60 ans

113

137

250

AGE

Sexe

Sans

Etudiant

Agric

Artisans

Prof librales

Employs

Ouvriers

Total

CSP 20-29 M 10% 30% 5% 6% 9% 25% 15% 100%

F

15%

25%

2%

10%

8%

30%

10%

100%

30-49

M

8%

5%

15%

22%

15%

15%

20%

100%

F

20%

4%

10%

16%

14%

24%

12%

100%

50-60

M

6%

2%

25%

22%

18%

17%

10%

100%

F

35%

1%

20%

20%

6%

13%

5%

100%

AGE

Sexe

Sans

Etudiant

Agric

Artisans

Prof librales

Employs

Ouvriers

Total

20-29

CSP M

19

58

10

12

17

48

28

192

F

31

52

4

21

17

62

21

208

30-49

M

14

9

26

38

26

26

33

172

F

36

7

18

28

25

43

21

178

50-60

M

7

2

28

25

20

19

12

113

F

48

1

27

27

8

18

8

137

Test de reprsentativit de lchantillonPour valider les rsultats de l'tude, et pour minimiser la marge d'erreur, il est indispensable de vrifier la reprsentativit de lchantillon.

Test de reprsentativit de lchantillon- Mise en tableau des rsultats - Test de reprsentativit

Mise en tableau des rsultatsIl faut dans un premier temps laborer un tableau dans lequel seront notes les donnes thoriques concernant la population totale, ainsi que les donnes relatives l'tude, ce tableau est appel tableau de test de reprsentativit.

Test de reprsentativitAppel test dajustement ou test Khi-deux, ce test est destin tester si lchantillon observ peut tre considr comme reprsentatif de la population tudie. Pour cela on a besoin de connatre les caractristiques de la population. Le test d'ajustement consiste calculer la valeur de la statistique khideux qui permet d'valuer les carts entre les frquences observes dans l'chantillon et les frquences thoriques correspondantes la population tudie. Lorsque les carts seront petits, on acceptera la reprsentativit, sinon on la rejettera.

Test de reprsentativit- Formuler une hypothse nulle - Calculer la valeur de Khi-deux observ - Dterminer la valeur de Khi-deux thorique - Rsultat du test de reprsentativit

Formuler une hypothse nulle

lchantillon observ est reprsentatif de la population tudie.

Calculer la valeur de Khi-deux observ

(effectif observ - effectif thoriq ue) Khi deux effectif thorique

Dterminer la valeur de Khideux thoriqueOn se fixe un seuil de confiance , on se reporte la table de distribution de Khideux, et on cherche la valeur correspondante une probabilit gale (1) et un nombre de "degrs de libert (ddl)" gale au nombre de caractristiques de la population moins 1.

Rsultat du test de reprsentativitla valeur de Khi-deux observ est nulle lorsque les frquences observes sont toutes gales aux frquences thoriques, cest dire lorsquil y a une concordance parfaite entre lchantillon observ et la population tudie. Cette valeur est dautant plus grande que les carts entre les frquences observes et thoriques sont plus grands. Il dcoule de la comparaison du Khi-deux observ et du Khi-deux thorique :

Rsultat du test de reprsentativit- Si Khi-deux thorique est strictement suprieur au Khi-deux observ, l'hypothse nulle est accepte. Donc l'chantillon est reprsentatif de la population tudie. - Si Khi-deux thorique est infrieur ou gal au Khi-deux observ, l'hypothse nulle est rejete. En d'autres termes, l'chantillon nest pas reprsentatif. Il faut donc raliser un redressement d'chantillon.

Test de reprsentativit : exempleUne enqute a t ralise au prs dun chantillon de 400 individus prlev au sein dune population cible de 4 millions d'individus. Les donnes que l'on possde sur cette population sont les suivantes : Hommes 48% soit 1,92 millions dhommes Femmes 52% soit 2,08 millions de femmes

Test de reprsentativit : exempleSexe Hommes Femmes Total Niveau dinstruction % Effectifs % Effectifs

Aucun Primaire Secondaire Formation professionnelle Suprieur

35 30 15 13 7

672000 576000 288000 249600 134400

50 25 10 10 5

1040000 520000 208000 208000 104000

1712000 1096000 496000 457600 238400

Total

100

1920000

100

2080000

4000000

Test de reprsentativit : exempleCaractristiques de lchantillon :Sexe Hommes Femmes Total Niveau dinstruction % Effectifs % Effectifs

Aucun Primaire Secondaire Formation professionnelle Suprieur

32 28 18 14 8

61 54 35 27 15

54 23 12 8 3

112 48 25 17 6

173 102 60 44 21

Total

100

192

100

208

400

Test de reprsentativit : exempleMise en tableau des rsultatsSexe Hommes Femmes Niveau dinstruction Effectifs thoriques Effectifs observs Effectifs thoriques Effectifs observs

Aucun Primaire Secondaire Formation professionnelle Suprieur

67,2 57,6 28,8 24,96 13,44

61 54 35 27 15

104 52 20,8 20,8 10,4

112 48 25 17 6

Total

192

192

208

208

Test de reprsentativit : exempleHypothse nulle : lchantillon observ est reprsentatif de la population tudie.

Test de reprsentativit : exempleKhi-deux observ = [(61-67,2)/67,2 + (5457,6)/57,6 + (35-28,8)/28,8 + (2724,96)/24,96+(15-13,44)/13,44+ (112104)/104+(48-52)/52+(2520,8)/20,8+(17-20,8)/20,8+(6-10,4)/10,4] Khi-deux observ = 6,80

Test de reprsentativit : exempleKhi-deux thorique : si on se fixe un seuil de confiance =5%, on se reporte la table de distribution de Khi-deux, et on cherche la valeur correspondante une probabilit gale (1)=0,95 et un nombre de "degrs de libert (ddl)" gale (10-1)=9, on trouve : Khi-deux thorique = 16,92

Test de reprsentativit : exempleRsultat du test de reprsentativit Khi-deux thorique est strictement suprieur au Khi-deux observ, l'hypothse nulle est accepte. Donc l'chantillon est reprsentatif de la population tudie.

Redressement de lchantillonSi l'chantillon slectionn n'est pas reprsentatif de la population tudie, aprs le test, il est ncessaire de le redresser. On redressera l'chantillon si par exemple certaines caractristiques de la population sont surreprsentes ou sous-reprsentes. On peut ainsi tirer de l'chantillon original un chantillon reprsentatif.

Redressement de lchantillonPour redresser l'chantillon, il existe deux mthodes distinctes : - Redressement par extraction - Redressement par substitution

Redressement par extractionLa mthode dite par extraction limine tous les individus au-del du pourcentage obtenir. L'effectif de l'chantillon est donc d'autant plus rduit que les pourcentages thoriques sont diffrents des pourcentages observs. Cette mthode permet d'aboutir un chantillon plus reprsentatif mais au risque d'obtenir un chantillon ridiculement petit ou mme une impossibilit de traitement (le nombre minimum de questionnaires ncessaire pour traiter une tude est de 60. D'autre part, pour valider les rsultats et pour effectuer des calculs statistiques, il faut au minimum 5 effectifs par classe.).

Redressement par extraction : Exemple1200 personnes interroges pour une tude concernant l'attitude de la population face un produit suivent la distribution suivante : HOMMES: 55% soit 660 interrogs FEMMES: 45% soit 540 interrogs Or, la population totale a une distribution : HOMMES:45% soit 540 pers. interroger FEMMES: 55% soit 660 personnes interroger.

Redressement par extraction : ExempleAprs redressement, on aura : HOMMES: 660-120=540 individus. FEMMES: 540 individus. (rsultat inchang) D'o une meilleure rpartition : HOMMES: 50% soit 540 individus FEMMES: 50% soit 540 individus

Redressement par extractionCette mthode a le trs gros inconvnient de faire fondre l'chantillon original. Dans l'exemple, nous avons perdu 120 individus sonds. La prcision des estimations des rsultats s'en trouve fatalement affecte par ce procd, tout se passe comme si on avait interrog un plus petit nombre de personnes. Mais, on obtient une meilleure reprsentativit de la population. La mthode par extraction est intressante si la taille de lchantillon est suprieure 1000.

Redressement par substitutionA l'oppos, la mthode par substitution remplace comme son nom l'indique, tout individu en surnombre dans une modalit sur reprsente par un individu choisi au hasard dans une modalit sous-reprsente. Ce dernier se trouve donc dupliqu. L'effectif de l'chantillon est maintenu, contrairement la mthode par extraction ( on a vu que l'on tait pass dans l'exemple d'un chantillon de 1200 individus un chantillon de 1080), mais au prix de nombreuses duplications qui tendent uniformiser l'chantillon. En fait, tout se passe comme si les individus des catgories sousreprsentes avaient t interroges plusieurs fois.

Redressement par substitutionLes imperfections de l'chantillon sont limines sans risque apparent puisque la taille de l'chantillon ne se trouve pas affecte. La mthode par substitution est valable si le diffrentiel de redressement est infrieur 30%.

Redressement par substitution : ExempleLa population totale compte : HOMMES : 45% FEMMES : 55%

L'chantillon de 2000 individus tudis compte : HOMMES : 740 individus (37%) ; FEMMES : 1220 individus (61%) ; NREP :40 individus (2%)

Redressement par substitution : ExempleOn pose le tableau suivant : OBTENUS SOUHAITES DIFFERENCE % Nbre % Nbre S-O 2 40 0 0 -2% 1220 55 1100 -6% 740 45 900 +8%

NREP FEMMES 61 HOMMES 37

DIFFERENCIEL DE REDRESSEMENT= 2%+6%+8%=16%.

Redressement par substitution : ExempleL'chantillon redress correspond ici au nombre souhait : HOMMES : 45% FEMMES : 55% 900 individus. 1100 individus.

La rpartition par sexe correspond alors celle de la population totale. On remarque ici que le diffrentiel de redressement est infrieur 16%, ce qui est un bon rsultat et qui ne remet pas en questions la validation des observations.

Redressement de lchantillon - la mthode par extraction est intressante si on sonde plus de 1000 personnes - la mthode par substitution est valable si le diffrentiel de redressement est infrieur 30%. - Si l'chantillon n'est pas reprsentatif, et quon ne peut utiliser aucune des mthodes, il nous faut administrer de nouveaux questionnaires. C'est pourquoi il faut vrifier le plus tt possible la reprsentativit de l'chantillon et tout de suite le redresser.

ELABORATION DU QUESTIONNAIRE

ELABORATION DU QUESTIONNAIREUn questionnaire est un ensemble de questions construit dans le but de gnrer linformation ncessaire laccomplissement des objectifs dune tude. La caractristique essentielle dun questionnaire est dtre un instrument de standardisation de linformation collecte dans une enqute. En effet si chaque rpondant voit ou entendra les mmes questions, les informations recueillies, cest dire les rponses, seront donc comparables pour lensemble des rpondants.

ELABORATION DU QUESTIONNAIRELa construction dun questionnaire, dans son fond comme dans sa forme, doit inciter le rpondant cooprer, se sentir impliqu et donner des rponses compltes et exactes aux questions qui lui sont poses.

Rgles lies au fond du questionnaireLe contenu du questionnaire dpend des objectifs de ltude, et des hypothses de travail que lon aura formules. Le questionnaire sera construit partir dune liste des informations rechercher. Cette dmarche permet de noublier aucune information importante tout en vitant les questions inutiles.

Les types de questions- Les questions ouvertes - Les questions fermes - Echelles catgories spcifiques

Les questions ouvertesUne question ouverte laisse lindividu interrog totalement libre du choix de sa rponse dans sa forme et dans sa longueur. On distingue 2 types de questions ouvertes :

Les questions ouvertesQuestions rponses numriques. - Quel ge avez-vous ? - Combien denfant charge avez-vous ? - Combien de Km par mois effectuez-vous avec votre voiture ? Ces questions ne posent pas de problmes.

Les questions ouvertesQuestions rponse littraire- Quel est votre profession ? - Quels marques dordinateurs connaissez-vous ? Il faut sefforcer de se limiter des questions pour les quelles la rponse tient en un seul mot ou groupe de mots. Si la rponse prend la forme dun discours, la mise en forme de linformation en vue dun traitement devient complique.

Les questions fermesLes questions fermes sont des questions pour les quelles on impose au rpondant une forme prcise de rponse et un nombre limit de choix de rponses. On distingue trois types de questions fermes :

Les questions fermesQuestions dichotomiquesCes questions offrent 2 choix de rponse, celle ci doit tre unique, cest lun ou lautre. Sexe ? 1. Masculin

2. Fminin

Avez vous un compte bancaire ? 1. oui 2. non Ces questions se prtent bien aux traitements statistiques.

Les questions fermesQuestions au choix multiples et rponse unique Le rpondant dispose dune liste de choix mais sa rponse doit tre unique. Les modalits de la liste doivent tre exhaustives et mutuellement exclusives.

Les questions fermesQuelle est votre situation familiale ? 1. Clibataire 2. Mari 3. Divorc 4. Veuf 5. Spar

Les questions fermesQuestions au choix multiples et rponses multiples Le rpondant est autoris slectionner plusieurs des possibilits proposes dans une liste. Pour traiter ce type de questions, il est prfrable denvisager chaque modalit comme une question dichotomique avec rponse oui/non.

Les questions fermesParmi les raisons suivantes indiquez celles qui vous guident dans le choix dune destination touristique : 1. environnement naturel 2. dpaysement 3. culture 4. rputation culinaire 5. sites archologiques 6 .autres (prciser)

Echelles catgories spcifiques- Echelle de Likert - Diffrentiel smantique - Echelles supports smantiques - Echelles dintention

Echelle de LikertCette chelle a pour but de mesurer lattitude dun individu celui-ci attribut une liste de propositions relatives lobjet tudi une note indiquant son degr daccord ou de dsaccord, avec chacune des propositions nonces.

Echelle de LikertPour vous, protger lenvironnement a consiste : Pas ni en accord daccord ni en dsaccord Utiliser des lessives sans 1 2 3 4 5 Phosphates. Traiter les Dchets Mnagers. Acheter des produits emballs. tout fait daccord 6 7

1

2

3

4

5

6

7

1

2

3

4

5

6

7

Diffrentiel smantique

Cette chelle consiste demander au rpondant de se situer quelque part entre deux objectifs de sens parfaitement oppos.

Diffrentiel smantiqueExtrmem ent Trs Assez Sans opinion Assez Trs Extrmem ent

Agrable

1

2

3

4

5

6

7

Dsagrab le

Active

1

2

3

4

5

6

7

Inactive

Moderne

1

2

3

4

5

6

7

Dpass

Proche du public

1

2

3

4

5

6

7

Eloigne du public

Echelles supports smantiques

Le principe est de btir, pour une population donne, une chelle dont les libells sont des distances, psychologiquement gales lun de lautre.

Echelles supports smantiquesComment jugez-vous le confort de ces diffrentes voitures ? Marque Extrmement Mauvais BMW Ford 0 0 10 10 20 20 Faible moyen Bon Extrmement Bon 60 70 60 70 80 80 90 100 90 100

30 40 50 30 40 50

Echelles dintention

Ces chelles ont pour but de recueillir une intention dclare de comportement de la part du rpondant.

Echelles dintentionSi une salle de sport ouvrait prs de chez vous feriez vous du sport ?

Certainement pas 0

peu probable

probable

fort certainement probable 100

10 20 30

40 50 60 70 80 90

Rgles lies la forme du questionnaire Rdaction du questionnaire Le vocabulaire et le style utiliss pour la rdaction dun questionnaire doivent tre ceux employs par les rpondants et non ceux du rdacteur.

Rgles lies la forme du questionnaire Rdaction du questionnaireTout vocabulaire technique est viter, sauf si ltude est mene auprs de spcialistes. Tout vocabulaire ambigu est viter, cest dire tout mot ou expression dont la comprhension prte confusion soit parce quil possde plusieurs sens, soit parce quil est subjectif. Lambigut peut galement provenir dutilisations diffrentes dun mme mot selon la rgion, la classe sociale ou la classe dge. Le vocabulaire employ doit tre le plus simple le moins ambigu et adapt la population concerne par ltude.

Rgles lies la forme du questionnaire Style de rdactionIl est frquent que le style de rdaction soit source de biais, soit dans la comprhension des questions, soit dans les rponses. Il faut viter les questions contenant une ngation ou double ngation. En plus de sa complexit, il y a le risque dorienter la rponse dans un sens particulier. Il faut aussi viter les questions tendancieuses, par exemple la tendance naturelle dire oui. Une question ne doit tre longue, elle ne doit pas dpasser une ligne une ligne et demi.

Rgles lies la forme du questionnaire Structure du questionnaire La structure du questionnaire concerne lordre dapparition des questions, la longueur et la prsence de questions spciales. Il se structure autour de six points :

Rgles lies la forme du questionnaire Structure du questionnaire 1. Prsentation de lenquteur et de lenqute 2. Questions dintroduction 3. Questions qualifiantes 4. Questions de mise en route 5. Questions spcifiques 6. Questions didentification

1. Prsentation de lenquteur et de lenquteOrganisme charg de ltude Commanditaire de ltude Intrt de ltude Objectifs de ltude

2. Questions dintroductionleur but est dinitier la conversation et gagner la sympathie du rpondant et lintresser au questionnaire qui va suivre. Il sagit de questions gnrales souvent ouvertes.

3. Questions qualifiantesElles sont utiles si on a besoin de savoir si lindividu possde linformation recherche. Elles sont souvent de forme dichotomique. Elles permettent dorienter le rpondant des parties spcifiques du questionnaire.

4. Questions de mise en routeElles servent centrer progressivement le thme de ltude. On commence par des questions simples, petit petit les questions deviennent plus complexes.

5. Questions spcifiquesCest le cur du questionnaire, les questions doivent amener les informations les plus importantes pour ltude. A ce stade, le rpondant sest imprgn de lesprit de ltude et a nou une relation de sympathie avec lenquteur, on peut donc lui demander des efforts de rflexion ou des informations personnelles.

6. Questions didentification

Elles dcrivent les rpondants. Cette partie fournit les informations qui serviront classer les rpondants en groupes distincts. Il sagit de variables de segmentation.

Mise en page du questionnaire- Arer les questions ; - Utiliser de temps autre des symboles; - Soigner la typographie du texte : gras italique soulign; - Imprimer sur du papier de qualit, avec en tte de lorganisme responsable de ltude; - Utiliser, si ncessaire, de la couleur.

Codage du questionnaireLe codage dun questionnaire a pour but de faciliter la transformation des informations dun tat brut un tat qui va permettre leur traitement statistique. Normalement, le codage doit tre fait ds la rdaction des questions. La codification vise faciliter la saisie, et lanalyse des donnes. Elle consiste donner chaque rponse un code. (un chiffre, une lettre ou les deux)

Codage du questionnaire- Identification des variables relatives chaque question. - Prvoir un code pour les non-rponses Ce code indique que linformation recherche na pas pu tre recueillie. Le rpondant refuse ou oublie de rpondre, lenquteur oublie de reporter la rponse. Eviter dutiliser le code zro. On doit utiliser un code qui ne peut pas tre utilis comme rponse. De prfrence retenir le mme code pour tout le questionnaire. Par exemple 99.

Codage du questionnaire- Prvoir lidentification individuelle du questionnaire et de lenquteur Cette identification permet un contrle posteriori de la qualit du travail effectu.

Codage du questionnaireLes questions fermes sont codifies au moment de llaboration du questionnaire. Les questions ouvertes sont codifies aprs ladministration de tous les questionnaires. Il est prfrable de lire un chantillon ou la totalit des questionnaires avant de dcider la codification en fonction des gammes de rponses.

Codage du questionnaireLe code doit avoir les caractristiques suivantes : - La fiabilit : une mme rponse doit avoir le mme code; - Lexhaustivit : le code doit tre complet; - Lexclusivit : une rponse donne ne doit pas avoir plus quun code.

Codage du questionnaireLe codage doit se faire directement sur le support de lenqute. Un contrle est ncessaire pour dtecter et corriger les erreurs qui peuvent se produire lors de la codification. Pour cela, un double codage est parfois intressant, si non un contrle dun chantillon alatoire de questionnaires est ncessaire.

Pr-test du questionnaireLe but du pr-test est de dtecter les erreurs et le disfonctionnement du questionnaire avant le travail sur le terrain. Le pr-test consiste administrer les questionnaires un chantillon rduit dans les mmes conditions du terrain.

Pr-test du questionnaireLe pr-test peut se raliser de deux faons : - Pr-test dclar - Pr-test non dclar

Administration des questionnaire- Slection des enquteurs - Formation des enquteurs - Motivation des enquteurs - Contrle des enquteurs

Dpouillement des questionnaires- SAISIE - CONTROLE - ANALYSE DES DONNEES

SAISIELa saisie consiste reporter les codes sur un support informatique sous forme dune matrice de donnes (variables/individus) en utilisant un programme adquat. Cette opration ncessite une concentration extrme et un contrle svre.

CONTROLELe contrle consiste dtecter parmi les donnes saisies ceux jugs errons pour les corriger ou les liminer. Cette opration est appele puration des donnes, Elle comporte les deux tapes suivantes :

CONTROLE- Contrle de validit - Contrle de cohrence

Contrle de validitIl consiste vrifier pour chaque variable si les codes ou les donnes saisis correspondent bien aux codes prvus lors de la codification ou au domaine de dfinition de la variable.

Contrle de cohrenceIl consiste vrifier la cohrence des renvois prvus dans le questionnaire, cest dire vrifier pour certaines variables si les codes ou les donnes saisis concordent bien avec les codes ou les donnes saisis dautres variables.

ANALYSE DES DONNEES- Prsenter sous forme exploitable (tableaux statistiques, graphiques, diagrammes, etc..) C'est ce qu'on appelle la statistique descriptive. - Substituer cet ensemble de renseignements quelques donnes simples, comparer cette reprsentation simplifie des rpartitions thoriques, et tenter de donner une explication du phnomne observ et en vrifier le bien fond. - Interprter, conclure et dfinir avec prcision le degr de confiance accorder aux conclusions gnrales induites partir des faits observs.

ANALYSE DES DONNEESLanalyse des donnes peut faire l'objet d'une variable, et on parlera danalyse unidimensionnelle. Elle peut concerner deux variables, on parle alors danalyse bidimensionnelle. Elle peut concerner plusieurs variables, on parle alors danalyse multidimensionnelle.

ANALYSE UNIVARIEE STATISTIQUE DESCRIPTIVE

Tableaux de frquences

GraphiquesBarres

Rduction des donnes

Donnes discrtes

Secteurs Btons

Position

Dispersion

Donnes en classes

Polygone Histogramme Forme

ANALYSE BIVARIEE Relation entre deux variables

Corrlation

Indpendance

Tests statistiques

Coefficient de corrlation

Test Khi deux

Paramtriques

Non paramtriques Test de signification Tableau crois

TESTS STATISTIQUES

Tests paramtriques

Tests non paramtriquesTest de conformit dune proportion

Test de conformit dune moyenne

Test dgalit de deux proportions Test dgalit de deux moyennes Test de comparaison de plusieurs proportions

Principe dun test statistique

1. Formuler des hypothses : Hypothse nulle H0 : = Hypothse alternative H1: < ou > (unilatral) ou (bilatral) 2. Calculer une valeur de dcision ou une probabilit de signification. 3. Dcision : On rejette H0 si valeur de dcision valeur tabule On rejette H0 si probabilit de signification seuil de signification

ANALYSE MULTIVARIEEY-a-t-il une variable expliquer et une ou plusieurs variables explicatives ?

NONMthodes descriptives

OUIMthodes explicatives

Les variables sont elles quantitatives ?

OUI

La variable expliquer est-elle quantitative ?

NON

OUI

NON OUI

Les variables explicatives sont-elles quantitatives ?

Les variables explicatives sont-elles quantitatives ?

NON OUI NONAnalyse conjointe

Analyses factorielles (A.C.P. et A.F.C.)

Analyse des correspondances (A.C.M.)

Rgression linaire

Analyse de la variance

Analyse discriminante

Typologie