statistique descriptive s1

68
STATISTIQUE DESCRIPTIVE CHAPITRE 1 : LES TABLEAUX ET REPRÉSENTATIONS GRAPHIQUES Facebook : https://www.facebook.com/pages/Economie/232025116887158

Upload: abdlhakim-fallatte

Post on 28-Dec-2014

1.888 views

Category:

Design


7 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Statistique Descriptive s1

STATISTIQUE DESCRIPTIVE

CHAPITRE 1 : LES TABLEAUX ET

REPRÉSENTATIONS

GRAPHIQUES

Facebook : https://www.facebook.com/pages/Economie/232025116887158

Page 2: Statistique Descriptive s1

OBJECTIFS DE CE MODULE

Savoir décrire et

représenter une série

statistique par un

tableau et un ou

plusieurs graphiques

adaptés.

On fera des choix des

représentations

différents selon la nature

du caractère.

Statistiques descriptives à une variable : représentations

Page 3: Statistique Descriptive s1

INTRODUCTION

La représentation tabulaire est préalable à toute

analyse statistique.

Elle fait suite au travail préliminaire de collecte des

données.

La représentation graphique d’un seul caractère

repose sur une règle de proportionnalité des hauteurs

ou aires des graphiques aux effectifs (ou fréquences).

Le choix d’un type de graphique dépendra de la nature

du caractère étudié.

Page 4: Statistique Descriptive s1

PLAN DU CHAPITRE 1

I. Caractères qualitatifs.

II. Caractères

quantitatifs discrets.

III. Caractères

quantitatifs continus.

Voici les parties que nous allons aborder :

Page 5: Statistique Descriptive s1

PLAN DE LA PARTIE

1. Représentation tabulaire.

2. Diagramme à bande.

3. Diagramme circulaire.

Voici les chapitres que nous allons aborder :

Ⅰ. Caractères qualitatifs

Page 6: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

Tableau à simple entrée, sans hiérarchie (sauf si

le caractère est ordinal).

La première colonne renseigne les modalités et

les deux suivantes les effectifs et fréquences.

Si le caractère est ordinal, on pourra rajouter une

dernière colonne avec les fréquences cumulées.

Ⅰ. Caractères qualitatifs

Page 7: Statistique Descriptive s1

Noms Situation de famille

M.Azim Marié

MFarid Veuf

Mme Latifi Mariée

Melle Fatiha Célibataire

M. Ahmed Divorcé

M. Salih Marié

M. Berrada Divorcé

Mme Réda Divorcée

Melle Fatiha Célibataire

M. Halim Marié

M. Chadi Veuf

Mme Faouzi Mariée

... ...

Exemple: On a noté la situation familiale des

150 employés d'une

entreprise.

1. Représentation tabulaire

Ⅰ. Caractères qualitatifs

Page 8: Statistique Descriptive s1

On ne s'intéresse pas à la situation personnelle

de M. Azim ou de M. Farid, mais à la

répartition du caractère "situation familiale"

dans la population des 150 employés.

Pour cela il faut, pour chacune des modalités de

la variable, déterminer l'effectif correspondant,

c'est-à-dire le nombre de personnes ayant cette

modalité : il faut dénombrer le nombre de

célibataires, le nombre de mariés, etc..

Page 9: Statistique Descriptive s1

Cela peut se résumer par :

Modalités Effectifs

Marié 80

Célibataire 30

Veuf 20

Divorcé 20

Page 10: Statistique Descriptive s1

On notera x1, x2, ..., xk les différentes modalités, et

n1, n2, ... , nk les effectifs associés.

Dans le tableau ci-dessus, x1 = "marié",

n1 =

k =

La somme des effectifs vaut :

La variable que nous venons de voir

est…

Page 11: Statistique Descriptive s1

On aurait pu tout aussi bien présenter les résultats sous la

forme ci-dessus, par exemple.

Modalité Effectif

Célibataire 30

Marié 80

Divorcé 20

Veuf 20

Page 12: Statistique Descriptive s1

Par contre, s'il s'agit d'une variable ordinale, les modalités

sont toujours présentées dans l'ordre :

x1 < x2 < .... < xk , comme dans l'exemple ci-dessous.

Modalités = tailles

Effectifs = Nombre de personnes de

cette taille

XS 10

S 25

M 40

L 32

XL 23

XXL 20

Page 13: Statistique Descriptive s1

L'ensemble des couples

{ (xi , ni ), i = 1, ... , k }

est une série statistique (ordonnée), ou distribution observée de la variable.

La somme de tous les ni est-elle toujours égale à n, nombre des observations ?

On notera ceci :

effectif total

Page 14: Statistique Descriptive s1

On appellera fréquence relative la valeur

que l'on peut aussi exprimer en pourcentage par fi x

100, c'est le pourcentage d'individus pour lesquels la

variable a pris la valeur xi.

Page 15: Statistique Descriptive s1

COMPLÉTEZ LE TABLEAU :

Modalités xi Effectif ni Fréquence relative fi %

Célibataire 30 0.2 20

Marié 80

Divorcé 20

Veuf 20

Effectif total : 150

A quoi est égal ici le total de la colonne fréquence ?

Et celui de la colonne "pourcentage" ?

Il y a, parmi les 150 employés, …….% qui sont mariés.

Page 16: Statistique Descriptive s1

2. DIAGRAMME À BANDES

Aussi appelé représentation par « tuyaux d’orgue ».

Les modalités sont placées sur un axe horizontal.

Les effectifs (ou fréquences) sont placés sur un axe vertical.

La hauteur de chaque tuyau est proportionnelle à l’effectif correspondant.

Permet de comparer d’un « coup d’œil » les différentes modalités.

Ⅰ. Caractères qualitatifs

Page 17: Statistique Descriptive s1

0

10

20

30

40

50

60

70

80

90

cadres ouvriers employés ouvriers

Série1

CSP ni fi

Cadres 10 0,05

Agents de maîtrise 40 0,2

Employés 60 0,3

Ouvriers 90 0,45

Page 18: Statistique Descriptive s1

3. DIAGRAMME CIRCULAIRE

L’aire, et donc l’angle au centre d’un secteur, est

proportionnelle à la fréquence (ou l’effectif) de la

modalité considérée (d’où un angle de fi x 360°

pour la modalité i).

Permet de bien visualiser la part relative de

chaque modalité.

Ⅰ. Caractères qualitatifs

Page 19: Statistique Descriptive s1
Page 20: Statistique Descriptive s1

Ⅱ. CARACTÈRES QUANTITATIFS

DISCRETS

Statistiques descriptives à une variable : représentations

Page 21: Statistique Descriptive s1

PLAN DE LA PARTIE

1. Représentation tabulaire.

2. Diagramme bâton.

3. Courbe des fréquences cumulées.

Voici les chapitres que nous allons aborder :

Ⅰ. Caractères quantitatifs discrets

Page 22: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

Tableau à simple entrée, où les données sont

classées par ordre croissant.

La première colonne renseigne les différentes

valeurs du caractère, et les trois suivantes les

effectifs, fréquences et fréquences cumulées.

Ⅰ. Caractères quantitatifs discrets

Page 23: Statistique Descriptive s1

De même, pour une variable discrète, on notera

x1 , x2 , ... , xk les valeurs rangées par ordre

croissant, et n1 , n2 , ... , nk les effectifs

correspondants.

Page 24: Statistique Descriptive s1

Noms Nombre d'enfants

M.Azim 2

MFarid 3

Mme Latifi 0

Melle Fatiha 0

M. Ahmed 1

M. Salih 0

M. Berrada 1

Mme Réda 0

Melle Fatiha 2

M. Halim 4

M. Chadi 1

Mme Faouzi 3

M. Ali 2

Melle Loubna 0

M Fatih 0

M. Said 1

M. Radi 2

Mme Faraj 2

Page 25: Statistique Descriptive s1

Ainsi, à partir de la série brute ci-dessus,

construisez le tableau :

Nombre d'enfants xi Effectifs ni

0 6

Page 26: Statistique Descriptive s1

Nombre d'enfants xi Effectif ni Fréquence relative fi

0 6 0.33

1 4 0.22

2 5 0.28

3 2 0.11

4 1 0.06

Total : 18 1

Page 27: Statistique Descriptive s1

Voyons un autre exemple : Pour étudier les appels

téléphoniques arrivant à un central, on a noté, sur

96 jours comparables, le nombre d'appels reçus

entre 9 h et 9 h 10. Les résultats sont consignés

dans ce tableau :

Page 28: Statistique Descriptive s1

QUELLE EST LA PROPORTION DE JOURS OÙ

LE NOMBRE D'APPELS A ÉTÉ DE 2 ?

Nombre

d'appels xi

Nombre de

jours ni

Fréquence

relative fi % fi 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 29: Statistique Descriptive s1

QUELLE EST LA PROPORTION DE JOURS OÙ LE NOMBRE

D'APPELS A ÉTÉ SUPÉRIEUR OU ÉGALE À 3?

Nombre

d'appels x i

Nombre de

jours n i

Fréquence

relative fi % fi 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 30: Statistique Descriptive s1

COMBIEN Y-A-T-IL EU DE JOURS OÙ LE NOMBRE D'APPELS

A ÉTÉ INFÉRIEUR OU ÉGAL À 2 ?

Nombre

d'appels xi

Nombre de

jours ni

Fréquence

relative fi % fi 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 31: Statistique Descriptive s1

Plus généralement, si

{ (xi , ni ), i = 1, ..., K }

est la distribution observée d'une variable discrète, n1

+ n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi..

On peut calculer Ni de proche en proche :

N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ...

Les Ni sont les effectifs cumulés croissants.

Page 32: Statistique Descriptive s1

De même ni + ni+1 + ... + nk = N'i est le nombre

d'individus pour lesquels la variable a été

supérieure ou égale à xi.

Il peut se calculer de proche en proche :

N'k = nk , N'k-1 = nk + nk-1 ,

Les N'i sont les effectifs cumulés décroissants.

Page 33: Statistique Descriptive s1

On peut définir de même :

Fi = f1 + f2 + ... + fi , fréquences relative

cumulées croissantes obtenues de proche en

proche par Fi+1 = fi+1 + Fi

F'i = fi + fi+1 + ... + fk , fréquences relative

cumulées décroissantes obtenues de proche

en proche par F'i = F'i+1 + fi

Fi et F'i peuvent s'exprimer aussi en

pourcentage (en multipliant tout par 100).

Page 34: Statistique Descriptive s1

COMPLÉTEZ LE TABLEAU :

Nombre

d'appels

Fréquence

relative en %

Fréquences relative

cumulées croissantes

Fréquences relative cumulées

décroissantes

0 2.08 2.08

1 14.58 16.66 97.92

2 23.96 83.34

3 25.00 65.62 59.38

4 18.75 84.37

5 9.38 93.75 15.63

6 6.25 6.25

Page 35: Statistique Descriptive s1

2. DIAGRAMME BÂTON

Diagramme bâton des effectifs

A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif.

Cette représentation permet de comparer les effectifs de chaque valeur du caractère.

Ⅰ. Caractères quantitatifs discrets

Page 36: Statistique Descriptive s1
Page 37: Statistique Descriptive s1

3. COURBE DES FRÉQUENCES CUMULÉES

Représente l’évolution des fréquences cumulées.

Le caractère étant discret, la courbe est en

« escalier ».

En effet, les valeurs étant séparées, entre

chacune d’elle la fréquence cumulée est

inchangée, d’où ces paliers.

Ⅰ. Caractères quantitatifs discrets

Page 38: Statistique Descriptive s1

3. COURBE DES FRÉQUENCES

CUMULÉES

Diagramme en Escalier

0

20

40

60

80

100

120

0 1 2 3 4 5 6 7

Fré

qu

en

ce r

ela

tive c

um

ulé

e

Ⅰ. Caractères quantitatifs discrets

Page 39: Statistique Descriptive s1

Ⅱ. CARACTÈRES QUANTITATIFS

CONTINUS

Statistiques descriptives à une variable : représentations

Page 40: Statistique Descriptive s1

PLAN DE LA PARTIE

1. Représentation tabulaire.

2. Histogramme des densités de fréquence.

3. Polygone de fréquences

4. Courbe des fréquences cumulées.

Voici les chapitres que nous allons aborder :

Ⅰ. Caractères quantitatifs continus

Page 41: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

Tableau à simple entrée, où les classes de données sont triées par ordre croissant.

La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées.

Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude.

Ⅰ. Caractères quantitatifs continus

Page 42: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

Lorsque la variable est continue, ou que la variable peut prendreun grand nombre de valeurs différentes, même si celle-ci est unevariable discrète, il convient de regrouper ces valeurs en classes.

À chaque classe on fait correspondre une fréquence ou unefréquence relative, et l’on obtient alors une distribution defréquence ou de fréquence relative pour valeurs groupées.

Pour construire une distribution de fréquence, de fréquencerelative ou de fréquence relative cumulée pour valeurs groupéeson doit procéder de la manière suivante :

1. Déterminer le nombre de classes2. Déterminer l’amplitude des classes3. Déterminer les différentes classes

Page 43: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

EXEMPLE 1

Voyons l'exemple d'une série brute de 60

valeurs du CA mensuelle d’une entreprise

(en 1000dh), et le tableau des effectifs

obtenus.

L'inconvénient est que, comme on aura toujours

un grand nombre de valeurs différentes, on

obtiendra un grand nombre de petits effectifs,

ne résumant finalement pas grande chose !

Page 44: Statistique Descriptive s1
Page 45: Statistique Descriptive s1

CA (1000dh) Effectifs CA (1000dh) Effectifs

159 1 169 7

160 0 170 7

161 0 171 9

162 0 172 6

163 2 173 5

164 3 174 2

165 3 175 1

166 0 176 2

167 5 177 1

168 6 Total : 60

Page 46: Statistique Descriptive s1

Une variable continue ne prend pas des valeurs

isolées, mais des valeurs appartenant à des

intervalles. C'est pourquoi, au lieu de définir des

effectifs par valeurs, on définira des effectifs par

intervalles, appelés classes.

Page 47: Statistique Descriptive s1

Afin de simplifier la présentation on peut,

quitte à perdre un peu d'information, regrouper

les effectifs proches, par exemple

175 d’ effectif 1

176 d’ effectif 2

177 d’ effectif 1

peut être remplacé par [ 175 ; 178 [ d’ effectif 4.

Page 48: Statistique Descriptive s1

On découpera ainsi l'intervalle des valeurs en

classes contiguës, de la forme :

[ e1 ; e2 [ [ e2 ; e3 [ [ e3 ; e4 [ ....

[ ek ; ek+1 [

et on notera n1, n2, ... , nk les effectifs associés.

ni est le nombre d'individus appartenant à la classe

[ ei ; ei+1 [.

Page 49: Statistique Descriptive s1

EXEMPLE 1

Classes de CA ( en 1000dh) Effectifs

[159 - 165 [ 6

[165 - 168 [ 8

[168 - 171 [ 20

[171 - 174 [ 20

[174 - 177 [ 5

[177 - 179 [ 1

Page 50: Statistique Descriptive s1

EXEMPLE 1

Classes de CA ( en 1000dh) Effectifs

moins de 160 1

[160 - 165 [ 5

[165 - 170 [ 21

[170 - 175 [ 29

175 et plus 4

Page 51: Statistique Descriptive s1

Quel que soit le type de variable on a finalement,

pour toute modalité, valeur xi , ou classe [ ei , ei+1 [,

un effectif ni , tel que

Il est parfois utile, surtout pour faire des

comparaisons entre plusieurs séries, de raisonner

plutôt avec des fréquences relatifs.

Page 52: Statistique Descriptive s1

Les définitions d'effectifs et de

fréquences cumulés restent les

mêmes dans le cas d'une variable

continue.

Page 53: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

1. Déterminer le nombre de classes :

1) (règle de Sturges)

2)

)(3.31 nLogNC

nNC

Nombre d’observations

dans la série statistique

Page 54: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

2. Calculer l’amplitude des classes :

1) D’une façon plus ou moins arbitraire

2) En utilisant l’étendue

minmax xxE

C

CN

EA

Des classes d’amplitudes

égales

(Plus grande valeur de la série statistique

– Plus petite valeur de la série statistique)

Page 55: Statistique Descriptive s1

1. REPRÉSENTATION TABULAIRE

3. Déterminer les différentes classes :

cc AxClasseAx 2min2min <

ckc kAxClasseAkx < minmin )1(

cAxClassex < min1min

ccNcc ANxClasseANxc

< minmin )1(

Page 56: Statistique Descriptive s1

EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)

Pour les trois dernières années, le débit mensuel moyen d'une rivière,exprimé en milliers de mètres cubes par seconde, a été le suivant :

Posons X = la variable statistique représentant le débit mensuel moyend’une rivière.

Variable continue

Page 57: Statistique Descriptive s1

EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)

(1) Nombre de classes :

classesLogNC 1358.6)36(3.31

classesNC 636

(2) L’amplitude des classes :

97.008.005.1 E

17.01617.06

97.0CA

)( 3mdemilliersen

10.193.0

93.076.0

76.059.0

59.042.0

42.025.0

25.008.0

6

5

4

3

2

1

<

<

<

<

<

<

Classe

Classe

Classe

Classe

Classe

Classe

(3) Détermination des classes :

Débit D

Page 58: Statistique Descriptive s1

EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)

Distribution de fréquence, de fréquence relative et defréquence relative cumulée :

Page 59: Statistique Descriptive s1

2. HISTOGRAMME DES DENSITÉS DE

FRÉQUENCE.

Ensemble de rectangles contigus.

Pour chaque classe on trace un rectangle :

de base B proportionnelle à l’amplitude de la classe

de hauteur h proportionnelle à la densité de

fréquence de la classe

L’aire du rectangle sera alors proportionnelle à la

fréquence de la classe.

Ⅰ. Caractères quantitatifs continus

Page 60: Statistique Descriptive s1

2. HISTOGRAMME DES DENSITÉS DE

FRÉQUENCE.

Double interprétation :

On comparera les densités de fréquence des

classes en comparant les hauteurs des rectangles.

On comparera les fréquences des classes en

comparant les aires des rectangles.

Ⅰ. Caractères quantitatifs continus

Page 61: Statistique Descriptive s1

Age (ans)

Nombre de personnes dans cette

tranche d'âge

20 à 30 100

30 à 40 150

40 à 50 90

50 à 65 20

Page 62: Statistique Descriptive s1

Histogramme de fréquence pour valeurs groupées (exemple 2)

Histogramme de fréquence

0

5

10

15

20

25

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers m3/sec)

Fré

qu

en

ce

Page 63: Statistique Descriptive s1

Histogramme de fréquence relative pour valeursgroupées (exemple 2)

Histogramme de fréquence relative

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers de m3/sec)

Fré

qu

en

ce r

ela

tive

Page 64: Statistique Descriptive s1

3. Polygone de fréquences pour valeursgroupées (exemple 2)

Polygone de fréquence

0

5

10

15

20

25

moins de

0,08

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers de m3/sec)

Fré

qu

en

ce

Page 65: Statistique Descriptive s1

3. Polygone de fréquence relative pourvaleurs groupées

Polygone de fréquence relative

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

moins de

0,08

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D ( en milliers m3/sec)

Fré

qu

en

ce r

ela

tive

Page 66: Statistique Descriptive s1

4. COURBE DES FRÉQUENCES CUMULÉES

Représente l’évolution des fréquences cumulées.

Le caractère étant continu, la courbe l’est également.

Pour la construire, on joint les points de coordonnées

(bi,Fi) où bi désigne l’extrémité supérieure de la ième

classe.

Ⅰ. Caractères quantitatifs continus

Page 67: Statistique Descriptive s1

Ogive de fréquence relative cumulée pour valeursgroupées

Ogive de fréquence relative cumulée

,00%

20,00%

40,00%

60,00%

80,00%

100,00%

120,00%

moins de

0,08

0,08 -

0,249

0,25 -

0,419

0,42 -

0,589

0,59 -

0,759

0,76 -

0,929

0,93 et

plus

Débit D (en milliers m3/sec)

Fré

qu

en

ce r

ela

tive c

um

ulé

e

Page 68: Statistique Descriptive s1

SYNTHÈSE

En plus des tableaux et graphiques, on résume

l'observation d'une variable quantitative par un

petit nombre de paramètres.

https://www.facebook.com/pages/Economie/232025116887158