corrélation cas: échelle numé .cours réalisé par benjamin putois 08/12/2008 1 corrélation cas:

Download Corrélation Cas: échelle numé .cours réalisé par Benjamin Putois 08/12/2008 1 Corrélation Cas:

Post on 13-Sep-2018

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • cours ralis par Benjamin Putois 08/12/2008

    1

    Corrlation

    Cas: chelle numrique

    Coefficient de corrlation de Bravais-Pearson

    i.e. coefficient de corrlation linaire

    Cours ralis par Benjamin PutoisNovembre 2008bputois@gmail.com

    couple A B C D E F G H I J

    FEMME 18 21 22 19 30 20 19 19 32 30

    HOMME 38 24 26 20 28 26 24 20 24 20

    Existe-t-il une corrlation entre lge de mariage des hommes et celui des femmes?Nous avons interrog 10 couples sur leur ge au moment du mariage:

  • cours ralis par Benjamin Putois 08/12/2008

    2

    ge A B C D E F G H I J MOYENNE

    FEMME 18 21 22 19 30 20 19 19 32 30 23

    HOMME 38 24 26 20 28 26 24 20 24 20 25

    Etape 1: hyp

    H0: pas de corrlationH1: corrlation

    Etape 2: calcul de la covariance

    Etape 2.1: calcul de la moyenne

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    Moyenne

  • cours ralis par Benjamin Putois 08/12/2008

    3

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    Moyenne

    X-Mx

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    Moyenne

    X-Mx

    Y-My

  • cours ralis par Benjamin Putois 08/12/2008

    4

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    Moyenne

    X-Mx

    Y-My(X-Mx)*(Y-My)

    Rappel: la surface dun rectangle

    A

    B

    A*B

  • cours ralis par Benjamin Putois 08/12/2008

    5

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    Moyenne

    X-Mx

    Y-My(X-Mx)*(Y-My)

    Covariance des dispersions = Est-ce

    que les variables varient dans le mme sens?

    Dispersion de Y

    Dispersion de X

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    (X-Mx)*(Y-My)

    Deux dimensions

    Une dimension

    Une dimension

  • cours ralis par Benjamin Putois 08/12/2008

    6

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

  • cours ralis par Benjamin Putois 08/12/2008

    7

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

  • cours ralis par Benjamin Putois 08/12/2008

    8

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

  • cours ralis par Benjamin Putois 08/12/2008

    9

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

  • cours ralis par Benjamin Putois 08/12/2008

    10

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    (xi-Mx)(yi-My)

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    (xi-Mx)(yi-My)/N = Cov(x,y)

  • cours ralis par Benjamin Putois 08/12/2008

    11

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    (xi-Mx)(yi-My)/N = Cov(x,y)La covariance est la moyenne

    des surfaces des distances des points par rapport la

    moyenne

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    positif

    ngatif

    ngatif

    positif

    Remarque sur la covariance:

  • cours ralis par Benjamin Putois 08/12/2008

    12

    Remarque sur la covariance:

    20212223242526272829303132333435363738

    18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

    G

    E H

    OM

    ME

    GE FEMME

    positif

    ngatif

    ngatif

    positif

    covariance positivecovariance ngative

    Remarque sur la covariance:La covariance permet d'estimer le sens de la variation entre deuxvariables numriques :

    Les variables varient dans le mme sens (ou covarient) : les sujetsqui ont des valeurs fortes (au dessus de la moyenne) sur unevariable, prsentent galement des valeurs leves sur l'autrevariable. Autrement dit, les sujets les plus grands sont les sujets lesplus lourds et, inversement, les sujets plus petits sont les plus lgers :dans ce cas, la covariance est de signe positif (+66,831)

    Les variables varient en sens inverse : les sujets qui ont des valeursfortes sur une des deux variables auront tendance avoir des notesfaibles sur l'autre variable. La valeur de la covariance sera alors designe ngatif

    Les variables ne covarient pas : Parmi les sujets prsentant desvaleurs fortes sur une variable, on peut observer que, sur l'autrevariable, ces mmes sujets obtiennent des notes fortes, faibles oumoyennes. La valeur de la covariance est proche de la valeur 0.

  • cours ralis par Benjamin Putois 08/12/2008

    13

    ge A B C D E F G H I J MOYENNE sdFEMME 18 21 22 19 27 27 19 19 21 19 21,2 3,29309041HOMME 19 20 23 20 28 26 18 20 24 20 21,8 3,29309041moyenne F 21 21 21 21 21 21 21 21 21 21 21,2moyenne H 22 22 22 22 22 22 22 22 22 22 21,8X-moy -3 -0 1 -2 6 6 -2 -2 -0 -2Y-moy -3 -2 1 -2 6 4 -4 -2 2 -2 SOMMEX-moy*Y-moy 9 0 1 4 36 24 8 4 -0 4 90,4

    SOMME / N9,04

    cov 9,04R 0,83360656

    15

    20

    25

    30

    15 17 19 21 23 25 27 29

    HO

    MM

    E

    FEMME

    Corrlation positive et forte

    ge A B C D E F G H I J MOYENNE sdFEMME 18 38 27 53 27 27 50 67 36 80 42,3 19,8776815HOMME 42 20 23 20 60 26 18 20 24 20 27,3 13,4002488moyenne F 42 42 42 42 42 42 42 42 42 42 42,3moyenne H 27 27 27 27 27 27 27 27 27 27 27,3X-moy -24 -4 ## 11 ## ## 8 25 -6 38Y-moy 15 -7 -4 -7 33 -1 -9 -7 -3 -7 SOMMEX-moy*Y-moy ## 31 66 ## ## 20 ## ## 21 ### -1324,9

    SOMME / N-132,49

    cov -132,49R -0,49739

    1520253035404550556065707580

    15 25 35 45 55 65 75 85

    HO

    MM

    E

    FEMME

    Corrlation ngative et

    moyenne

  • cours ralis par Benjamin Putois 08/12/2008

    14

    ge A B C D E F G H I J Moyenne

    FEMME 18 21 22 19 30 20 19 19 32 30 23

    HOMME 38 24 26 20 28 26 24 20 24 20 25

    X-Mx -5 -2 -1 -4 7 -3 -4 -4 930-23=

    7

    Y-My 13 -1 1 -5 3 1 -1 -5 -120-25=

    -5

    Etape 2.2: calcul des distances aux moyennes

    ge A B C D E F G H I J Moyenne

    FEMME 18 21 22 19 30 20 19 19 32 30 23

    HOMME 38 24 26 20 28 26 24 20 24 20 25

    X-Mx -5 -2 -1 -4 7 -3 -4 -4 930-23=

    7

    Y-My 13 -1 1 -5 3 1 -1 -5 -120-25=

    -5

    Etape 1.3: produit des distances

    (X-Mx)*(Y-My) -65 2 -1 20 21 -3 4 20 -97*-5=

    -35

  • cours ralis par Benjamin Putois 08/12/2008

    15

    ge A B C D E F G H I J Moyenne

    FEMME 18 21 22 19 30 20 19 19 32 30 23

    HOMME 38 24 26 20 28 26 24 20 24 20 25

    X-Mx -5 -2 -1 -4 7 -3 -4 -4 930-23=

    7

    Y-My 13 -1 1 -5 3 1 -1 -5 -120-25=

    -5

    Etape 2.3: moyenne des produits des distances

    (X-Mx)*(Y-My) -65 2 -1 20 21 -3 4 20 -97*-5=

    -35=-46

    Etape 3: calcul du coef. de corr.Etape 3.1: calcul des cart-types de chaque variable

    Etape 3.2: calcul du rcalcul

    x y=5.44 =5.35

    Pourquoi divise-t-on par le produit des carts-types?

  • cours ralis par Benjamin Putois 08/12/2008

    16

    On pondre la covariance par les produits des dispersions pour donner une valeur, un indice compris entre -1 et 1.

    La covariance (i.e. la dispersion en 2D) est pondre par la dispersion de chaque variable (i.e. le produit des carts-types)

    Etape 4 : seuil de significativit et ddl=.05ddl= N nombre de variable = 10-2= 8Etape 5 : recherche du rthoriquerthorique= 0,632

  • cours ralis par Benjamin Putois 08/12/2008

    17

    Etape 5: comparaison entre |rcalcul| et rthorique|rcalcul|=- 0,158 rthorique= = 0,632

    |rcalcul| < rthorique

    Si rcalcul rthorique alors on rejette lhypothse nulle et accepte H1: les deux distributions sont statistiquement lies. On peutlaffirmer avec un risque derreur < 5%.Si rcalcul < rthorique alors on ne rejette pas lhypothse nulle : on nepeut pas dire que les deux distributions sont statistiquementlies. Mais attention : cela ne veut pas dire que lon accepte Ho

    Etape 6: conclusionOn ne rejette pas H0

    Remarque sur le coef. de corr.:

    Si le coefficient de corrlation est proche de 1 ou de 1, cela signifie que les variables x et y sont trs fortementlies (par une relation de la forme y = ax + b).Sil est proche de 0, cela signifie que le lien est faible.Un signe positif indique que x et y var

Recommended

View more >