corrélation, ti-80 et interprétation

30
Corrélation, TI-80 et interprétation Remarque : Tu devrais visionner les présentations « Tableau à double entrée et nuage de points.ppt » ainsi que « Coefficient de corrélation et droite de régression.ppt » avant de visionner celui-ci.

Upload: chase-carson

Post on 31-Dec-2015

24 views

Category:

Documents


0 download

DESCRIPTION

Corrélation, TI-80 et interprétation. Remarque :. Tu devrais visionner les présentations « Tableau à double entrée et nuage de points.ppt » ainsi que « Coefficient de corrélation et droite de régression.ppt » avant de visionner celui-ci. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Corrélation, TI-80 et interprétation

Corrélation, TI-80

et

interprétation

Remarque : Tu devrais visionner les présentations « Tableau à double entrée et nuage de points.ppt » ainsi que « Coefficient de corrélation et droite de régression.ppt » avant de visionner celui-ci.

Page 2: Corrélation, TI-80 et interprétation

La calculatrice TI-80 est un outil très intéressant dans le domaine de la statistique.

Elle permet d’analyser rapidement des distributions de données et encore plus intéressant, elle permet d’effectuer des calculs avec une grande précision puisqu’elle tient compte des formules officielles utilisées en statistique.

pour le coefficient de corrélation.

Page 3: Corrélation, TI-80 et interprétation

Pour déterminer la droite de régression.

Page 4: Corrélation, TI-80 et interprétation

Dans cette présentation, nous verrons comment :

- déterminer le coefficient de corrélation et la droite de régression entre plusieurs variables (deux à la fois);

- comprendre les limites de la calculatrice;

- interpréter les résultats affichés.

La première étape est d’entrer les données dans la calculatrice.

Pour effectuer ce travail de préparation, tu devrais visionner la présentation

« Tableau à double entrée et nuage de points.ppt ».

On y explique le procédé.

Page 5: Corrélation, TI-80 et interprétation

EDIT CALC1: 1-Var stats2: 2-Var stats3: Linreg(ax+b)4: Quadreg

Pour effectuer le travail, nous aurons besoin de connaître et de comprendre plusieurs menus et plusieurs fonctions.

L1 L2

EDIT CALC

1: Edit…2: SortA(3: SortD(4: Clrlist

LINREG(ax+b) ,L2

L1 LINREG(ax+b)y= ax+ba= .6465921605b= 30.22423217r= .703007118

EDIT CALC1: EDIT…2: SORTA(3: SORTD(4: CLRLIST

EDIT CALC1: EDIT…2: SORTA(3: SORTD(4: CLRLIST

Page 6: Corrélation, TI-80 et interprétation

Pour la première partie de la présentation, nous travaillerons avec ce tableau.

677285857670545051638152479385

55 70 72 88 85 87 71 60 58 64102 74 62 94 78

1210 6 4 3 5 8 9 8 8 210 8 4 7

Masse (kg)

Rythme cardiaque au repos(pulsations/min)

Nombre d’activités physiques par mois

Individus

1 2 3 4 5 6 7 8 9101112131415

L1 L2 L3

Page 7: Corrélation, TI-80 et interprétation

Pour obtenir le coefficient de corrélation et la droite de régression, il n’est pas nécessaire de le faire.

Remarque :

Pour faciliter le travail de construction du tableau à double entrée et du nuage de points, il faut mettre les listes de données en ordre croissant.

Il est même préférable de ne pas le faire.

Nous allons comparer plusieurs colonnes entre elles :

L1 avec L2, L1 avec L3, L2 avec L3.

Si les listes étaient en ordre croissant, le lien d’association existant entre les variables serait brisé.

Page 8: Corrélation, TI-80 et interprétation

Obtenir le coefficient de corrélation et la droite de régression

Appelle la deuxième colonne,

Pèse sur STAT.

appelle tes deux colonnes comme suit :

2nd puis la touche 1

La calculatrice affiche alors L1.

Inscris une virgule.

2nd puis la touche 2

ATTENTION : tu dois inscrire une virgule.

La calculatrice affiche L2.

Le menu suivant s’affichera.EDIT CALC1: EDIT…2: SORTA(3: SORTD(4: CLRLIST

Sélectionne CALC, un nouveau menu s’affichera.

EDIT CALC1: 1-Var stats2: 2-Var stats3: Linreg(ax+b)4: Quadreg

Sélectionne 3 : Linreg(ax+b)

Dans la nouvelle fenêtre,

LINREG(ax+b) ,L2

L1

Pèse sur ENTER.

Page 9: Corrélation, TI-80 et interprétation

Voici le résultat des calculs :

LINREG(ax+b)y= ax+ba = .6465921605b = 30.22423217r = .703007118

Le taux de variation.

L’ordonnée à l’origine.

Le coefficient de corrélation.Remarques :

1) La calculatrice ne tient pas compte du chiffre 0;

il faut lire : a = 0,6465921605 r = 0,703007118

2) La calculatrice est très précise; c’est pour cette raison qu’il y a autant de chiffres après la virgule.

et r ≈ 0,70y = 0,6466x + 30,22

Pour effectuer des calculs précis, il faut garder :

4 chiffres après la virgule pour le paramètre a;

2 chiffres après la virgule pour le paramètre b;

2 chiffres après la virgule pour le coefficient r;

L’équation y = 0,65x + 30,2 serait représentative, mais moins précise pour les calculs.

Page 10: Corrélation, TI-80 et interprétation

LINREG(ax+b)y= ax+ba= .6465921605b= 30.22423217r = .703007118

Le coefficient de corrélation indique un lien linéaire moyen entre les variables.

r ≈ 0,70

Comme il est positif, les deux variables varient dans le même sens;

L1 : Masse (kg).

L2 : Rythme cardiaque au repos (pulsations/min).

EDIT CALC

1: Edit…2: SortA(3: SortD(4: Clrlist

(Sur l’axe des abscisses).

(Sur l’axe des ordonnées).

L1: Masse (kg)

L2: Rythme cardiaque au repos(pulsations/min)

quand x augmente, y augmente également.

Il semble donc qu’il y ait un lien moyen entre la masse et le rythme cardiaque au repos.

y = 0,6466x + 30,22

Ce qui signifie que lorsque la masse augmente, le rythme cardiaque au repos augmente aussi.

Page 11: Corrélation, TI-80 et interprétation

EDIT CALC

1: Edit…2: SortA(3: SortD(4: Clrlist

L1: Masse (kg)

L2: Rythme cardiaque au repos(pulsations/min)

L’équation de la droite de régression nous permet de faire des prédictions théoriquement.

Exemple :

Quelle pourrait être la masse d’une personne dont le rythme cardiaque au repos est de 120 pulsations/minute ?

120 ≈ 0,6466x + 30,22

x ≈ 138,1 kg

Cela paraît exagéré, mais il faut se souvenir que le coefficient de corrélation (0,70) montre un lien moyen entre les variables.

La relation linéaire étant moyenne, l’imprécision est plus grande.

De plus, il existe peut-être d’autres facteurs que la masse qui peuvent affecter le rythme cardiaque au repos : cigarette, anxiété, forme physique, etc.

y = 0,6466x + 30,22

y = 0,6466x + 30,22

Page 12: Corrélation, TI-80 et interprétation

LINREG(ax+b) ,

L2

L1Remarque

Tu peux comparer les listes de données très facilement.

LINREG(ax+b) L1 , L2

LINREG(ax+b) L1 , L3

LINREG(ax+b) L2 , L3

Selon le tableau utilisé,

masse et rythme cardiaque;

masse et nombre d’activités par mois;

rythme cardiaque et nombre d’activités par mois.

La première colonne appelée est toujours sur l’axe des abscisses.

LINREG(ax+b) L1 , L3 y ≈ -0,1154x + 14,87 r ≈ -0,62

LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86

LINREG(ax+b) ,

L3

L1LINREG(ax+b) ,

L3

L2

Le lien n’est pas très fort et négatif, mais il montre que la masse augmente quand le nombre d’activités par mois diminue.

Le lien est plus fort et négatif; il montre que le rythme cardiaque augmente quand le nombre d’activités par mois diminue.

Page 13: Corrélation, TI-80 et interprétation

ATTENTION LINREG(ax+b)y= ax+ba= .5684454756b= 18.39211137r = .0673669204

La calculatrice donnera toujours une équation pour la droite de régression même si le coefficient de corrélation est très près de 0.

La calculatrice ne réfléchit pas, elle calcule !

Tu dois donc faire attention !

Vérifie toujours le coefficient de corrélation;

près de 1,0 ou -1,0 : l’équation est représentative;

près de 0 : l’équation ne l’est pas.

Page 14: Corrélation, TI-80 et interprétation

Revenons sur les données concernant le rythme cardiaque au repos et le nombre d’activités par mois.

LINREG(ax+b) L2 , L3 rythme cardiaque et nombre d’activités par mois.

LINREG(ax+b) L2 , L3 y ≈ -0,1755x + 20,04 r ≈ -0,86

Le coefficient de corrélation est négatif, donc le taux de variation aussi; les variables varient donc en sens contraire.

Nombre d’activités physiques (par mois)

Rythme cardiaqueau repos (pulsations/min)

Quand x augmente y diminue.

Il semblerait que le rythme cardiaque augmente quand une personne diminue ses activités physiques.

Le coefficient de corrélation indique un lien assez net entre les deux.

Ici encore, il faut faire attention.

Le lien est assez net, mais l’échantillon ne contient que 15 données.

Page 15: Corrélation, TI-80 et interprétation

Quelques situations à interpréter

Page 16: Corrélation, TI-80 et interprétation

Des sociologues québécois ont étudié la relation entre le revenu familial et le taux de fécondité dans 5 communautés culturelles différentes.

Voici les coefficients de corrélation linéaire obtenus.

Communauté A B C D E

r 0,6 -0,3 0 -0,8 0,1

A) Classe ces communautés selon l’intensité de la corrélation observée de la plus faible à la plus forte.

Réponse : C, E, B, A, D

B) Indique la communauté décrite par chacun des énoncés suivants :

1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres.

2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions.

3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance.

Page 17: Corrélation, TI-80 et interprétation

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion.

Revenu familial ($)

Taux de fécondité (%)

Communauté A B C D E

r 0,6 -0,3 0 -0,8 0,1

1) Les familles les plus riches de cette communauté ont nettement moins d’enfants que les familles les plus pauvres.

Le terme « nettement » signifie que la corrélation est forte,donc soit 0,6 ou -0,8.

Selon la phrase, les variables ne vont pas dans le même sens.

Plus le revenu augmente et moins il y a d’enfants.

Imaginons le nuage de points.

Réponse : D

Page 18: Corrélation, TI-80 et interprétation

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion.

Revenu familial ($)

Taux de fécondité (%)

Communauté A B C D E

r 0,6 -0,3 0 -0,8 0,1

Les termes «  il y a des exceptions » signifie que la corrélation est un peu plus faible, donc soit 0,6 ou -0,3.

Selon la phrase, les variables vont dans le même sens.

Plus le revenu augmente et plus il y a d’enfants.

Imaginons le nuage de points.

Réponse : A

2) En général, plus on est riche dans cette communauté, plus on a d’enfants, mais il y a des exceptions.

Page 19: Corrélation, TI-80 et interprétation

Pour répondre à ces questions, il faut être capable de se représenter mentalement le diagramme de dispersion.

Revenu familial ($)

Taux de fécondité (%)

Communauté A B C D E

r 0,6 -0,3 0 -0,8 0,1

Les termes «  n’a pas d’importance » signifie que la corrélation est très faible, donc soit 0 ou 0,1.

Selon la phrase, les variables n’ont pas vraiment de lien entre elles.

Riches ou pauvres, les familles ont beaucoup d’enfants.

Imaginons le nuage de points.

Réponse : C ou E

3) Dans cette communauté, toutes les familles ont beaucoup d’enfants, que celles-ci soient riches ou pauvres n’a pas d’importance.

Page 20: Corrélation, TI-80 et interprétation

On a interrogé 30 élèves âgés de 15 à 16 ans sur le temps qu’ils consacrent par semaine à un travail rémunéré à l’extérieur de l’école, puis on a évalué sur 10 leur rendement scolaire. Voici le nuage de points représentant ces données.

10

5

2 4 6 8 12 14 16 18 20

10

9

8

7

6

4

3

2

1

Temps de travail (h)

Rendement scolaire

Travail des jeunesSelon ces données, peut-on dire que le travail des jeunes nuit à leur rendement scolaire ?

Selon le nuage, il n’y a pas de corrélation très forte entre les deux,

Parfois, il faut étudier le nuage par section.

Si on considère la première section du nuage,on pourrait dire qu’entre 0 et 7 heures de travail, le rendement n’est pas vraiment affecté.

Cependant, de 7 à 20 heures,

le rendement est beaucoup plus affecté; en particulier, passé 12 heures.

Peut-on établir une relation de cause à effet ?

Avant de se prononcer, il faudrait obtenir plus d’informations !

dérange pas les études.donc le travail ne

Page 21: Corrélation, TI-80 et interprétation

Une nouvelle entreprise de télécommunications à fait son apparition sur le marché de la bourse le 31 décembre dernier.

Elle vendait alors ses actions, 14,00 $ chacune.

Le tableau suivant présente le prix de cette action à la fermeture, à chaque vendredi.

7 janvier 14,75

14 janvier 17,50

21 janvier 13,25

28 janvier 15,00

4 février 13,75

11 février 14,50

18 février 21,25

25 février 18,00

4 mars 17,75

11 mars 22,50

18 mars 24,25

25 mars 19,00

1 avril 22,50

8 avril 20,25

15 avril 23,00

22 avril 22,75

Valeur de l’action à la fermeture, chaque vendredi

Dans combien de mois, l’action aura-t-elle doublé de valeur ?

Pour répondre à cette question, il faut être capable d’interpréter la situation.

Le tableau de compilation sera comme suit :

Page 22: Corrélation, TI-80 et interprétation

7 janvier 14,75

14 janvier 17,50

21 janvier 13,25

28 janvier 15,00

4 février 13,75

11 février 14,50

18 février 21,25

25 février 18,00

4 mars 17,75

11 mars 22,50

18 mars 24,25

25 mars 19,00

1 avril 22,50

8 avril 20,25

15 avril 23,00

22 avril 22,75

Valeur de l’action à la fermeture, chaque vendredi

0 14,00

1 14,75

2 17,50

3 13,25

4 15,00

5 13,75

6 14,50

7 21,25

8 18,00

9 17,75

10 22,50

11 24,25

12 19,00

13 22,50

14 20,25

15 23,00

16 22,75

Valeur de l’action à la fermeture, chaque vendredi

Achat :

1er vendredi

2e vendredi

et ainsi de suite.

Page 23: Corrélation, TI-80 et interprétation

0 14,00

1 14,75

2 17,50

3 13,25

4 15,00

5 13,75

6 14,50

7 21,25

8 18,00

9 17,75

10 22,50

11 24,25

12 19,00

13 22,50

14 20,25

15 23,00

16 22,75

Valeur de l’action à la fermeture, chaque vendredi

Avec la calculatrice, détermine la droite de régression.

y ≈ 0,6140x + 13,56 r ≈ 0,82

x : variable de référence : le nombre de vendredis

y : la valeur de l’action

y ≈ 0,614x + 13,56

Dans combien de mois la valeur de l’action aura-t-elle doublé, c’est-à-dire une valeur de 28,00$.

Cherchons, en premier, le nombre de vendredis.

28 ≈ 0,614x + 13,56

14,44 ≈ 0,614x

23,52 ≈ x

Page 24: Corrélation, TI-80 et interprétation

0 14,00

1 14,75

2 17,50

3 13,25

4 15,00

5 13,75

6 14,50

7 21,25

8 18,00

9 17,75

10 22,50

11 24,25

12 19,00

13 22,50

14 20,25

15 23,00

16 22,75

Valeur de l’action à la fermeture, chaque vendredi

x ≈ 23,52 vendredis

L’action aura doublé environ le 24e vendredi après son lancement,

soit dans 8 vendredis après le 16e,donc dans 2 mois.

Attention

La droite de régression obtenue indique une tendance théorique; ça ne veut pas dire que cela arriveranécessairement.

Le marché boursier est très fluctuant; il y a tellement de facteurs à considérer.

Page 25: Corrélation, TI-80 et interprétation

Voici des données concernant le nombre de tests s’étant révélés positifs au VIH chez les adultes au Canada de 1996 à 2005.

1996 535 2054

1997 483 1861

1998 470 1697

1999 515 1596

2000 486 1538

2001 526 1580

2002 620 1809

2003 627 1822

2004 655 1825

2005 628 1830

Année Nombrede femmes

Nombre d’hommes

Test positifsSelon ces données, si la tendance se maintient, quel sera le pourcentage de femmes parmi l’ensemble des cas décelés en 2025 ?

Page 26: Corrélation, TI-80 et interprétation

1996 535 2054

1997 483 1861

1998 470 1697

1999 515 1596

2000 486 1538

2001 526 1580

2002 620 1809

2003 627 1822

2004 655 1825

2005 628 1830

Année Nombrede femmes

Nombre d’hommes

Test positifs

Calculer le pourcentage par année.

Il faut d’abord faire le total de chaque année;

535 + 2054 = 2589

reporter sur ce total le nombre de femmes

Étape 1 :

535

2589

et multiplier par 100.

X 100 ≈ 20,6643… %.

Arrondi au dixième près : ≈ 20,7 %.

Avec ta calculatrice, tu peux procéder plus rapidement :

535 ÷ ( 535 + 2054 ) ≈ 0,206643…

Déplace mentalement la virgule de deux positions vers la droite : ≈ 20,7 %.

Page 27: Corrélation, TI-80 et interprétation

Voici le nouveau tableau en pourcentage.

1996 20,7

1997 20,6

1998 21,7

1999 24,4

2000 24

2001 25

2002 25,5

2003 25,6

2004 26,4

2005 25,5

Année Nombre de femmes (%)

Le taux de variation n’est pas constant.

diminution de 0,1 %

augmentation de 2,7 %

Existe-t-il un certain lien linéaire ?

Pour le savoir, calculons le coefficient de corrélation.

Page 28: Corrélation, TI-80 et interprétation

1996 20,7

1997 20,6

1998 21,7

1999 24,4

2000 24

2001 25

2002 25,5

2003 25,6

2004 26,4

2005 25,5

Année Nombre de femmes (%)

r ≈ 0,92

Le coefficient est positif et très fort, il existe un lien linéaire.

Déterminons donc la droite de régression.

Page 29: Corrélation, TI-80 et interprétation

1996 20,7

1997 20,6

1998 21,7

1999 24,4

2000 24

2001 25

2002 25,5

2003 25,6

2004 26,4

2005 25,5

Année Nombre de femmes (%)

r ≈ 0,92

Si tu utilises les années :

y = 0,6521x – 1280,63

Si tu utilises une référence d’étude :

0 20,7

1 20,6

2 21,7

3 24,4

4 24

5 25

6 25,5

7 25,6

8 26,4

9 25,5

Année Nombre de femmes (%)

r ≈ 0,92

y = 0,6521x + 21

Page 30: Corrélation, TI-80 et interprétation

Si tu utilises les années : Si tu utilises la référence d’étude :

y = 0,6521x – 1280,63

En 2025 :

y = 0,6521 X 2025 – 1280,63

y = 39,91…

y = 39,9%

y = 0,6521x + 21

Soit 29 ans après l’année 0

y = 0,6521 X 29 + 21

2025-1996 = 29

y = 39,91…

y = 39,9%

Le coefficient de corrélation est très fort et positif.

Les variables vont dans le même sens; plus les années augmentent, plus il y a de femmes atteintes.

Mais, ici encore, l’échantillon est très petit.