la corrélation et régression, approfondissement

18
+ La corrélation et régression, approfondissement Jean-Herman Guay Plan de la présentation Causalité chez Hume Des questions de base Des données simples Des formules Un exercice collectif: le «cercle des corrélations»

Upload: abba

Post on 26-Jan-2016

56 views

Category:

Documents


1 download

DESCRIPTION

La corrélation et régression, approfondissement. Plan de la présentation Causalité chez Hume Des questions de base Des données simples Des formules Un exercice collectif: le «cercle des corrélations». Jean-Herman Guay. David Hume (1711-1776). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: La corrélation et régression, approfondissement

+

La corrélation et régression, approfondissementJean-Herman Guay

Plan de la présentationCausalité chez HumeDes questions de baseDes données simplesDes formulesUn exercice collectif: le «cercle des corrélations»

Page 2: La corrélation et régression, approfondissement

+David Hume (1711-1776)

«Tous les raisonnements sur les faits paraissent se fonder sur la relation de la cause à l'effet. C'est au moyen de cette seule relation que nous dépassons l'évidence de notre mémoire et de nos sens. Si vous demandiez à quelqu'un pourquoi il croit à la réalité d'un fait qu'il ne constate pas effectivement, par exemple que son ami est à la campagne ou en France, il vous donnerait une raison ; cette raison serait un autre fait : une lettre qu'il a reçue ou la connaissance de ses résolutions antérieures et de ses promesses. Un homme qui trouverait une montre ou une autre machine dans une île déserte conclurait qu'il y a eu précédemment des hommes sur cette île. Tous nos raisonnements sur les faits sont de même nature. On y suppose constamment qu'il y a une connexion entre le fait présent et ce qu'on en infère. (...)Si donc nous désirons nous satisfaire au sujet de la nature de l'évidence qui nous donne la certitude des faits, il faut que nous recherchions comment nous arrivons à la connaissance de la cause et de l'effet.J'oserai affirmer, comme une proposition générale qui n'admet pas d'exception, que la connaissance de cette relation ne s'obtient, en aucun cas, par des raisonnements a priori; mais qu'elle naît entièrement de l'expérience quand nous trouvons que des objets particuliers sont en conjonction constante l'un avec l'autre. »

Hume, Enquête sur l'entendement humain

Page 3: La corrélation et régression, approfondissement

+Organiser en une série chronologique

EConcret

Page 4: La corrélation et régression, approfondissement

+

R

Concret

Page 5: La corrélation et régression, approfondissement

+

À partir de là, que pouvons-nous dégager pour

élaborer un modèle?

Page 6: La corrélation et régression, approfondissement

+Corrélation et régression: des cousines!

Forte positive

Assez forteForte négative

Non linéaire,Effet de cycle?

AbsenceNon linéaire

R=+.8

R=-.8 R=+.6

R=+.5

R=0 R=0

Abstrait

Page 7: La corrélation et régression, approfondissement

+Corrélation et régression: des cousines!

Forte positive

Assez forteForte négative

Non linéaire Absence linéaire ou non-linéaire

Non linéaire

Abstrait

Page 8: La corrélation et régression, approfondissement

+

R

Abstrait

Page 9: La corrélation et régression, approfondissement

+

R

Page 10: La corrélation et régression, approfondissement

+Les résidus : ce que le modèle n’explique pas

R

Page 11: La corrélation et régression, approfondissement

+Les équations de régressionLa base de notre modèle 

 

valeur de Y = (coefficient*valeur de X) + constante + erreur

Nombre de tuées par million estimé

coefficient Année constante R R carréCoefficient de détermination

France 154 = -7,80 1997 15721,63

.9652 .9193

Bulgarie 127 = +,84 2015 -1565,31

.4141 .1715

Allemagne

31 = -4,39 2015 8876,58 .9949 .9898

Page 12: La corrélation et régression, approfondissement

+Et dans Excel?

Avec la matrice de gauche: 1. faites un graphique «Nuage de points»; 2) en cliquant sur les points, «Ajouter une droite de tendance», puis choisissez les options «Équation» et «R carré». Vous devriez obtenir le même résultat.

E

Abstrait

Page 13: La corrélation et régression, approfondissement

+Relations et relations

Phénomène A Phénomène B

Phénomène X ||||||||

Phénomène y ||||||||

Phénomène A Phénomène B

Phénomène X ||||||| ||

Phénomène y ||| |||||||

Rares mais possibles

Relativement fréquentes: des exceptions

Phénomène A Phénomène B

Phénomène X ||||| ||||

Phénomène y |||| ||||

Relativement fréquentes: trop d’exceptions?

Page 14: La corrélation et régression, approfondissement

+Des mots

Corrélation : cor< cum, relation avec.

Corrélation et causalité? Synonymes? NON! Concomitance?

Contiguïté et antériorité de la cause sur l’effet:

Direction de la causalité? La corrélation y répond-elle? NON!

Force de la causalité? La corrélation y répond-elle? OUI!

Régression: réduction des données d’un phénomène complexe en vue de le représenter par une loi simplificatrice

Droite de régression, par opposition d’autres fonctions

Des moindres carrés ordinaires: la méthode des Moindres Carrés Ordinaires (MCO) consiste à minimiser la Somme des Carrés des Résidus (SCR) elle se démarque des Moindres Carrés Pondérés (MCP) que nous ne voyons pas.

Page 15: La corrélation et régression, approfondissement

+

Page 16: La corrélation et régression, approfondissement

+Exercice en classe

Comprendre chaque variable

Choisir les variables appropriées en éliminant celles qui ne sont plus nécessaires

Dresser la liste des relations les plus intéressantes et être en mesure de les mettre en mots, bref de les décrire.

Qu’est ce qui explique le nombre de personnes tuées par million en prenant les variables une à une?

Page 17: La corrélation et régression, approfondissement

+ Le «cercle des corrélations»

Page 18: La corrélation et régression, approfondissement

+5 questions, 5 réponses à trouver!①① Quel pays sQuel pays s’’approche le plus de la médiane si on regarde le nombre de approche le plus de la médiane si on regarde le nombre de

personnes tuées en 2009? Et si on regarde le nombre de personnes tuées personnes tuées en 2009? Et si on regarde le nombre de personnes tuées par million en 2009? Discutez brièvement les implications de ces résultats.par million en 2009? Discutez brièvement les implications de ces résultats.

②② De façon générale, existe-t-il une différence concernant le nombre de De façon générale, existe-t-il une différence concernant le nombre de personnes tuées par million en 2009 entre les pays dpersonnes tuées par million en 2009 entre les pays d’’Europe de lEurope de l’’Ouest et Ouest et les pays dles pays d’’Europe de lEurope de l’’Est (ancien espace soviétique)? Utilisez quelques Est (ancien espace soviétique)? Utilisez quelques mesures de dispersion (écart-type, variance, étendue, quartile...) et de mesures de dispersion (écart-type, variance, étendue, quartile...) et de tendance centrale (moyenne, médiane, mode...) pour étayer votre tendance centrale (moyenne, médiane, mode...) pour étayer votre affirmation.affirmation.

③③ Quel est lQuel est l’’estimé du nombre de personnes tuées par million sur les routes de estimé du nombre de personnes tuées par million sur les routes de Bulgarie en 2012? Faut-il nuancer cet estimé et pourquoi?Bulgarie en 2012? Faut-il nuancer cet estimé et pourquoi?

④④ Quel est lQuel est l’’estimé du nombre de personnes tuées sur les route de lestimé du nombre de personnes tuées sur les route de l’’Allemagne Allemagne en 2012? Faut-il nuancer cet estimé et pourquoi?en 2012? Faut-il nuancer cet estimé et pourquoi?

⑤⑤ Bien que cela puisse être trompeur, en quelle année, voire quel mois et quel Bien que cela puisse être trompeur, en quelle année, voire quel mois et quel jour, le nombre de personnes tuées par million en France et Allemagne jour, le nombre de personnes tuées par million en France et Allemagne devrait être identique?devrait être identique?