ursula hess uqam. corrélation bivariée: relation entre deux variables continues sans distinction...

Download Ursula Hess UQAM. Corrélation bivariée: Relation entre deux variables continues sans distinction entre VI et VD Corrélation bivariée: Relation entre deux

If you can't read please download the document

Post on 04-Apr-2015

103 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Page 1
  • Ursula Hess UQAM
  • Page 2
  • Corrlation bivarie: Relation entre deux variables continues sans distinction entre VI et VD Corrlation bivarie: Relation entre deux variables continues sans distinction entre VI et VD Rgression bivarie: Prdiction d une variable dpendante partir d une variable indpendante Rgression bivarie: Prdiction d une variable dpendante partir d une variable indpendante Corrlation multiple: Relation entre une variable dpendante et une srie des variables indpendantes qui sont combines afin de crer une variable composite Corrlation multiple: Relation entre une variable dpendante et une srie des variables indpendantes qui sont combines afin de crer une variable composite Rgression multiple: Prdiction dune variable dpendante partir d une srie des variables indpendantes Rgression multiple: Prdiction dune variable dpendante partir d une srie des variables indpendantes Rgression hirarchique: Le chercheur assigne des priorits aux variables indpendantes Rgression hirarchique: Le chercheur assigne des priorits aux variables indpendantes Corrlation canonique: La relation entre une srie des variables dpendantes et une srie de variables indpendantes Corrlation canonique: La relation entre une srie des variables dpendantes et une srie de variables indpendantes
  • Page 3
  • Prdiction Prdiction Modle thorique Modle thorique Limportance relative des diffrentes VIs Limportance relative des diffrentes VIs Ajout dune variable -> amlioration du modle? Ajout dune variable -> amlioration du modle? Comparaison de diffrents modles thoriques Comparaison de diffrents modles thoriques Analyse de chemins causaux Analyse de chemins causaux
  • Page 4
  • Rgression multiple: une extension de la rgression simple; la prdiction dune variable dpendante partir de plusieurs variables indpendantes continues Rgression multiple: une extension de la rgression simple; la prdiction dune variable dpendante partir de plusieurs variables indpendantes continues Modle de rgression multiple: Modle de rgression multiple: Y = 0 + 1 X 1 + 2 X 2 + e Y = 0 + 1 X 1 + 2 X 2 + e
  • Page 5
  • La relation entre deux variables La relation entre deux variables Les moindres carrs Les moindres carrs La rgression La rgression Les commandes SPSS Les commandes SPSS Goodness of fit Goodness of fit
  • Page 6
  • r =.78
  • Page 7
  • Nous visons ajuster une droite: Nous visons ajuster une droite: Y = a + bX Y = a + bX avec une pente b de faon minimiser avec une pente b de faon minimiser d = Y - Y d = Y - Y ou bien ou bien d 2 = (Y-Y) 2 d 2 = (Y-Y) 2
  • Page 8
  • La pente qui correspond ces exigences: La pente qui correspond ces exigences: Df.: La pente b = la variation de Y qui accompagne la variation dune unit de X
  • Page 9
  • Page 10
  • Page 11
  • Page 12
  • Page 13
  • =.207 +.003 * Temprature (F) Prdiction Explication: pour chaque degr F de chaleur la personne mangera.003 pintes de crme glace de plus pour chaque augmentation dune unit dcart- type de temprature la personne augmente sa consommation de crme glace de.776 units dcart-type Consommation crme glace (pinte/personne)
  • Page 14
  • Y =.207 +.003 * Temperature (F)
  • Page 15
  • Y =.306 +.006 * Temperature (C) Explication: pour chaque dgr C de chaleur la personne mangera.006 pints de crme glace de plus pour chaque augmentation dune unit dcart-type de temperature la personne augmente sa comsommation de crme glace.776 units dcart-type
  • Page 16
  • Page 17
  • Lintervalle de confiance 95% de la pente Lintervalle de confiance 95% de la pente = b t.025 SE = b t.025 SE Test - t avec lhypothse nulle: b = 0 Test - t avec lhypothse nulle: b = 0 t = b/SE t = b/SE Intervalle de prdiction 95% pour une seule valeur Y 0 correspondant au niveau X 0 Intervalle de prdiction 95% pour une seule valeur Y 0 correspondant au niveau X 0
  • Page 18
  • Modle: Y = + X + e Modle: Y = + X + e e: erreurs indpendantes avec une moyenne de 0 et une variance de 2 e: erreurs indpendantes avec une moyenne de 0 et une variance de 2 Postulats de base Postulats de base Homognit de la variance Homognit de la variance Linarit Linarit Indpendance des observations Indpendance des observations
  • Page 19
  • Page 20
  • Page 21
  • Page 22
  • e Y (a) patron de distribution normale (b) problme dhtrognite de la variance (c) nonlinarit e Y e Y (a) (b) (c)
  • Page 23
  • Sources de variation Sources de variation (Y i -Y.) 2 (Somme des carrs totaux; df = n-1) (Y i -Y.) 2 (Somme des carrs totaux; df = n-1) (Y i - Y i ) 2 (Somme des carrs rsiduels; df = n-k-1) (Y i - Y i ) 2 (Somme des carrs rsiduels; df = n-k-1) (Y i -Y.) 2 (Somme des carrs rgression; df = k) (Y i -Y.) 2 (Somme des carrs rgression; df = k) R 2 = somme des carrs rgression/somme des carrs totaux. R 2 = somme des carrs rgression/somme des carrs totaux. F = (R 2 /k) / ((1-R 2 )/(n-k-1)) avec k et n-k-1 df F = (R 2 /k) / ((1-R 2 )/(n-k-1)) avec k et n-k-1 df
  • Page 24
  • Nombre de cas en relation avec le nombre de VIs Nombre de cas en relation avec le nombre de VIs Quand le nombre de VIs est gal ou suprieur au nombre de cas, la solution explique toujours toute la variance. Quand le nombre de VIs est gal ou suprieur au nombre de cas, la solution explique toujours toute la variance. Afin que la solution des quations soit thoriquement significative, un rapport de 20 pour 1 est gnralement recommand. Afin que la solution des quations soit thoriquement significative, un rapport de 20 pour 1 est gnralement recommand. Pour une rgression hirarchique, le minimum acceptable est un rapport de 5 pour 1. Pour une rgression hirarchique, le minimum acceptable est un rapport de 5 pour 1. Pour une rgression stepwise permettant une gnralisation de la solution, un ratio de 40 pour 1 est recommand. Pour une rgression stepwise permettant une gnralisation de la solution, un ratio de 40 pour 1 est recommand.
  • Page 25
  • Cas extrmes (outliers): Les corrlations sont trs susceptibles linfluence des cas extrmes, il faut donc vrifier les donnes attentivement Cas extrmes (outliers): Les corrlations sont trs susceptibles linfluence des cas extrmes, il faut donc vrifier les donnes attentivement
  • Page 26
  • Rgression ordinaire Rgression ordinaire Chacune des variables fait partie de l quation. Chaque variable est value comme si elle s ajoutait toutes les autres. Cest--dire pour chaque variable, seulement sa contribution unique est value. Il est donc possible quune variable soit hautement corrle avec la VD mais que sa contribution semble ngligeable car elle est partage avec dautres variables. Chacune des variables fait partie de l quation. Chaque variable est value comme si elle s ajoutait toutes les autres. Cest--dire pour chaque variable, seulement sa contribution unique est value. Il est donc possible quune variable soit hautement corrle avec la VD mais que sa contribution semble ngligeable car elle est partage avec dautres variables.
  • Page 27
  • Rgression hirarchique Rgression hirarchique Les variables sont inclus dans l quation dans un ordre prdtermin par le chercheur. Dans ce cas, les variables qui entrent en premier prennent toute la variance disponible pour elles et celles qui entrent plus tard ne disposent que de la variance non-explique au moment de leur entre. Les variables sont inclus dans l quation dans un ordre prdtermin par le chercheur. Dans ce cas, les variables qui entrent en premier prennent toute la variance disponible pour elles et celles qui entrent plus tard ne disposent que de la variance non-explique au moment de leur entre.
  • Page 28
  • Rgression stepwise Rgression stepwise Lordre dentre des variables nest pas dcid par des raisons thoriques, mais uniquement par des raisons statistiques. A chaque point, la variable qui a la meilleure corrlation avec la VD est ajoute. Chaque variable prend toute la variance disponible pour elle au moment de son entre. Cette procdure fournit des rsultats potentiellement peu gnralisable (capitalise sur la chance). Lordre dentre des variables nest pas dcid par des raisons thoriques, mais uniquement par des raisons statistiques. A chaque point, la variable qui a la meilleure corrlation avec la VD est ajoute. Chaque variable prend toute la variance disponible pour elle au moment de son entre. Cette procdure fournit des rsultats potentiellement peu gnralisable (capitalise sur la chance).
  • Page 29
  • Page 30
  • Page 31
  • B 1 = variation de Y conscutive une variation dune unit de X 1, les autres facteurs de rgression restent constants. Ex: Toutes les autres choses tant gales, la consommation augmente de.003 pintes par $ de salaire familiale hebdomadaire
  • Page 32
  • Page 33
  • Page 34
  • Page 35
  • Page 36
  • Toutes les variables taient mesures au niveau intervalle et sans erreur Toutes les variables taient mesures au niveau intervalle et sans erreur -> Problme d'erreur de mesure La moyenne du terme d'erreur est zro pour chaque ensemble de valeurs pour les k variables indpendantes La moyenne du terme d'erreur est zro pour chaque ensemble de valeurs pour les k variables indpendantes La variance est constante po

Recommended

View more >