les d’équations structurelles à variables applications et ...cedric.cnam.fr/~saporta/sta201...
TRANSCRIPT
Cours de Statistique Multivariée Approfondie 1
Emmanuel JakobowiczAddinsoftXLSTAT
30 mars 2011
Les modèles d’équations structurelles à variables latentes
Applications et exercices
Cours de Statistique Multivariée Approfondie 2
Le modèle structurel
ξ1
η2
η 3
y36
y35
y33
y32
y34
y31x11
x12
x13
y21
y22
δ 11
ζ3δ 12
δ 13
ε 21
ε 22
ε 31
ε 32
ε 33
ε 34
ε 35
ε 36ζ2
Eq. du modèle structurel
Eq. du modèle de mesure
Cours de Statistique Multivariée Approfondie 3
Démonstration: La méthode LISREL
Nous utiliserons les logiciels AMOS (aujourd’hui SPSS) et LISREL
Ce sont les 2 principaux logiciels de traitement de la méthode LISREL
Nous utiliserons un modèle très simple (3 Variables Latentes et 9 Variables Manifestes)
AMOS 19.0 est disponible avec IBM‐SPSS.
LISREL 8.8 est disponible à l’essai 15 jours ou il existe une version étudiants gratuite avec une limite dans le taille du modèle www.ssicentral.com/lisrel/downloads.html
Cours de Statistique Multivariée Approfondie 5
AMOS: Les étapes
Étapes dans l’étude d’un modèle structurel avec Amos Graphics:
1. Obtenir un jeu de données sans données manquantes avec si possible des données multinormales
2. Vérifier l’unidimensionnalité des blocs de variables
3. Charger les données (Files – Data Files…)
4. Dessiner le modèle LISREL avec les variables latentes (ellipses), les variables manifestes (rectangles) et les erreurs de mesure (cercles)
5. Modifier les paramètres d’estimation si nécessaire (View/Set – Analysis Propreties…)
6. Estimer le modèle en utilisant la commande (Model Fit – Calculate Estimates)
7. Étudier les coefficients obtenus sur le modèle et les tableaux de sortie dans (View/Set – Table output)
Cours de Statistique Multivariée Approfondie 6
LISREL: Les étapes
Étapes dans l’étude d’un modèle structurel avec LISREL:
1. Obtenir un jeu de données avec si possible des données multinormales
2. Compléter les données manquantes et obtenir la matrice de covariance (*.cov) ou les données en format (*.psf) grâce au logiciel PRELIS intégré dans LISREL
3. Vérifier l’unidimensionnalité des blocs de variables
4. Paramétriser le modèle LISREL en utilisant le langage SIMPLIS
5. Donner les paramètres d’estimation si nécessaire
6. Estimer le modèle en utilisant la commande L
7. Étudier les coefficients obtenus sur le modèle et les tableaux de sortie (transformation possible en LaTEX)
Cours de Statistique Multivariée Approfondie 7
LISREL: Exemple de commande
Analyse de la structure de covariance du modèle à 3 variables manifestes
Observed Variables
V1 V2 V3 V4 V5 V6 V7 V8 V9
Raw data from file ‘…\exemple.psf'
Sample Size = 1000
Latent Variables L1 L2 L3
Relationships
V1 V2 V3= L1
V4 V5 V6= L2
V7 V8 V9 = L3
L2 = L1
L3 = L1 L2
Path Diagram
End of Problem
Définition des variables manifestes
Définition du fichier de données
Définition des variables latentes
Relations du modèle de mesure
Relations du modèle interne
Affichage du modèle graphique
Cours de Statistique Multivariée Approfondie 9
Les données manquantes en LISREL
Délétion par listes, Délétion par paires, Imputation de la moyenne, Imputation multiple par algorithme EM (Expectation Maximization)
Une méthode spécifique: Full Information Maximum Likelihood
Méthode prenant en compte uniquement les données disponibles sans mécanisme de complétion dans le calcul de la matrice de covariance.
Cette méthode maximise la vraisemblance casewise des données observées.
C’est la méthode qui obtient en général les meilleurs résultats en terme de biais des estimations.
Cours de Statistique Multivariée Approfondie 10
Démonstration: L’approche PLS
Nous utiliserons le logiciel XLSTAT 2011
Nous utiliserons les données de Russett du dernier cours (Instabilité Politique)
XLSTAT est disponible à l’essai durant 30 jours sur www.xlstat.com .
Le module PLSPM est le plus abouti du marché en terme d’application de l’approche PLS.
Cours de Statistique Multivariée Approfondie 11
Le modèle
GINI
FARM
RENT
GNPR
LABO
Inégalité agricole (ξ1)
Développement industriel (ξ2)
ECKS
DEAT
D‐STB
D‐INS
INST
DICT
Instabilitépolitique (ξ3)
ξ1
ξ2
ξ3
+++
+
‐
+++‐++
+
‐
Cours de Statistique Multivariée Approfondie 12
XLSTAT PLSPM: Les étapes
Étapes dans l’étude d’un modèle structurel avec XLSTAT‐PLSPM :
1. Ouvrir les données dans Excel.
2. Charger le logiciel.
3. Créer un nouveau projet PLSPM.
4. Copier les données dans la feuille D1.
5. Dessiner le modèle PLS avec les variables latentes (ellipses) dans la feuille PLSPMGraph.
6. Cliquer sur les variables latentes et sélectionner les variables manifestes à partir des données.
7. Lancer les calculs.
8. Étudier les sorties dans la feuille PLSPM générée.
Cours de Statistique Multivariée Approfondie 13
XLSTAT‐PLSPM : La standardisation des VM
Plusieurs méthodes de standardisation des variables manifestes existent:
Cours de Statistique Multivariée Approfondie 15
Étude du petit questionnaire distribué
Variables de groupe
Image
Satisfaction
Engagement
Cours de Statistique Multivariée Approfondie 16
Étude du petit questionnaire distribué
Image générale
Perception autourde vous
Qualité de formation
Utilité de formation
Parrainage
Réinscription
Image du Cnam
Satisfaction des auditeurs
Engagement desauditeurs
Cours de Statistique Multivariée Approfondie 17
Étude du petit questionnaire distribué
Aucune identification n’est possible avec la méthode LISREL En raison de la faible taille de l’échantillon.
Avec l’approche PLS, l’algorithme converge et on peut ainsi analyser les résultats.
Cours de Statistique Multivariée Approfondie 18
Étude du petit questionnaire distribué 2010‐2011
N = 26
Cours de Statistique Multivariée Approfondie 19
Étude du petit questionnaire distribué 2009‐2010
N = 17
Cours de Statistique Multivariée Approfondie 20
Étude du petit questionnaire distribué 2007‐2008
N = 19
Cours de Statistique Multivariée Approfondie 21
Étude du petit questionnaire distribué 2006‐2007
N = 20
Cours de Statistique Multivariée Approfondie 22
Étude du petit questionnaire distribué 2005‐2006
N = 24
Cours de Statistique Multivariée Approfondie 23
Étude du petit questionnaire distribué
Ces résultats montre une forte influence de la satisfaction sur l’engagement des auditeurs. L’image du CNAM a une influence non significative sur l’engagement.
Ces résultats nous permettent de conseiller au CNAM d’améliorer la qualité de ces formations afin d’obtenir plus de nouveaux inscrits.
L’utilisation de méthodes de bootstrap nous permettent d’obtenir des intervalles de confiance. Ainsi, en 2010‐2011, mise à part la relation image – fidélité, les autres relations sont significatives.
Les R2 pour 2010‐2011 sont très bas, les résultats sont peu significatifs. Il y a de faibles différences entre 2010 et les 4 années précédentes.
Comment améliorer ces résultats:
‐ augmenter la taille de l’échantillon,
‐ ajouter des variables manifestes afin d’améliorer le modèle de mesure.
Cours de Statistique Multivariée Approfondie 24
Quelques problèmes associés aux modèles d’équations structurelles à variables latentes
Résultats des exercies distribués
Cours de Statistique Multivariée Approfondie 25
Modélisation graphique ‐ LISREL ‐ 1
1 1
2 1
3 2
4 2
2 1
0,7 0,30,4 0,50,7 0,20,5 0,10,6 0,4
xxxx
ξξξξ
ξ ξ
= += += +
= += +
0,3
ξ1
ξ2
x1
x2
x3
x4
δ 1
δ 2
ε 3
ε 4
ζ2
0,5
0,2
0,1 0,4
0,6
0,7
0,4
0,7
0,5
Cours de Statistique Multivariée Approfondie 26
Modélisation graphique ‐ LISREL ‐ 2
ξ1
ξ2
x1
x2
x3
x4
δ1
δ2
ε3
ε4
ζ2
ξ3
ξ4
x5
x6
x7
x8
ε5
ε6
ε7
ε8
ζ4
ζ3 1 1 1 1
2 2 1 2
3 3 2 3
4 4 2 4
5 5 3 5
2 12 1 32 3 2
3 13 1 3
4 14 1 24 2 34 3 4
...
xxxxx
π ξ δπ ξ δπ ξ επ ξ επ ξ ε
ξ β ξ β ξ ζξ β ξ ζξ β ξ β ξ β ξ ζ
= += += +
= += +
= + +
= +
= + + +
Cours de Statistique Multivariée Approfondie 27
Modélisation graphique ‐ PLS ‐ 1
0,4ξ1
ξ2
0,2 ξ3x5
x6
x1
x2
x3
x4
0,7
0,7
0,5
0,4
0,3
0,6
0,4
1 1
2 1
3 2
4 2
5 3
6 3
2 1
3 1 2
0,7 0,30, 4 0,50,7 0,20,5 0,10, 4 0,20,3 0,30, 2 0, 40,6 0, 4 0,1
xxxxxx
ξξξξξξ
ξ ξξ ξ ξ
= += += +
= += +
= += += + +
Cours de Statistique Multivariée Approfondie 28
Modélisation graphique ‐ PLS ‐ 2
1 1 3 4
2 2 5 6
3 7 8
4 9 10
2 1
4 1 2 3
0,7 0,3 0,6 0,40,4 0,5 0,3 0,10,7 0,2 0,20,5 0,1 0,10,2 0,10,6 0,4 0,2 0,1
x x xx x xx xx x
ξξξξξ ξξ ξ ξ ξ
= + + += + + += + += + += += + + +
ξ1
ξ2
0,2
ξ3x7
x8
x1
x3
x2
x5
0,7
0,3
0,4
0,5
0,2
ξ4x9
x10
0,5
0,1
0,7
0,20,6
0,4
x4 0,6
x60,3
Cours de Statistique Multivariée Approfondie 29
Quelques problèmes associés aux modèles d’équations structurelles à variables latentes
Cours de Statistique Multivariée Approfondie 30
Quelques problèmes associés aux modèles d’équations structurelles à variables latentes –
Cas1 – Analyse sensorielle
CaractéristiquesBloc 1
CaractéristiquesBloc 2
CaractéristiquesBloc 3
Juges bloc 1
Juges bloc 2
Juges bloc 3
Une solution possible serait la suivante:
avec l’approche PLS et certaines variables formatives et d’autres réflectives
Cours de Statistique Multivariée Approfondie 31
Quelques problèmes associés aux modèles d’équations structurelles à variables latentes –
Cas 2 – SatisfactionImage
Perceivedvalue
CustomerExpectation
Perceivedquality
Loyalty
Customersatisfaction
Complaint
.493 (.000)R2=.243
.545 (.000)
.066 (.314)
.037 (.406)
.153 (.006)
.212 (.002)
.540(.000)
.544 (.000)
.200 (.000)
.466(.000)
.540(.000)
.05 (.399)
R2=.297
R2=.335 R2=.672
R2=.432
R2=.292
Les valeurs entre parenthèses sont les p‐valeurs (le poids associé est significatif si la p‐valeur<0,05)
Le principal levier de la fidélité (loyalty) est la satisfaction des clients. Il faudra donc appuyer sur cette satisfaction et sur la qualité perçue qui est le principal levier de la satisfaction.
Cours de Statistique Multivariée Approfondie 32
Quelques problèmes associés aux modèles d’équations structurelles à variables latentes –
Cas 3
Ce modèle est bien défini et chaque coefficient est significatif, ainsi chaque relation peut être étudiée. On se rend compte que l’utilisation de l’ordinateur a un effet négatif sur l’attitude face à l’ordinateur alors qu’elle a un effet positif sur la confiance. D’autres remarques simples peuvent être faites en “lisant” le modèle.
Cours de Statistique Multivariée Approfondie 33
• Orienté vers la prédiction des variables manifestes et latentes (basé sur la variance)
• Modèle externe réflectif et formatif
• Sans distribution• Les observations peuvent être
dépendantes• Chaque VL est une combinaison
linéaire de ces propres VM• Consistance au sens large• Prédiction optimale• Évaluation de la qualité de
prévision par jackknife (Q2)• Meilleur modèle de mesure car
les VL sont estimées dans l’espace de leur propres VM
• Orienté vers l’estimation des paramètres (basé sur la covariance)
• Modèle externe réflectif• Hypothèses de distribution• Les observations doivent être
indépendantes• Les facteur ne sont pas estimés• L’estimation des VL est faite sur
l’ensemble des VM• Estimations consistantes• Paramètres optimaux• Évaluation du modèle par tests
d’hypothèse (N doit être grand)• Meilleur modèle structurel car les VL
sont estimées sans restriction d’espace
PLS est lié à LISREL de la même façon que l’ACP à l’analyse factorielle
Rappel: PLS vs LISREL