lección magistral pedro m. valero mora facultat de psicologia universitat de valència datos...
TRANSCRIPT
![Page 1: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/1.jpg)
Lección Magistral
Pedro M. Valero Mora
Facultat de Psicologia
Universitat de València
Datos Faltantes Multivariantes
![Page 2: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/2.jpg)
Ubicación
Esta lección corresponde al Bloque de contenidos sobre Datos Faltantes en su parte Avanzada
Introduce contenidos Teóricos y además Actividades que podrían realizarse en las Prácticas de la Asignatura
![Page 3: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/3.jpg)
El problema
Cuando un sujeto no responde a una pregunta nos encontramos ante un caso con un valor faltante
Algunas variables que producirán valores faltantes a menudo son:
![Page 4: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/4.jpg)
El problema
Los valores faltantes producen dos tipos de problemas Problemas de Cálculo
Problemas de Sesgo
![Page 5: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/5.jpg)
El problema: Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
yy
?
101 y 72 y
94 y93 y
![Page 6: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/6.jpg)
El problema: Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
24434241
34233231
24232221
14131221
9879
8969
7677
99710
![Page 7: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/7.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Borrado Caso por Caso
Ventajas
Matriz Completa
Disponibilidad
Aceptación
![Page 8: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/8.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Borrado Caso por Caso
Desventajas
Agresiva
Diferentes casos según modelo
Sesgo
![Page 9: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/9.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Borrado por Pares
Ventajas
Menos Agresiva
Disponibilidad
Aprovechable a veces
![Page 10: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/10.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Borrado por Pares
Desventajas
Los paquetes estadísticos no las usan
El número de casos es inestable en cada par
![Page 11: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/11.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 3 7 43 4 5 6 74 5 2 2 75 9 6 7 66 4 5 6 87 6 5 8 38 6 7 8 99 4 5 5 610 8 5 6 7
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
M
24434241
34233231
24232221
14131221
t 0
![Page 12: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/12.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 3 7 43 4 5 6 74 5 2 2 75 9 6 7 66 4 5 6 87 6 5 8 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 1
E
![Page 13: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/13.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 5 7 83 4 5 6 74 5 2 2 75 9 3 7 66 4 5 6 87 6 5 9 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 1
E
![Page 14: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/14.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 5 7 83 4 5 6 74 5 2 2 75 9 3 7 66 4 5 6 87 6 5 9 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 1
E
M
![Page 15: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/15.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 5 7 83 4 5 6 74 5 2 2 75 9 3 7 66 4 5 6 87 6 5 9 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 2
![Page 16: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/16.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 5 7 83 4 5 6 74 5 2 2 75 9 3 7 66 4 5 6 87 6 5 9 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 2
E
![Page 17: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/17.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 1 7 63 4 5 6 74 5 2 2 75 9 2 7 66 4 5 6 87 6 5 2 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 2
E
![Page 18: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/18.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Id Y1 Y2 Y3 Y41 10 5 3 82 5 5 7 83 4 5 6 74 5 2 2 75 9 3 7 66 4 5 6 87 6 5 9 38 6 7 8 99 4 5 5 610 8 5 6 7
24434241
34233231
24232221
14131221
t 2
E
M
![Page 19: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/19.jpg)
Soluciones a los Problemas de Cálculo
Estimación-Maximización
Criterio de detención
t t-1
24434241
34233231
24232221
14131221
t t
24434241
34233231
24232221
14131221
- < 0.0001
![Page 20: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/20.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Estimación-Maximización
Ventajas
Poco Agresiva
Matriz Completa
Estimaciones de las Puntuaciones
Matriz Covarianzas bien definida
![Page 21: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/21.jpg)
Soluciones a los Problemas de Cálculo
Id Y1 Y2 Y3 Y41 10 5 3 82 5 X 7 X3 4 5 6 74 5 2 2 75 9 X 7 66 4 5 6 87 6 5 X 38 6 7 8 99 4 X 5 610 8 5 6 7
Estimación-Maximización
Desventajas
“Inventar datos”
Las puntuaciones están sobreajustadas
No disponibles
Supuestos acerca de mecanismos
![Page 22: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/22.jpg)
El problema: Sesgo
Ser Faltante es independiente de Y y de X= Datos Faltantes Completamente al Azar(FCA)
Caso a Caso
Estimación-Maximización
Educación
Sal
ario
![Page 23: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/23.jpg)
El problema: Sesgo
Estimación-Maximización
Educación
Sal
ario
Ser Faltante depende de X pero no de Y= Datos Faltantes al Azar (FA)
![Page 24: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/24.jpg)
El problema: Sesgo
Mecanismo No Ignorable
Ni FA ni FCA
Ningún Método
Educación
Sal
ario
![Page 25: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/25.jpg)
Exploración de datos faltantes
¿Cómo podemos evaluar unos datos que no tenemos?
Comparando los diversos resultados
ViSta.exe
![Page 26: Lección Magistral Pedro M. Valero Mora Facultat de Psicologia Universitat de València Datos Faltantes Multivariantes](https://reader035.vdocuments.site/reader035/viewer/2022062410/5665b4551a28abb57c909ee5/html5/thumbnails/26.jpg)
Conclusiones
La exploración de datos faltantes con ViSta permite:
• Comprobar el efecto de los valores faltantes sobre nuestros datos
• Evaluar el sesgo que introducen
• Esta exploración puede realizarse de modo interactivo por el alumno, explorando las interconexiones entre gráficos