5 - diseño factorial
DESCRIPTION
Curso de Diseño experimental. Diseño Factorial. Para estudiantes de Ciencias Agrarias y Forestales.TRANSCRIPT
Diseño Factorial: Análisis de Varianza Factorial
Marcelo Rodríguez G.Ingeniero Estadístico - Magister en Estadística
Universidad Católica del Maule
Facultad de Ciencias Básicas
Ingeniería en Agronomía
Diseño Experimental
21 de marzo de 2011
[email protected] (UCM) Diseño Factorial 21/03/2011 1 / 33
Introducción
De�nición (Análisis de Varianza Factorial)
El objetivo es investigar, en forma simultánea, los efectos que tienen variosfactores (variables independientes) sobre la variable dependiente. Todos losniveles de un factor se combinan con todos los niveles de cualquier otropara formar los tratamientos. Es posible evaluar los efectos individuales delos factores sobre la variable dependiente y determinar el efecto causadopor sus interacciones. El modelo matemático sería
yijk = µ+ αi + βj + (αβ)ij + εijk
Ejemplo
Suponga un diseño con dos factores el A y el B. El factor A tiene 2 niveles(a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existirían 6tratamientos, cada uno formado por las combinaciones de estos niveles.
[email protected] (UCM) Diseño Factorial 21/03/2011 2 / 33
Características de los datos
(Los datos)
La variable dependiente es cuantitativa.
Los factores son categóricos; pueden tener valores numéricos o valoresde cadena de hasta ocho caracteres.
(Supuestos)
Los datos son una muestra aleatoria de una población normal; en lapoblación, todas las varianzas de las casillas son iguales.
El análisis de varianza es robusto a las desviaciones de la normalidad,aunque los datos deberán ser simétricos.
Para comprobar los supuestos, puede utilizar la prueba dehomogeneidad de varianzas y los grá�cos de dispersión por nivel.También puede examinar los residuos y los grá�cos de residuos.
[email protected] (UCM) Diseño Factorial 21/03/2011 3 / 33
Ejemplo: Cantidad de trigo cosechado
El objetivo es determinar si existen diferenciasapreciables en la cantidad de trigo cosechado,de entre 3 variedades y 2 tipos de fertilizantes.Para el experimento se encontró una área muygrande de siembra en la que las condiciones delsuelo eran, prácticamente, homogéneas.
Variedad de trigo
Fertilizante 1 2 3
1 35 45 2426 39 2338 39 3620 43 29
2 55 64 5844 57 7468 62 4964 61 69
El área fue dividida en 6 zonas de igual tamaño para las 6 combinacionesde variedad de trigo y tipo de fertilizante. Para medir el error experimental,cada zona se dividió a su vez en cuatro y cada una de éstas recibió elmismo tratamiento. En el momento de la cosecha se observaron los datosque aparecen en la tabla siguiente.
[email protected] (UCM) Diseño Factorial 21/03/2011 4 / 33
Notación y Arreglo de los datos
B
A 1 2 · · · b Media
1 y111 y121 · · · y1b1y112 y122 · · · y1b2...
......
...y11r y12r · · · y1bry11� y12� · · · y1a� y1��
2 y211 y221 · · · y2b1y212 y222 · · · y2b2...
......
...y21r y22r · · · y2bry21� y22� · · · y2b� y2��
......
......
......
a ya11 ya21 · · · yab1ya12 ya22 · · · yab2...
......
...ya1r ya2r · · · yabr
ya1� ya2�... yab� ya��
Media y �1� y �2� · · · y �b� y
t = a · b (n◦ de tratamientos)
n = t · r (tamaño de muestra)
y =1
n
a∑i=1
b∑j=1
r∑k=1
yijk
y ij � =1
r
r∑k=1
yijk
y i �� =1
b
b∑j=1
y ij �
y �j � =1
a
a∑i=1
y ij �
[email protected] (UCM) Diseño Factorial 21/03/2011 5 / 33
Descomposición de la suma de cuadrados
(Suma de cuadrados total)
SCT =a∑
i=1
b∑j=1
r∑k=1
(yijk − y)2
(Suma de cuadrados de los tratamientos)
SCTR =a∑
i=1
b∑j=1
r∑k=1
(y ij � − y)2
(Suma de cuadrados del error)
SCE = SCT− SCTR
[email protected] (UCM) Diseño Factorial 21/03/2011 6 / 33
Descomposición de la suma de cuadrados
(Suma de cuadrados del factor A)
SCA =a∑
i=1
b∑j=1
r∑k=1
(y i �� − y)2
(Suma de cuadrados del factor B)
SCB =a∑
i=1
b∑j=1
r∑k=1
(y �j � − y)2
(Suma de cuadrados del factor A y B)
SCAB = SCTR− SCA− SCB
[email protected] (UCM) Diseño Factorial 21/03/2011 7 / 33
Ejemplo: Cantidad de trigo cosechado
Variedad de trigo (B)
Fertilizante (A) 1 2 3 Media
1 35 45 2426 39 2338 39 3620 43 29
y11�=29,75 y12�=41,50 y13�=28,00 y1��=33,083
2 55 64 5844 57 7468 62 4964 61 69
y21�=57,75 y22�=61,00 y23�=62,50 y2��=60,416
Media y �1�=43,75 y �2�=51,25 y �3�=45,25 y=46,75
SCT =2∑
i=1
3∑j=1
4∑k=1
(yijk − 46, 75)2 = (35− 46, 75)2 + (26− 46, 75)2 + · · ·+ (69− 46, 75)2 = 6042, 5
SCTR =2∑
i=1
3∑j=1
4∑k=1
(y ij � − 46, 75)2 = 4[(29, 75− 46, 75)2 + (57, 75− 46, 75)2 + · · ·+ (62, 50− 46, 75)2] = 4961
SCE = 6042, 5− 4961 = 1081, 5
SCA =2∑
i=1
3∑j=1
4∑k=1
(y i �� − 46, 75)2 = 12[(33, 083− 46, 75)2 + (60, 416− 46, 75)2] = 4482, 6
SCB =2∑
i=1
3∑j=1
4∑k=1
(y �j � − 46, 75)2 = 8[(43, 753− 46, 75)2 + (51, 25− 46, 75)2 + (45, 25− 46, 75)2] = 252
SCAB = 4961− 4482, 6− 252 = 226, 3
[email protected] (UCM) Diseño Factorial 21/03/2011 8 / 33
Prueba de hipótesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc
cuadrados libertad cuadrática
Factor A SCA a − 1 MCA=SCA
(a − 1)FA =
MCA
MCE
Factor B SCB b − 1 MCB=SCB
(b − 1)FB =
MCB
MCE
Interacción A y B SCAB (a − 1)(b − 1) MCAB=SCAB
(a − 1)(b − 1)FAB =
MCAB
MCE
Error SCE n − ab MCE=SCE
(n − ab)Total SCT n − 1
(Hipótesis: Efecto atribuible al factor A)
H0 : µ1�� = µ2�� = · · · = µa�� v/s H1 : µi �� 6= µj ��, para algún i , jReglas para el rechazo de H0:
Fijar α y Rechace H0 si FA > F1−α(a − 1, n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FA).
[email protected] (UCM) Diseño Factorial 21/03/2011 9 / 33
Prueba de hipótesis
(Hipótesis: Efecto atribuible al factor B)
H0 : µ�1� = µ�2� = · · · = µ�b� v/s H1 : µ�i � 6= µ�j �, para algún i , jReglas para el rechazo de H0:
Fijar α y Rechace H0 si FB > F1−α(b − 1, n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FB).
(Hipótesis: Efecto atribuible a la interacción entre A y B)
H0 : µij �+µ = µ�j �+µi �� v/s H1 : µij �+µ 6= µ�j �+µi ��, para todo i , jReglas para el rechazo de H0:
Fijar α y Rechace H0 si FAB > F1−α((a − 1)(b − 1), n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FAB).
[email protected] (UCM) Diseño Factorial 21/03/2011 10 / 33
Prueba de hipótesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc Valor−pcuadrados libertad cuadrática
Fertilizante (A) 4482,667 1 4482,667 74,607 < 0, 01Variedad (B) 252 2 126 2,097 [0, 10; 0, 25]
Interacción (A y B) 226,333 2 113,167 1,883 [0, 10; 0, 25]Error 1081,5 18 60,083Total 6042,5 23
Si α = 0, 05, entonces existen diferencias atribuibles al fertilizante,pues FA = 74, 607 > F0,95(1, 18) = 4, 41
Si α = 0, 05, entonces NO existen diferencias atribuibles a la variedad,pues FB = 2, 097 < F0,95(2, 18) = 3, 55
Si α = 0, 05, entonces NO existen diferencias atribuibles al fertilizantey variedad, pues FAB = 1, 883 < F0,95(2, 18) = 3, 55
Note que sólo en el caso del fertilizante, el valor−p es menor que 0,05.Esto indicaría que solo existiría un efecto atribuible a los fertilizantes.
[email protected] (UCM) Diseño Factorial 21/03/2011 11 / 33
Ejemplo de un ANOVA factorial en SPSS
(Ejemplo de un ANOVA factorial en SPSS)
En SPSS, Analizar -> Modelo lineal general -> Univariante.
1 Seleccionar la variable dependiente y trasladarla al cuadro Variable
dependiente.
2 Seleccionar tanto las variables-factores y trasladarlas a la listaFactores �jos.
3 Luego, Aceptar.
[email protected] (UCM) Diseño Factorial 21/03/2011 12 / 33
Ejemplo de un ANOVA factorial en SPSS
Puede descargar los datos desde http://bit.ly/trigo_factorial.
[email protected] (UCM) Diseño Factorial 21/03/2011 13 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 14 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 15 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 16 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 17 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 18 / 33
Ejemplo de un ANOVA factorial en SPSS
[email protected] (UCM) Diseño Factorial 21/03/2011 19 / 33
Ejemplo de un ANOVA factorial en SPSS
NDesviación
típicaMedia
1
2
3
Total
1
2
3
Total
1
2
3
Total
1
2
Total
2416,20946,75
820,22645,25
810,78051,25
817,37643,75
128,47960,42
411,21062,50
42,94461,00
410,65857,75
128,36133,08
45,94428,00
43,00041,50
48,26129,75
Fertilizante Variedad de trigoFertilizante Variedad de trigo
Estadísticos descriptivos
Variable dependiente:Cantidad
Sig.gl2gl1F
,0231853,471
Contraste de Levene sobre la igualdad de las varianzas error
a
Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.
a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad
Variable dependiente:Cantidad
Página 26
Se entregarán los promedios y desviaciones estándar para cada tratamiento(combinaciones de los niveles de los factores), estos indicadores, nospermiten tener una visión general de la comparación de las medias.
[email protected] (UCM) Diseño Factorial 21/03/2011 20 / 33
Ejemplo de un ANOVA factorial en SPSS
NDesviación
típicaMedia
1
2
3
Total
1
2
3
Total
1
2
3
Total
1
2
Total
2416,20946,75
820,22645,25
810,78051,25
817,37643,75
128,47960,42
411,21062,50
42,94461,00
410,65857,75
128,36133,08
45,94428,00
43,00041,50
48,26129,75
Fertilizante Variedad de trigoFertilizante Variedad de trigo
Estadísticos descriptivos
Variable dependiente:Cantidad
Sig.gl2gl1F
,0231853,471
Contraste de Levene sobre la igualdad de las varianzas error
a
Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.
a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad
Variable dependiente:Cantidad
Página 26
Este método prueba la hipótesis de homogeneidad de varianzas, se deberíarechazar la hipótesis de que las varianzas (entre los grupos), son iguales, siel valor−p es menor que 0,05. En este caso el valor−p = 0, 023, lo queindicaría es que no se está cumpliendo el supuesto de homogeneidad.
[email protected] (UCM) Diseño Factorial 21/03/2011 21 / 33
Ejemplo de un ANOVA factorial en SPSS
Sig.FMedia
cuadráticagl
Suma de cuadrados
tipo III
Modelo corregido
Intersección
Fertilizante
Variedad
Fertilizante * Variedad
Error
Total
Total corregida 236042,500
2458496,000
60,083181081,500
,1811,883113,1672226,333
,1522,097126,0002252,000
,00074,6074482,66714482,667
,000873,01252453,500152453,500
,00016,514992,20054961,000a
OrigenOrigen
Pruebas de los efectos inter-sujetos
Variable dependiente:Cantidad
a. R cuadrado = ,821 (R cuadrado corregida = ,771)
Pruebas post hoc
Variedad de trigo
Página 27
Esta tabla de ANOVA es la misma que encontramos anteriormente, noteque sólo en el caso del fertilizante, el valor−p = 0, 000 es menor que 0,05.Lo que indicaría que existe un efecto atribuible al fertilizante, en lacantidad de trigo cosechado (se rechaza H0 : µ1 = µ2).
[email protected] (UCM) Diseño Factorial 21/03/2011 22 / 33
Ejemplo de un ANOVA factorial en SPSS
También se han solicitado las comparaciones múltiples, entre las variedades,no se pide la comparación de los fertilizantes, pues son sólo dos y elmétodo anterior ya se concluyó que di�eren. El método de Tukey utilizacomo MCE la MCE del ANOVA Factorial y no la del ANOVA un Factor.
Sig.Error típ.Diferencia de medias (I-J)
Límite superiorLímite inferior
Intervalo de confianza 95%
2
3
1
3
1
2
1
2
3
3,89-15,89,2933,876-6,00
11,39-8,39,9213,8761,50
15,89-3,89,2933,8766,00
17,39-2,39,1583,8767,50
8,39-11,39,9213,876-1,50
2,39-17,39,1583,876-7,50
(I)Variedad de trigo (J)Variedad de trigo(I)Variedad de trigo (J)Variedad de trigo
Comparaciones múltiples
Basadas en las medias observadas. El término de error es la media cuadrática(Error) = 60,083.
CantidadDHS de Tukey
Subconjuntos homogéneos
Página 28
El método indicaría que cuando se hacen las comparaciones de a pares enlas variedades, no existirían diferencias signi�cativas (valores−p >0,05).Esto es lógico, pues la ANOVA nos había dicho lo mismo.
[email protected] (UCM) Diseño Factorial 21/03/2011 23 / 33
Ejemplo de un ANOVA factorial en SPSS
Estos grá�cos de medias son útiles para detectar efectos de interacción,cuando la interacción es signi�cativa, las líneas tienden a cruzarse, demanera muy marcada (en forma de X), en este caso existe una interacción,pero no es signi�cativa (según el ANOVA, pues el valor−p = 0, 181).
Fertilizante
21
Med
ias
mar
gin
ales
est
imad
as
60
50
40
30
Medias marginales estimadas de Cantidad
321
Variedad de trigo
Página 33
Variedad de trigo
321
Med
ias
mar
gin
ales
est
imad
as
60
50
40
30
Medias marginales estimadas de Cantidad
21
Fertilizante
Página 34
[email protected] (UCM) Diseño Factorial 21/03/2011 24 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
Se ha solicitado que SPSS entregue los valores pronosticados
(PRED1=promedio del tratamiento) por el modelo y los Residuos
(RES1=distancia entre el valor real y el valor pronosticado).
[email protected] (UCM) Diseño Factorial 21/03/2011 25 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
Existen 6 tratamiento, se ha creado una nueva columna con lostratamientos.
[email protected] (UCM) Diseño Factorial 21/03/2011 26 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
[email protected] (UCM) Diseño Factorial 21/03/2011 27 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
[email protected] (UCM) Diseño Factorial 21/03/2011 28 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
[email protected] (UCM) Diseño Factorial 21/03/2011 29 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
[email protected] (UCM) Diseño Factorial 21/03/2011 30 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
SPSS entrega la prueba de Kolmogorov-Smirnov y la prueba deShapiro-Wilk, la cual se utiliza cuando n ≤ 50, en caso contrario seutiliza la prueba de Kolmogorov-Smirnov. Ambos métodos son paraveri�car el supuesto de normalidad.Utilizando la prueba de Shapiro-Wilk, para cada tratamiento elvalor−p (sig.) es mayor que 0,05. Entonces, no se puede rechazar lahipótesis de normalidad.
[Conjunto_de_datos1] C:\Users\13865271\Desktop\trigo factorial2.sav
tratamientos
PorcentajeN PorcentajeN PorcentajeN
TotalPerdidosVálidos
Casos
1
2
3
4
5
6
Residuo para Cantidad
100,0%4,0%0100,0%4
100,0%4,0%0100,0%4
100,0%4,0%0100,0%4
100,0%4,0%0100,0%4
100,0%4,0%0100,0%4
100,0%4,0%0100,0%4
tratamientostratamientos
Resumen del procesamiento de los casos
Sig.glEstadístico Sig.glEstadístico
Shapiro-WilkKolmogorov-Smirnova
1
2
3
4
5
6
Residuo para Cantidad
,7714,959.4,219
,7344,953.4,250
,7164,950.4,221
,4304,900.4,250
,2244,849.4,298
,6504,939.4,237
tratamientostratamientos
Pruebas de normalidad
a. Corrección de la significación de Lilliefors
Página 93
[email protected] (UCM) Diseño Factorial 21/03/2011 31 / 33
Ejemplo de un ANOVA factorial en SPSS: Veri�cación de
los supuestos de los residuos
Esta prueba de hipótesis ya fue entregada por SPSS, es la misma prueba dehipótesis de homogeneidad de varianza (Prueba de Levene basado en lamedia) entregada anteriormente y la conclusión sería la misma: Rechazar elsupuesto de homogeneidad (valor−p = 0, 023 < 0, 05).
Sig.gl2gl1Estadístico de
Levene
Basándose en la media
Basándose en la mediana.
Basándose en la mediana y con gl corregido
Basándose en la media recortada
Residuo para Cantidad
,0231853,464
,05911,39352,984
,0391852,984
,0231853,471
Prueba de homogeneidad de la varianza
Residuo para Cantidad
Gráficos Q-Q normales
Página 94
tratamiento
654321
Res
idu
o p
ara
RE
S_1
15,00
10,00
5,00
0,00
-5,00
-10,00
-15,00
Página 1
Hay que ser cautelosos con el supuesto de homogeneidad, pues si utilizamosel estadístico de Levene basado en la mediana con gl corregido , podríamosasumir el supuesto de homogeneidad (valores−p = 0, 059 > 0, 05).
[email protected] (UCM) Diseño Factorial 21/03/2011 32 / 33
¾Qué hacer si no se cumplen los supuestos de normalidad u
homogeneidad?
Cuando no se cumplen los supuestos de normalidad u homogeneidad, serecomienda transformar la variable dependiente, algunas transformacionesclásicas son: Logarítmica (y = ln(x)), Exponencial (y = exp(x)), Inversa(y = 1/x), etc.
[email protected] (UCM) Diseño Factorial 21/03/2011 33 / 33