Estadística Aplicada 2. Tema 3. Análisis de Varianza 1
Estadística Aplicada 2.
Tema 3. Análisis de Varianza
Estadística Aplicada 2. Tema 3. Análisis de Varianza 2
DefiniciónEstudio del efecto que distintas situaciones experimentales tienen sobre ciertas respuestas cuantitativas.
• Todo experimento contiene:
1. Conjetura: Hipótesis original.
2. Experimento: Prueba efectuada para investigar la conjetura.
3. Análisis: Estudio estadístico de los datos obtenidos durante el experimento.
4. Conclusión: Lo que se ha aprendido con la realización del experimento.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 3
Ejemplos• Estudiar el efecto de una marca de combustible sobre
el desempeño de un motor de automóvil (distancia recorrida por litro de gasolina).
• Estudiar el efecto de cuatro soluciones azucaradas (glucosa, sacarosa, fructosa y una mezcla) en el desarrollo bacteriano.
• Investigar el efecto de la concentración de madera dura en la pulpa sobre la resistencia de las bolsas fabricadas con la pulpa.
• Determinar si la densidad de color de la tela depende de la cantidad de colorante utilizado.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 4
Definiciones
• Factor: Característica que diferencia a los tratamientos (o poblaciones) entre sí.
• Niveles: Diferentes tratamientos (o poblaciones)
Factores
Cualitativos CuantitativosLos niveles corresponden a
posibles categorías del factorLos niveles corresponden a diferentes ajustes del factor
Estadística Aplicada 2. Tema 3. Análisis de Varianza 5
Tema 3. Análisis de Varianza
Experimentos con un factor
Estadística Aplicada 2. Tema 3. Análisis de Varianza 6
Diseño de experimentos de un factor
• Deseamos comprobar si la media de cada nivel de factor (cada tratamiento) es igual para todos.
• Esto es lo mismo que decir que el efecto de cada nivel es nulo.
• La hipótesis alternativa es que al menos un factor difiere de los demás
H0 :1 2 ...nA
H0 :1 2 ... nA0
Estadística Aplicada 2. Tema 3. Análisis de Varianza 7
Análisis de Varianza
• La prueba de hipótesis anterior infiere información sobre las medias.
• El proceso anterior se le conoce como análisis de varianza.
• El nombre puede resultar engañoso (¿por qué no se llama Análisis de Medias?) pero hay que ver el nombre como la técnica que intenta explicar el origen de las diferencias (varianza) para extraer conclusiones.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 8
Ejemplo con cuatro niveles
Los cuatro niveles tienen amplia variabilidad, que podría proceder de la muestra.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 9
Situación inversa
Estadística Aplicada 2. Tema 3. Análisis de Varianza 10
Modelo estadístico
• Un modelo lineal para analizar las diferencias sería el siguiente:
• Otra forma de entender la relación sería
Residuo N(0,σ2)
Efecto del tratamiento
i=1,…,nA (alternativas / tratamientos)j=1,…,n (observaciones)
𝑌𝑖𝑗 = 𝜇+𝜏𝑖 +𝜀𝑖𝑗
𝑌𝑖𝑗 = 𝜇𝑖 +𝜀𝑖𝑗
Estadística Aplicada 2. Tema 3. Análisis de Varianza 11
Representación de las observaciones
• Las observaciones acostumbran a ordenarse mediante una matriz como la mostrada a posteriori.
• Es importante identificar la notación y.. ya que se usa extensivamente a lo largo del tema.
ObservacionesTratamiento Totales Promedios
1 y11 y12 … y1n y1.
2 y21 y22 y2n y2.
. . . … . . .
. . . … . . .
nA ynA1 ynA2 … y nAn ynA.
y..
.1
y
.2y
.nAy
..y
Estadística Aplicada 2. Tema 3. Análisis de Varianza 12
Experimento con un factor
• El efecto de los tratamientos corresponde a desviaciones respecto a una media global μ. Por tanto:
• Y la prueba de hipótesis queda definida por:
ii1
na 0
H0 :1 2 ... nA0
Ha : i 0 Para alguna i
Estadística Aplicada 2. Tema 3. Análisis de Varianza 13
Notas
• Este modelo supone implícitamente que el factor no varía la varianza de la muestra (su único efecto es el cambio del valor medio esperado).
• El modelo puede plantearse como una regresión múltiple con diversas variables “dummy”. ¿Cómo?
• El experimento requiere aleatoriedad.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 14
Tipos de experimentos
Existen tres tipos principales de experimento cuyas diferencias pueden resultar confusas en ocasiones:
• Modelo de efectos fijos: Experimentos en el que los niveles (tratamientos) de los factores han sido escogidos a priori, y en los que se intenta extraer conclusiones únicamente de esos niveles.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 15
Tipos de experimentos
• Modelo de efectos aleatorios: Experimentos en que el número de niveles (tratamientos) es demasiado grande como para considerarse completamente, por lo que los niveles estudiados se escogen aleatoriamente. Posteriormente, se desea extraer conclusiones que sirvan para otros niveles usando la información disponible con los niveles considerados.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 16
Tipos de experimentos
• Modelo de efectos mixtos: En este caso aparecen factores fijos y factores aleatorios de forma conjunta.
• Este tipo de problema no será tratado en el presente curso, pero cabe indicar que existe este tipo de modelos.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 17
Ejemplos
• Modelo de tipo fijo: Se desea estudiar la modernización de la flota de camiones de una empresa y para ello se desea estudiar el efecto en los costes operativos de cuatro alternativas de un fabricante de camiones.
• Modelo de tipo aleatorio: Se desea estudiar el efecto en los costes operativos de los diferentes tipos de camiones que actualmente componen la flota de la empresa.
• Modelo de efectos mixtos: En este caso se desea estudiar posibles cambios (efecto aleatorio) en los modelos ofrecidos por el fabricante (efecto fijo).
Estadística Aplicada 2. Tema 3. Análisis de Varianza 18
Tema 3. Análisis de Varianza
Un factor. Efectos Fijos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 19
Modelo de efectos fijos
• En este caso la variabilidad total de los datos puede descomponerse en dos factores como sigue:
Variabilidad Total de los Datos
Variabilidad Debido al tratamiento
(Variabilidad Entre)
Variabilidad Inherente de los datos
(Variabilidad Dentro)
SST SSTr SSE
Estadística Aplicada 2. Tema 3. Análisis de Varianza 20
Efectos fijos
• Matemáticamente, el modelo equivale a:
SST SSTr SSE
yij y.. 2j1
n
i1
nA
n yi . y.. 2 i1
nA
yij yi . 2j1
n
i1
nA
i=1,…,nA (alternativas)j=1,…,n (observaciones)
Recordemos: yij
Dif. entre tratamientos(variabilidad entre)
Error aleatorio(variabilidad dentro)
Estadística Aplicada 2. Tema 3. Análisis de Varianza 21
Relación de cálculosObservacionesTratamiento Totales Promedios
1 y11 y12 … y1n y1.
2 y21 y22 … y2n y2.. . . … . . .. . . … . . .
nA ynA1 ynA2 … y nAn ynA.
y..
.1y
.2y
.nAy
..y
yij y.. 2j1
n
i1
nA
n yi . y.. 2 i1
nA
yij yi . 2j1
n
i1
nA
Error AleatorioDiferencia Entre Tratamientos
yi y 2j1
n
y j y j 2 j1
n
yi yi 2j1
n
Caso Regresión:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 22
Estimación de la varianza
• Puede demostrarse que:
• Por tanto, si H0 es cierta:
• Pero si Ha es cierta:
E SSTr nA 1 2 n i2
i1
nA
2
1
An
SSTrE
ESSTr
nA 1
2
n i2
i1
nA
nA 1
H0 :1 2 ... nA0
Ha : i 0
Recordemos:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 23
Estimación de la varianza
• Por tanto, si H0 es cierta:
• Pero si Ha es cierta:
• El cuadrado medio de los tratamientos equivale a:
2
1
An
SSTrE
ESSTr
nA 1
2
n i2
i1
nA
nA 1
Si H0 es falsa, MSTr sobreestima σ2, si no
es un estimador insesgado.
MSTrn
SSTr
A
1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 24
Estimación del error aleatorio
• Podemos demostrar que:
• Por lo que:
• Y el error cuadrático medio equivale a:
E SSE nA n 1 2
2
1
nn
SSEE
A
MSEnn
SSE
A
1
MSE siempre es un estimador insesgado
de σ2.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 25
Test de hipótesis nula
• Considerando a todas las muestras como observaciones procedentes de distribuciones normales, podemos verificar que:
• Cuando la H0 es cierta, F0 debería ser cercana a 1, mientras que el valor debería de crecer si H0 es falsa.
1;10 ~
1
1
nnnA
AAA
FMSE
MSTr
nnSSE
nSSTrF
Estadística Aplicada 2. Tema 3. Análisis de Varianza 26
Test de hipótesis nula
• El estadístico debe cumplir la siguiente condición:
• Como F0 se distribuye según una distribución F con ν1=nA-1 y ν2=nA (n-1) grados de libertad, la región de rechazo de la hipótesis nula corresponde a:
P F
0c | H
0 es verdadera
F0 F ,nA 1;nA n 1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 27
Fórmulas de cálculo
An
i
n
j Aij nn
yySST
1 1
22 ..
An
i A
i
nn
y
n
ySSTr
1
22 ...
Muestras con distinto tamaño en cada
tratamiento
Muestras con igual tamaño en cada
tratamiento
A in
i
n
jij N
yySST
1 1
22 ..
An
i i
i
N
y
n
ySSTr
1
22 ...
N: número total de observaciones
Estadística Aplicada 2. Tema 3. Análisis de Varianza 28
Tabla ANOVA
• Igual número de observaciones por tratamiento:
• Diferente número de observaciones :
Fuente de VariaciónGrados de Libertad
Suma de Cuadrados
Cuadrado Medio f
Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1) MSTr/MSEError nA(n-1) SSE MSE = SSE / [nA(n-1)]
Total nAn-1 SST
Fuente de VariaciónGrados de Libertad
Suma de Cuadrados
Cuadrado Medio f
Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1)MSTr/MSEError N-nA SSE MSE = SSE / [N-nA]
Total N-1 SST
Estadística Aplicada 2. Tema 3. Análisis de Varianza 29
Ejemplo 1
• Un fabricante de papel utilizado para fabricar bolsas de caramelo, está interesado en mejorar la resistencia a la tensión del producto medida en [psi] .
• El grupo de ingeniería del producto piensa que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa
• El rango de interés práctico de las concentraciones de madera dura está entre 5% y 20%.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 30
Ejemplo 1
• Se decide investigar cuatro niveles de concentración de madera dura: 5, 10, 15 y 20%.
• Se fabrican seis especímenes de prueba para cada nivel de concentración, utilizando una planta piloto.
• Los 24 especímenes se someten a prueba de tensión en laboratorio, siguiendo un orden aleatorio. Los datos obtenidos aparecen en la siguiente tabla:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 31
Datos y notas
• Notas:– Se sigue un modelo de efectos fijos.– Es importante recalcar que las pruebas se han
hecho en orden aleatorio.
Concentración de madera dura (%)
Observaciones
1 2 3 4 5 65 7 8 15 11 9 10
10 12 17 13 18 19 1515 14 18 19 17 16 1820 19 25 22 23 18 20
Estadística Aplicada 2. Tema 3. Análisis de Varianza 32
Cálculos
SST yij2
y2
Nj1
6
i1
4
SST 7 2 8 2 L 20 2 383 224
521,96
SSTr y
i2
n
y2
Ni1
4
SSTr 60 2 94 2 102 2 127 2
6
383 224
382,79
SSE SST SSTr 512,96 382,79 130,17
nA n
…
Estadística Aplicada 2. Tema 3. Análisis de Varianza 33
Tabla ANOVA
• Los cálculos ordenados en forma tabular son:
• En este caso el valor p = P(F3,20 ≥ 19,6) = 3,5910-6
• Por lo tanto al menos una de las concentraciones de pulpa de madera permite variación en la resistencia.
• ¿Podemos determinar qué tratamientos son significativamente distintos?
Fuente de Variación
Grados de Libertad
Suma de Cuadrados Cuadrado Medio f
Tratamientos 3 382,79 127,619,6
Error 20 130,17 6,51Total 23 512,96
Estadística Aplicada 2. Tema 3. Análisis de Varianza 34
Métodos de comparación múltipleAlternativas:• Método LSD de Fisher:
– Fácil de calcular– Trabaja con la t de student– Muy sensible a pequeñas variaciones– Confianza individual y no grupal
• Método de Tuckey– Distribución de rango estudentizado– Fuerte evidencia para detectar diferencias– Confianza grupal– Concepto de tasa de error por experimento
Estadística Aplicada 2. Tema 3. Análisis de Varianza 35
Método LSD de Fisher
• Deseamos encontrar un intervalo de confianza para la diferencia entre dos tratamientos.
• El estimador puntual es:
• La varianza es:
por tanto:
ji YY
V Y i Y j 2
n 2
n
2 2
n
n
MSEs
n
MSEs
jiji YYYY
222
Estadística Aplicada 2. Tema 3. Análisis de Varianza 36
Método LSD de Fisher
• Con lo cual tenemos que:
• y el intervalo de confianza del 100(1-α)% para la diferencia entre las medias de dos tratamientos µi - µj es:
)1(~
/2
nn
jiji
At
nMSE
YYT
n
MSEtyy
n
MSEtyy nnjijinnji AA
22)1(,2/)1(,2/
Estadística Aplicada 2. Tema 3. Análisis de Varianza 37
Ejemplo 1 (continuación)
• Para el ejemplo 1, si comparamos los tratamientos 2 y 3:
• Las diferencias no son significativas con un α=0,05. Puesto que el “0” se encuentra en el intervalo, existiendo la posibilidad de que:
µ3-µ2=0
y3g y2gt0,025;20
2MSE
n
7,00 15,67 2,08626,51
6 1,74
3
24,40
Estadística Aplicada 2. Tema 3. Análisis de Varianza 38
Múltiples comparaciones
El par de medias i - j se considera
diferente si:)1(~
2
nn
ji
At
nMSE
YYT
LSDyy ji
n
MSEtLSD nnA
2)1(,2/
jinN nn
MSEtLSDA
11,2/
Tamaños de muestra iguales
Tamaños de muestra desiguales
Estadística Aplicada 2. Tema 3. Análisis de Varianza 39
Ejemplo 2
• Apliquemos el método LSD a los datos del ejemplo 1.
• nA = 4, n = 6, MSE = 6,51 y además t0,025;20 = 2,086.
• Las medias de tratamiento son:
y110,00 [psi]
y215,67 [psi]
y317,00 [psi]
y421,17 [psi]
Estadística Aplicada 2. Tema 3. Análisis de Varianza 40
Ejemplo 2
07,36
51,62086,2
220;025,0
n
MSEtLSD
• Con los datos disponibles podemos obtener el valor de LSD.
• Por tanto, cualquier par de medias que difiera en más de 3,07 unidades implica que los tratamientos son significativamente distintos.
• Las comparaciones se detallan en la siguiente transparencia.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 41
Ejemplo 2
• Existen diferencias significativas entre todos los pares de medias excepto los pares 2 y 3. Esto implica que el 10 y 15% de concentración son parecidos y el resto diferentes.
3,07 5,67 00,1067,15 1 v/s2
3,07 1,33 67,1500,17 2 v/s3
3,07 7,00 00,1000,17 1 v/s3
3,07 4,17 00,1717,21 3 v/s4
3,07 5,50 67,1517,21 2 v/s4
3,07 11,17 00,1017,21 1 v/s4
12
23
13
34
24
14
yy
yy
yy
yy
yy
yy
Estadística Aplicada 2. Tema 3. Análisis de Varianza 42
Ejemplo 2
• Visualmente se puede observar el efecto mostrado por la prueba LSD de Fisher:
• Pueden verse diferencias significativas las diferentes concentraciones, pero las concentraciones de 10% y 15% son muy parecidas.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 43
Método de Tuckey
• Como se indicó con anterioridad, el método usa una distribución conocida como “Distribución de rango estudentizado”.
• Al igual que la distribución F, ésta distribución depende de dos parámetros, los grados de libertad del numerador (m) y los del denominador (ν).
• Por lo tanto, se define como:
,,mQ Valor crítico de la cola superior de α con m=nA y ν=nAn
Estadística Aplicada 2. Tema 3. Análisis de Varianza 44
Método de Tuckey
• El intervalo de confianza se construye como sigue:
• Al igual que en el LSD de Fisher, si el intervalo no incluye el 0, las medias difieren significativamente.
Y i Y j Q ,nA ,nA (n 1)
MSE
ni j Y i Y jQ ,nA ,nA (n 1)
MSE
n
Estadística Aplicada 2. Tema 3. Análisis de Varianza 45
Procedimiento
• Seleccionar α y buscar• Determinar W como:
• Cualquier par de medias que difieran en más que la cantidad definida por W son juzgadas como significativamente diferentes entre sí.
Para realizar este último paso, es práctico ordenar las medias muestrales en orden no decreciente.
Q ,nA ,nA (n 1)
nMSEQW nnn AA/)1(,,
Estadística Aplicada 2. Tema 3. Análisis de Varianza 46
Ejemplo 3
• Se efectuó un experimento para comparar 5 marcas distintas de filtros de aceite automotrices, en relación con su capacidad para capturar materia extraña. Se usó una muestra de nueve filtros de cada marca y se obtuvieron las siguientes cantidades promedio: y114,5; y
213,8; y313,3; y
414,3; y513,1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 47
Ejemplo 3. Tabla ANOVA
• Partiendo de la siguiente ANOVA:
• ¿Los datos indican que la cantidad promedio real de material capturado depende de la marca de los filtros? Utilice un nivel = 0,05. Si es así, use el método de Tuckey para identificar diferencias significativas.
Fuente de Variación
Grados de Libertad
Suma de Cuadrados Cuadrado Medio f
Tratamientos 4 13,32 3,3337,73
Error 40 3,53 0,088Total 44 16,85
Estadística Aplicada 2. Tema 3. Análisis de Varianza 48
Resolución
Inicialmente comprobamos el análisis ANOVA:• El parámetro de interés es el efecto de la
marca i sobre el material capturado.
• H0: τ1=τ2=τ3=τ4=τ5=0.
• Ha: Al menos uno diferente.
• El estadístico es:
a comparar con
f F ,nA 1,nA n 1 F0,05,4,40 2,61
F MSTr
MSE37,73 Se rechaza H0
Estadística Aplicada 2. Tema 3. Análisis de Varianza 49
Resolución
• Posteriormente se pasa a verificar las diferencias mediante Tuckey.
• El valor• Determinamos W.
• Al ordenar verificamos que:
Q ,nA ,nA (n 1) Q0,05;5;40 4,04
W Q ,nA ,nA (n 1)MSE
n 4,04 0,0889 0,4
y5 y3 y
2 y4 y
1
13,1 13,3 13,8 14,3 14,5
Estadística Aplicada 2. Tema 3. Análisis de Varianza 50
Procedimiento de Tuckey-Kramer
• Útil para tamaños muestrales diferentes n1, n2, ..., nnA que son razonablemente cercanos entre sí.
• Se utilizan promedios entre parejas (es decir 1/ni en vez de 1/n).
• El nivel de confianza simultáneo es al menos del 100(1-)% (sólo aproximado, no exacto), para tamaños muestrales desiguales.
Wij Q ,nA ,N nA
MSE
2
1
ni
1
n j
Estadística Aplicada 2. Tema 3. Análisis de Varianza 51
Ejemplo 4
• Un artículo presentó los siguientes datos del módulo de elasticidad, en GPa, obtenidos con un nuevo método ultrasónico, para muestras de cierta aleación producida con tres métodos de colado diferente.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 52
Resolución
Inicialmente comprobamos el análisis ANOVA:• El parámetro de interés es el efecto del módulo
de elasticidad en el promedio del proceso.
• H0: τ1=τ2=τ3=τ4=0.
• Ha: Al menos uno diferente.
• Para obtener el estadístico necesitamos realizar algunos cálculos intermedios:
y
ij
2 45,5 2 45,3 2 ... 43,1 2 43.998,73
Estadística Aplicada 2. Tema 3. Análisis de Varianza 53
Resolución
93,137,98322
173,43998
.. 2
1 1
22
A in
i
n
jij N
yySST
93,77,9832
1
6
5,273
8
5,352
8
7,357... 2222
1
22
An
i i
i
N
y
n
ySSTr
00,693,793,13 SSTrSSTSSE
MSTr SSTr
nA 1
7,93
23,965
MSE SSE
N nA
6,00
190,3158
f MSTr
MSE12,56
El valor p = P(F2, 19 ≥ 12,56) = 0,0003 indica que se debe rechazar H0 a cualquier nivel de significancia.Por lo tanto, el módulo de elasticidad promedio depende de cierta forma del proceso de colado que se utilice.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 54
Resolución
• Posteriormente se pasa a verificar las diferencias mediante Tuckey-Kramer.
• n1=8, n2=8, n3=6 y nA=3; N–nA=19 y MSE = 0,316.
• Por lo tanto, un nivel de confianza simultáneo de aproximadamente 95% requiere:
771,0 ,771,0 ,713,08
1
8
1
2
316,059,3
11
2
231312
19;3;05,0
WWW
nn
MSEQW
jiij
Estadística Aplicada 2. Tema 3. Análisis de Varianza 55
Resolución
• En este caso tras ordenar los datos:
• Se concluye que 1 y 2 no son considerablemente diferentes, sin embargo tanto 1 como 2 parecen diferir en forma significativa de 3.
2. A presión
1. Permanente
3. Yeso
44,06 44,71 45,58
Estadística Aplicada 2. Tema 3. Análisis de Varianza 56
Verificación de las hipótesis del modelo
• Las hipótesis de partida son:– Normalidad (eij ~ N(0, 2 ))
– Homocedasticidad (igualdad de varianzas)
• La verificación se realiza mediante:– Gráficas de probabilidad normal.
– Gráficas de los ei vs. los niveles del factor.
– Gráficas de los ei vs. medias de tratamiento observadas
ˆi ij ij ij ie y y y y
Estadística Aplicada 2. Tema 3. Análisis de Varianza 57
Volviendo al ejemplo 3.1
• Los residuos son los siguientes:
5 -3,00 -2,00 5,00 1,00 -1,00 0,0010 -3,67 1,33 -2,67 2,33 3,33 -0,6715 -3,00 1,00 2,00 0,00 -1,00 1,0020 -2,17 3,83 0,83 1,83 -3,17 -1,17
% de Concentración de Madera Dura
Residuos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 58
Gráfico de probabilidad normal
Estadística Aplicada 2. Tema 3. Análisis de Varianza 59
Gráfico de residuos respecto al factor
Estadística Aplicada 2. Tema 3. Análisis de Varianza 60
Gráfico de residuos respecto respuesta
Estadística Aplicada 2. Tema 3. Análisis de Varianza 61
Tema 3. Análisis de Varianza
Un factor. Efectos Aleatorios
Estadística Aplicada 2. Tema 3. Análisis de Varianza 62
Modelo Efectos Aleatorios
• El factor de interés tiene un número muy grande de niveles posibles.
• El analista está interesado en obtener conclusiones respecto todos los posibles niveles del factor.
• Si se selecciona al azar nA de estos niveles de la población de todos los niveles del factor, entonces se dice que el factor es aleatorio.
• Las conclusiones pueden generalizarse debido a la aleatoriedad.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 63
Efectos aleatorios
• El modelo lineal es:
ijiijY
... 2, 1,
... 2, 1,
nj
ni A
Variable aleatoria que explica el efecto aleatorio del factor,
i ~ N(0,σ2)
(Para efectos fijos, se suponía que σ
2 = 0 y que el efecto era únicamente en la media)
Residuos,
ij ~ N(0,σ2)
Estadística Aplicada 2. Tema 3. Análisis de Varianza 64
Consideraciones del modelo
• Los i son independientes para i = 1…nA, cada uno con varianza σ
2
• Los εij son independientes para i = 1…nA, y j = 1…n cada uno con σ2
• Los i y εij son independientes para cada combinación de i y j
• La varianza del modelo es:
donde cada término del lado derecho es denominado componente de la varianza.
V Yij 2 2
Estadística Aplicada 2. Tema 3. Análisis de Varianza 65
Consideraciones del modelo
• La hipótesis que las {i } son independientes, implica que la hipótesis usual que:
• del modelo de efectos fijos no se aplica al modelo de efectos aleatorios.
• Las hipótesis apropiadas a probar son:
• Y la descomposición sigue siendo:
01
An
ii
H0 : 2 0 ; Ha :
2 0
SSESSTrSST
Estadística Aplicada 2. Tema 3. Análisis de Varianza 66
Determinación de cuadrados medios• En el modelo ANOVA de un solo factor,
experimento completamente aleatoriezado, el valor esperado de la media de cuadrados de los tratamientos es:
• El valor esperado de los cuadrados del error:
• Y los estimadores de los componentes de la varianza:
22
1 nn
SSTrEMSTrE
A
E MSE ESSE
nA(n 1)
2
MSEs 2
n
MSEMSTrs
2
Estadística Aplicada 2. Tema 3. Análisis de Varianza 67
Ejemplo 5• Una compañía textil produce en varios telares.• Interesa estudiar la la variabilidad de la
resistencia a la tensión de un telar a otro. • Se seleccionan al azar cuatro telares y se
determina la resistencia a la tensión de observaciones aleatorias.
Observaciones
Telar 1 2 3 4 Totales Promedios
1 98 97 99 96 391 97,5
2 91 90 93 92 368 91,5
3 96 95 97 95 386 95,75
4 95 96 99 98 392 97
1537 95,44
Estadística Aplicada 2. Tema 3. Análisis de Varianza 68
Solución
• Tabla ANOVA:
• El valor de F y su p valor permiten concluir que los telares influyen en la resistencia a la tensión de los telares. La varianza estimada es s2 = 1,90 y:
Fuente de Variación
Suma de Cuadrados
Grados de Libertad
Media de Cuadrados f 0 Valor P
Telar 89,19 3 29,73 15,68 1,88E-04Error 22,75 12 1,9Total 111,94 15
96,64
90,173,292
s
Estadística Aplicada 2. Tema 3. Análisis de Varianza 69
Solución
• La varianza total es:
• Por tanto, la mayor parte de la varianza se debe a los telares.
• El aislamiento de diversas fuentes de aleatoriedad es un tema recurrente en los problemas de control y mejora de la calidad.
V Yij s2 s2 6,96 1,90 8,86
Estadística Aplicada 2. Tema 3. Análisis de Varianza 70
Aplicación al control de calidad• En el ejemplo anterior, la estimación de los
parámetros del proceso son:
• Suponiendo un límite inferior de resistencia de 90 [psi]
y95,45 [psi]
sY V Yij 8,86 2,98 [psi]
Aprox. 3,37% de fallos
N 95,45; 2,98
Estadística Aplicada 2. Tema 3. Análisis de Varianza 71
Aplicación al control de calidad• Si se eliminaran las fuentes de variabilidad
causadas por los telares (sτ2=0):
• En ese caso, la reducción en la variabilidad de la resistencia disminuye en gran medida la degradación del proceso, lo que trae como resultado:
sY s2 1,90 1,38 [psi]
Menores costesMayor calidadClientes satisfechosVentaja competitiva
Estadística Aplicada 2. Tema 3. Análisis de Varianza 72
Tema 3. Análisis de Varianza
Un factor. Diseño por Bloques
Estadística Aplicada 2. Tema 3. Análisis de Varianza 73
Diseño aleatorio por bloques
• Técnica que extiende la prueba t para datos emparejados para el caso en que hay más de dos niveles.
• Los bloques han sido creados por las condiciones y el diseño del experimento.
t1
t2
t3
Bloque 1t1
t2
t3
Bloque 2t1
t2
t3
Bloque 3t1
t2
t3
Bloque 4
Estadística Aplicada 2. Tema 3. Análisis de Varianza 74
Ejemplo del concepto “Bloque”
• Suponga que deseamos comprobar diferentes métodos para cortar una viga. Se opta por probar tres métodos de corte (factores) y se comprobará el resultado en cuatro vigas. Idealmente deberíamos realizar:
Tratamiento Bloques (Viga)
(Método) 1 2 3 4
A y11 y12 y13 y14
B y21 y22 y23 y24
C y31 y32 y33 y34
Estadística Aplicada 2. Tema 3. Análisis de Varianza 75
Procedimiento general
• A Grosso Modo, la “dimensión observaciones” se sustituye por la “dimensión bloques”, pero ahora también tienen sentido las diferencias y promedios de los bloques.
BloquesTratamiento 1 2 … nB Totales Promedios
1 y11 y12 … y1nBy1.
2 y21 y22 … y2nBy2.
. . . … . . .
. . . … . . .nA ynA1 ynA2 … ynAnB
ynA.
Totales y. 1 y. 2 … y.nBy..
Promedios …
.1y
.2y
.nAy
..y1.y 2.ynB
y.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 76
Modelo Lineal
• El modelo lineal que tiene en cuenta bloques es el siguiente:
• El modelo asume que:• El efcto de tratamientos y bloques es fijo.• Los bloques no interactúan.• Dentro de cada bloque las unidades son homogéneas
frente a otros factores que podrían afectar
ijjiijY i 1, 2, ... nA Factores
j 1, 2, ... nB Bloques
0y 011
BA n
jj
n
ii
Estadística Aplicada 2. Tema 3. Análisis de Varianza 77
Hipótesis de la prueba
• La hipótesis de la prueba son:
• Y la suma de cuadrados:
• De forma resumida:
H0 :1 ... nA0; Ha : i 0 al menos para una i
yij y.. 2j1
nB
i1
nA
nB yi . y.. 2 i1
nA
nA y.j y.. 2j1
nB
yij y.j yi . y.. 2j1
nB
i1
nA
SSESSSSSST BA
(tratamientos) (bloques)
Estadística Aplicada 2. Tema 3. Análisis de Varianza 78
Fórmulas de cálculo
Cuadrados Medios Valores Esperados
MSA SSA
nA 1
MSB SSB
nB 1
MSE SSE
nA 1 nB 1
ESSA
nA 1
2
nB i2
i1
nA
nA 1
ESSB
nB 1
2
nA j2
j1
nB
nB 1
E MSE 2
Estadística Aplicada 2. Tema 3. Análisis de Varianza 79
Fórmulas de cálculo
• Por tanto:
SST yij2
y..2
nAnBj1
nB
i1
nA
SSA 1
nB
yi.2
y..2
nAnBi1
nA
SSE SST SSA SSB
SSB 1
nA
y. j
2 y..
2
nAnBi1
nB
Estadística Aplicada 2. Tema 3. Análisis de Varianza 80
Tabla ANOVA
..
Fuente de Variación
Grados de Libertad
Suma de Cuadrados Cuadrado Medio f
Tratamientos nA-1 SSA MSA = SSA / (nA-1) MSA / MSE
Bloques nB-1 SSB MSB = SSB / (nB-1)
Error(nA-1)(nB-
1)SSE MSE = SSE / (nA-1)(nB-1)
Total nAnB-1 SST
Estadística Aplicada 2. Tema 3. Análisis de Varianza 81
Ejemplo 3.6
• Experimento del efecto de cuatro sustancias químicas sobre la resistencia de una tela.
• Se escogen cinco muestras de tela y se aplica un diseño completamente aleatorizado por bloques mediante la prueba de cada sustancia en un orden aleatorio sobre cada una de las muestras de tela.
• En caso de existir efecto por parte de las sustancias químicas sobre la resistencia de las telas, se identificarán aquéllas que provoquen efecto sobre la resistencia, con = 0,01.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 82
Ejemplo 3.6
• Datos
Muestra de Tela Sustancia Química 1 2 3 4 5 Totales Promedios
1 1,3 1,6 0,5 1,2 1,1 5,7 1,142 2,2 2,4 0,4 2,0 1,8 8,8 1,763 1,8 1,7 0,6 1,5 1,3 6,9 1,384 3,9 4,4 2,0 4,1 3,4 17,8 3,56
Totales 9,2 10,1 3,5 8,8 7,6 39,2 Promedios 2,3 2,5 0,9 2,2 1,9 1,96
Estadística Aplicada 2. Tema 3. Análisis de Varianza 83
Resultados MINITABANOVA: Resistencia de la Tela vs. Sustancia Química. Muestra de Tela
Factor Tipo Niveles ValoresSustancia Química fijo 4 1. 2. 3. 4Muestra de Tela fijo 5 1. 2. 3. 4. 5
Análisis de varianza de Resistencia de la Tela
Fuente GL SC MC F PSustancia 3 18,0440 6,0147 75,89 0,000Muestra 4 6,6930 1,6733 21,11 0,000Error 12 0,9510 0,0793Total 19 25,6880
S = 0,281514 R-cuad. = 96,30% R-cuad.(ajustado) = 94,14%
Estadística Aplicada 2. Tema 3. Análisis de Varianza 84
Análisis de resultado
• La tabla ANOVA muestra que el estadístico de prueba f0 = 75,89 > f0,01;3;12 = 5,95.
• Concluimos que hay diferencias significativas en las resistencias de las telas bajo los distintos tipos de sustancias químicas.
• El p Valor 0.000 también podría usarse para llegar a la misma conclusión.
• Además como el valor p = 0, indica que no cambiaría la decisión independientemente del nivel de significación usado en la prueba.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 85
Identificación efectos
• Utilizaremos LSD de Fisher
Estadística Aplicada 2. Tema 3. Análisis de Varianza 86
Identificación de efectos
• Los resultados muestran que la sustancia química 4 tiene da más resistencia que las otras.
Nótese que el método no se ha modificado excepto por el cambio de notación (nB en vez de n).
Estadística Aplicada 2. Tema 3. Análisis de Varianza 87
Adecuación del modelo
• Los residuos se definen como:
• Dónde:
• Por tanto:
• El valor ajustado representa la estimación de la respuesta media cuando el i-ésimo tratamiento se efectúa en el j-ésimo bloque.
ijijij yye ˆ
jiijy ˆˆˆˆ
y.. yi. y.. y. j y.. yi. y. j y..
jiijij yyyye ....
Estadística Aplicada 2. Tema 3. Análisis de Varianza 88
Ejemplo 3.6
• Los residuos ajustados del experimento son:
• A continuación se muestran los gráficos de residuos
Muestra de TelaSustancia Química 1 2 3 4 5
1 -0,18 -0,10 0,44 -0,18 -0,022 0,1 0,08 -0,28 0,00 0,103 0,08 -0,24 0,30 -0,12 -0,024 0,00 0,28 -0,48 -0,30 -0,10
Estadística Aplicada 2. Tema 3. Análisis de Varianza 89
Gráfico de probabilidad normal
Estadística Aplicada 2. Tema 3. Análisis de Varianza 90
Gráfico de residuos por tratamiento
Estadística Aplicada 2. Tema 3. Análisis de Varianza 91
Gráfico de residuos por bloques
Estadística Aplicada 2. Tema 3. Análisis de Varianza 92
Residuos respecto al valor esperado
Estadística Aplicada 2. Tema 3. Análisis de Varianza 93
Tema 3. Análisis de Varianza
Diseños Factoriales
Estadística Aplicada 2. Tema 3. Análisis de Varianza 94
Experimentos con varios factores
• Un experimento es una prueba o serie de pruebas
• El diseño del experimento juega un papel principal en el análisis estadístico de éste.
• Un diseño factorial es aquél en el que se realizan ensayos con todas las configuraciones de los niveles de los factores.
• Se usa ANOVA como herramienta para analizar estadísticamente los resultados del experimento.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 95
Definición
• Se entiende por experimento factorial a aquél en que se investigan todas las combinaciones posibles de los niveles de los factores en cada ensayo o réplica completa del experimento.
Factor BFactor A Alto Bajo
Alto 10 20Bajo 30 40
Estadística Aplicada 2. Tema 3. Análisis de Varianza 96
Ejemplo
• El caso anterior es un experimento factorial sin interacción
Rectas Paralelas
Estadística Aplicada 2. Tema 3. Análisis de Varianza 97
Ejemplo con interacción
• Nota: Ambos ejemplos son exagerados.
Factor BFactor A Alto Bajo
Alto 10 20Bajo 30 0
Estadística Aplicada 2. Tema 3. Análisis de Varianza 98
Ejemplo con interacción
No Paralelas
Estadística Aplicada 2. Tema 3. Análisis de Varianza 99
Representación 3-D caso sin interacción
• Superficie del experimento sin interacción en 3 D (vertical: resultado, plano factor A y B)
Estadística Aplicada 2. Tema 3. Análisis de Varianza 100
Representación 3-D con interacción
Estadística Aplicada 2. Tema 3. Análisis de Varianza 101
Representación isocurvas
• Rendimiento vs. Tiempo de reacción a temperatura constante (155 oF).
Estadística Aplicada 2. Tema 3. Análisis de Varianza 102
Representación isocurvas
• Rendimiento vs. Temperatura a tiempo de reacción constante (1,7 horas).
Estadística Aplicada 2. Tema 3. Análisis de Varianza 103
Representación isocurvas
• Gráfica de contorno en función de temperatura y tiempo
Estadística Aplicada 2. Tema 3. Análisis de Varianza 104
Datos• Cada combinación de dos niveles se conoce
como Configuración Experimental. La cantidad observaciones es: N = nAnBn.
Factor B
1 2 … nB Totales
Promedios
Factor A
1 y111,..y11n
y121,..y12n
y1nB1,..y
1nBn
y1.. y1..
2 y211,.. y221,.. y2nB1,.. y2.. y2..
…
nAynA11,
…ynA21,
…ynAnB1,..
ynAnBn
ynA.. ynA..
Totales y.1. y.2. y.nB.
y... y...
Promedios
y.1. y.2. y.nB.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 105
Modelo Lineal
• Con:
• Yijk es la k-ésima observación tomada en el i-ésimo nivel del Factor A y en el j-ésimo nivel del Factor B.
i 0i1
nA
ij 0j1
nB
ij 0i1
nA
Yij i j ij ijk
... 2, 1,
... 2, 1,
... 2, 1,
nk
nj
ni
B
A
j 0j1
nB
ijk ~ N 0, 2
Estadística Aplicada 2. Tema 3. Análisis de Varianza 106
Análisis estadístico del modelo
A B
A
B
n
i
n
j
n
kijk
n
kijkij
n
i
n
kijkj
n
j
n
kijki
yy
yy
yy
yy
1 1 1
1
1 1
1 1
...
.
..
..
nnn
yy
n
yy
nn
yy
nn
yy
BA
ijij
A
jj
B
ii
......
..
....
....
B
A
nj
ni
... 2, 1,
... 2, 1,
Estadística Aplicada 2. Tema 3. Análisis de Varianza 107
Estimación de parámetros del modelo
y...
i yi .. y...
j y.j. y...
ij yij . yi .. y.j. y...
Se deduce de y de.)( ijij yYE ijjiijYE ˆˆˆ)(
.............. yyyyyy jiij
........ yyyy jiij
.ˆˆˆ ijijji y
jiijij y ˆˆˆ.
ij
Estadística Aplicada 2. Tema 3. Análisis de Varianza 108
yijk y... 2k1
n
j1
nB
i1
nA
nBn yi .. y... 2i1
nA
nAn y.j. y... 2j1
nB
n yij . yi .. y.j. y... 2j1
nB
i1
nA
yijk yij . 2k1
n
j1
nB
i1
nA
Suma de cuadrados
• Suma de cuadrados:
Y grados de libertad:
SSESSSSSSSST ABBA
nAnBn 1 nA 1 nB 1 nA 1 nB 1 nAnB n 1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 109
Cálculo de cuadrados
• Fórmulas de cálculo:
BAAB
BABA
n
i
n
j
ijAB
BA
n
j A
jB
BA
n
i B
iA
BA
n
i
n
j
n
kijk
SSSSSSSSTSSE
SSSSnnn
y
n
ySS
nnn
y
nn
ySS
nnn
y
nn
ySS
nnn
yySST
A B
B
A
A B
2
1 1
2
2
1
2
2
1
2
2
1 1 1
2
Estadística Aplicada 2. Tema 3. Análisis de Varianza 110
Prueba de hipótesis
iH
H
ia
nA
una para menos al 0:
0...: 210
jH
H
ja
nB
una para menos al 0:
0...: 210
ijH
H
ija
nn BA
pareja una para menos al 0:
0...: 12110
Efectos sin interacción
Interacciones lineales
Estadística Aplicada 2. Tema 3. Análisis de Varianza 111
Estadísticos
Para probar H0: i = 0 usar la razón:
Para probar H0: j = 0 usar la razón:
Para probar H0: ()ij = 0 usar la razón:
MSE
MSF A
MSE
MSF B
MSE
MSF AB
Estadística Aplicada 2. Tema 3. Análisis de Varianza 112
Tabla ANOVA
Fuente de Variación
Grados de Libertad
Suma de Cuadrados
Cuadrado Medio F
Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE
Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE
Interacción (nA-1)(nB-1) SSAB
MSAB = SSAB / [(nA-1)(nB-1)]
MSAB / MSE
Error nAnB (n-1) SSEMSE = SSE / [nAnB(n-
1)]
Total nAnBn-1 SST
Estadística Aplicada 2. Tema 3. Análisis de Varianza 113
Ejemplo 3.7
• Se estudia el efecto del tapaporos en la pintura en superficies de aluminio, con dos métodos: inmersión y rociado.
• La de la pintura es mejorar la adhesión de la pintura.
• El grupo de ingeniería de procesos responsable de esta operación se encuentra interesado en saber si existen diferencias entre tres tapaporos diferentes y los dos métodos de aplicación.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 114
Ejemplo 3.7
Tipo de Tapaporo Inmersión Σ Rociado Σ
yi ..
1 4,0; 4,5; 4,3 12,8 5,4; 4,9; 5,6 15,9 28,72 5,6; 4,9; 5,4 15,9 5,8; 6,1; 6,3 18,2 34,13 3,8; 3,7; 4,0 11,5 5,5; 5,0; 5,0 15,5 27,0
y. j . 40,2 49,6 y… = 89,8
SST yijk2
k1
n
j1
nMétodos
i1
nTipos
y
2
nTiposnMétodosn
4,0 2 4,5 2 ... 5,0 2 89,8 218
10,72
Estadística Aplicada 2. Tema 3. Análisis de Varianza 115
Ejemplo 3.7
SSTipos yi
2
nMétodosni1
nTipos
y
2
nTiposnMétodosn
28,7 2 34,1 2 27,0 2
6
89,8 218
4,58
91,4
18
8,89
9
6,492,40
222
2
1
2
nnn
y
nn
ySS
MétodosTipos
n
j Tipos
jMétodos
Métodos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 116
Ejemplo 3.7
SSInterac. yij
2
nj1
nMétodos
i1
nTipos
y
2
nTiposnMétodosn SSTipos SSMétodos
12,8 2 15,9 2 11,5 2 15,9 2 18,2 2 15,5 2
3
89,8 2
18 4,58 4,910,24
99,0
91,458,424,072,10
MétodosTiposInterac SSSSSSSSTSSE
Estadística Aplicada 2. Tema 3. Análisis de Varianza 117
ANOVA
• El modelo indica que no existe interacción entre los diferentes tratamientos.
Fuente de Variación
Grados de
Libertad
Suma de Cuadrados
Cuadrado Medio F P
Tipo de Tapaporos 4,58 2 2,29 28,63 2,7E-5
Métodos de Aplicación 4,91 1 4,91 61,38 5,0E-7
Interacción 0,24 2 0,12 1,50 0,26Error 0,99 12 0,08 Total 10,72 17
Estadística Aplicada 2. Tema 3. Análisis de Varianza 118
Gráficos
• Los gráficos de interacción nos permiten visualizar si existen interacciones.
Id.
Aproximadamente paralelas
Curvas / Líneas paralelas indican que no hay interacción
Estadística Aplicada 2. Tema 3. Análisis de Varianza 119
Gráficas
• El gráfico de efectos principales permite detectar el efecto de cada factor en la respuesta
Estadística Aplicada 2. Tema 3. Análisis de Varianza 120
Ejemplo 3.7. Minitab
ANOVA de dos factores: Fuerza de Adhesi vs. Tipo de Tapaporo. Método de Aplica
Fuente GL SC MC F PTipo de Tapaporo 2 4,5811 2,29056 27,86 0,000Método de Aplicación 1 4,9089 4,90889 59,70 0,000Interacción 2 0,2411 0,12056 1,47 0,269Error 12 0,9867 0,08222Total 17 10,7178
S = 0,2867 R-cuad. = 90,79% R-cuad.(ajustado) = 86,96%
Estadística Aplicada 2. Tema 3. Análisis de Varianza 121
Adecuación del modelo
• Los residuos se definen como: .ijijkijk yye
Método de AplicaciónTipo de
Tapaporo Inmersión Rociado
1 -0.27, 0.23, 0.03 0.10, -0.40, 0.302 0.30, -0.40, 0.10 -0.27, 0.03, 0.233 -0.03, -0.13, 0.170.33, -0,17, -0.17
Estadística Aplicada 2. Tema 3. Análisis de Varianza 122
Gráfico de probabilidad de los residuos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 123
Gráfico de residuos por tipo
• Por tipo de tapaporos:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 124
Gráfico de residuos por tipo
• Por método de aplicación:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 125
Gráfico de residuos respecto estimados
Estadística Aplicada 2. Tema 3. Análisis de Varianza 126
Diseños factoriales generales
• Caso con tres factores:
ijklijkjkikijkjiijY
... 2, 1,
... 2, 1,
... 2, 1,
... 2, 1,
nl
nk
nj
ni
C
B
A Interacciones de 2 factores
Interacción de los 3 factores
Estadística Aplicada 2. Tema 3. Análisis de Varianza 127
Tabla ANOVA
Fuente de Variación
Grados de LibertadSuma de
CuadradosCuadrado Medio F
Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE
Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE
Tratamiento C nC-1 SSC MSC = SSC / (nC-1) MSC / MSE
Interacción AB (nA-1)(nB-1) SSAB MSAB = SSAB / [(nA-1)(nB-1)] MSAB / MSE
Interacción AC (nA-1)(nC-1) SSAC MSAC = SSAC / [(nA-1)(nC-1)] MSAC / MSE
Interacción BC (nB-1)(nC-1) SSBC MSBC = SSBC / [(nB-1)(nC-1)] MSBC / MSE
Interacción ABC (nA-1)(nB-1)(nC-1) SSABC
MSABC = SSABC / [(nA-1)(nB-1) (nC-1)]
MSABC / MSE
Error nAnBnC(n-1) SSE MSE = SSE / [nAnBnC(n-1)]
Total nAnBnCn-1 SST
Estadística Aplicada 2. Tema 3. Análisis de Varianza 128
Ejemplo 8
• Se estudia la rugosidad superficial de una pieza en una operación de corte de metal.
• Se exploran tres factores:– Rapidez con la que se hace el corte (A)– Profundidad de éste (B)– Ángulo de la herramienta (C)
• Cada factor tiene dos niveles• Se realizan dos réplicas del diseño factorial.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 129
Ejemplo 8Profundidad de corte (B)
0,025 '' 0,040 ''Rapidez de Corte (A)
Ángulo de la herramienta (C)
Ángulo de la herramienta (C)
15° 25° 15° 25° yi…
20''/min. 9 11 9 10757 10 11 8
16 21 20 18
30''/min. 10 10 12 1610212 13 15 14
22 23 27 30Totales BxC
y.jk. 38 44 47 48 177 y….
Estadística Aplicada 2. Tema 3. Análisis de Varianza 130
Ejemplo 8. MinitabFactor Tipo Niveles ValoresRapidez de Corte (A) fijo 2 20. 30Profundidad de Corte (B) fijo 2 0,025. 0,040Ángulo de la herramienta (C) fijo 2 15. 25
Análisis de varianza
Fuente GL SC sec. SC ajust. MC ajust. F P(A) 1 45,562 45,562 45,562 18,69 0,003(B) 1 10,563 10,563 10,563 4,33 0,071(C) 1 3,063 3,063 3,063 1,26 0,295(A)*(B) 1 7,563 7,563 7,563 3,10 0,116(A)*(C) 1 0,063 0,063 0,063 0,03 0,877(B)*(C) 1 1,563 1,563 1,563 0,64 0,446(A)*(B)*(C) 1 5,062 5,062 5,062 2,08 0,188Error 8 19,500 19,500 2,438Total 15 92,938
S=1,56125 R-cuad.=79,02% R-cuad.(aj)=60,66%
Estadística Aplicada 2. Tema 3. Análisis de Varianza 131
Diseños factoriales
• Diseño 22
Estadística Aplicada 2. Tema 3. Análisis de Varianza 132
Diseños 2k
• Diseño 22
• El efecto principal del primer factor (A) se estima como:
• Y para el factor (B) como:
A yA yA a ab
2n
b 1 2n
1
2na ab b 1
B yB yB b ab
2n
a 1 2n
1
2nb ab a 1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 133
Diseños 2k y contrastes
• El efecto de la interacción es:
• A las cantidades entre corchetes, se les denomina contrastes.
• Por ejemplo, el contraste de A es:
• ContrasteA = a + ab – b – (1)
AB yA yA ab 1
2n
a b
2n
1
2nab 1 a b
Estadística Aplicada 2. Tema 3. Análisis de Varianza 134
Contrastes
• Los contrastes se utilizan para determinar los efectos principales y las interacciones.
• Los residuos se pueden determinar como:
SSA a ab b 1
2
4n
SSB b ab a 1
2
4n
SSAB ab 1 a b
2
4n
Estadística Aplicada 2. Tema 3. Análisis de Varianza 135
Ejemplo 9
• Un artículo describe la aplicación de diseños factoriales de dos factores a la fabricación de circuitos integrados.
• Los factores utilizados son:– A: Tiempo de descomposición (-=corto, +=largo)– B: Rapidez de flujo de arsénico (-=55%, +=59%)
• La variable de respuesta es el grosor de la capa epitaxial (μm).
• Se usan 4 réplicas (n=4)
Estadística Aplicada 2. Tema 3. Análisis de Varianza 136
Datos
Tratamiento
Factor Grosor
A B AB Grosor Total Media
(1) - - + 14,037 14,165 13,972 13,907 56,081 14,020
a + - - 14,821 14,757 14,843 14,878 59,299 14,825
b - + - 13,880 13,860 14,032 13,914 55,686 13,922
ab + + + 14,888 14,921 14,415 14,932 59,156 14,789
Estadística Aplicada 2. Tema 3. Análisis de Varianza 137
Cálculos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 138
Cálculos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 139
Gráfico normal de residuos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 140
Gráfico de residuos con factor tiempo
Estadística Aplicada 2. Tema 3. Análisis de Varianza 141
Gráfico residuos / Rapidez flujo
Estadística Aplicada 2. Tema 3. Análisis de Varianza 142
Desviación estándar
Estadística Aplicada 2. Tema 3. Análisis de Varianza 143
Diseños factoriales 2k para k≥3
Estadística Aplicada 2. Tema 3. Análisis de Varianza 144
InteraccionesRepresentación de contrastes asociados a los efectos principales y sus interacciones en un diseño 23. (a) efectos principales. (b) Interacciones entre dos factores. (c) interacción entre tres factores.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 145
Estimación de efectos principales
• Estimación del efecto de A, B y C:
A yA yA
1
4na ab ac abc 1 b c bc
B yB yB
1
4nb ab bc abc 1 a c ac
A yC yC
1
4nc acbc abc 1 a b ac
Estadística Aplicada 2. Tema 3. Análisis de Varianza 146
Estimación interacciones
• Interacción entre dos factores:
• Interacción de los tres factores:
AB 1
4nabc bc ab b ac c a 1
AC 1
4n1 a b ab c ac bc abc
BC 1
4n1 a b ab c acbc abc
A 1
4nabc bc ac c ab b a 1
Estadística Aplicada 2. Tema 3. Análisis de Varianza 147
Interacciones en formato tabular
Estadística Aplicada 2. Tema 3. Análisis de Varianza 148
1.Aparte de la columna de la identidad (I), cada columna tiene la misma cantidad de “-” y de “+”
2. La suma-producto de cualquier pareja de columnas es cero; es decir que las columnas son ortogonales
2.La multiplicación de cualquier columna por I no cambia la columna; es decir que I es un elemento de identidad
3.El producto de cualquier pareja de columnas da una columna que está en la tabla,
Estadística Aplicada 2. Tema 3. Análisis de Varianza 149
Contrastes
• Se calculan de forma parecida al caso anterior:
Efecto Contraste
n2k 1
SS Contraste 2
n2k
Estadística Aplicada 2. Tema 3. Análisis de Varianza 150
Ejemplo 10
• Considérese el ejemplo 8. Éste es un experimento con 3 factores (A) velocidad de corte, (B) profundidad de corte y (C) ángulo de la herramienta con 2 réplicas. La tabla siguiente muestra los datos observados de rugosidad:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 151
Solución
• Para A se calcula:
• Se actúa de forma idéntica para el resto de factores (las columnas)
• Minitab reporta los siguientes resultados:
A 1
4na ab ac abc 1 b c bc
1
4(2)22 27 23 40 16 20 21 18 3.375
Estadística Aplicada 2. Tema 3. Análisis de Varianza 152
Resultados
Estadística Aplicada 2. Tema 3. Análisis de Varianza 153
Gráfico de probabilidad para residuos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 154
Réplica única del diseño para k grande
• Según aumenta k, el número de observaciones que deben realizarse aumenta, haciendo difícil poder realizar réplicas del diseño.
• Además, la falta de réplicas haría que el número de grados de libertad disminuyera.
• Una solución es considerar sólo algunas interacciones.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 155
Ejemplo 11
• Se estudia un problema de grabado con cuatro factores.
• Se realiza una única réplica del diseño.• El diseño sigue un esquema 24.• Se consideran sólo interacciones hasta nivel 2.
Estadística Aplicada 2. Tema 3. Análisis de Varianza 156
Observaciones
Estadística Aplicada 2. Tema 3. Análisis de Varianza 157
Resolución
• Los valores de la tabla anterior, junto a los signos, pueden utilizarse para estimar el efecto de cada factor.
A 1
8
a ab ac abc ad abd acd
abcd 1 b c bc d bd cd bcd
1
8
669 650 642 635 749 868 860
729 550 604 633 601 1037
1052 1075 1063
101,625
Estadística Aplicada 2. Tema 3. Análisis de Varianza 158
Tabla de contrastes para 24
Estadística Aplicada 2. Tema 3. Análisis de Varianza 159
Ejemplo
• La tabla completa de contrastes es la siguiente:
Estadística Aplicada 2. Tema 3. Análisis de Varianza 160
Ejemplo
Estadística Aplicada 2. Tema 3. Análisis de Varianza 161
Gráfico de probabilidad de los efectos
Estadística Aplicada 2. Tema 3. Análisis de Varianza 162
Gráfico de interacción
Estadística Aplicada 2. Tema 3. Análisis de Varianza 163
Gráfico de los residuos