ipaee capitulo5
DESCRIPTION
Material integrante do curso "Introdução ao Planejamento e Análise Estatística de Experimentos" - Prof. Pedro Ferreira Filho e Profa. Estela Maris P. Bereta - UFSCarTRANSCRIPT
UU NN II VV EE RR SS II DD AA DD EE FFEE DD EE RR AA LL DD EE SS ÃÃ OO CC AA RR LL OO SS
CC EE NN TT RR OO DD EE CC II ÊÊ NN CC II AA SS EE XX AA TT AA SS EE DD EE TT EE CC NN OO LL OO GG II AA
DD EE PP AA RR TT AA MM EE NN TT OO DD EE EE SS TT AA TT ÍÍ SS TT II CC AA
II NN TT RR OO DD UU ÇÇ ÃÃ OO AA OO PP LL AA NN EE JJ AA MM EE NN TT OO EE AA NN ÁÁ LL II SS EE
EE SS TT AA TT ÍÍ SS TT II CC AA DD EE EE XX PP EE RR II MM EE NN TT OO SS
CC AA PP ÍÍ TT UU LL OO ## 55
EEXX PP EE RR II MM EE NN TT OO SS CC OO MM UU MM ÚÚNN II CC OO FFAA TT OO RR
((OONN EE WW AA YY ))
PP RR OO FF .. PP EE DD RR OO FF EE RR RR EE II RR AA FF II LL HH OO
PP RR OO FFaa .. EE SS TT EE LL AA MM AA RR II SS PP.. BB EE RR EE TT AA
22 ºº SS EE MM EE SS TT RR EE DD EE 22 00 11 00
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 2
55 .. EE XX PP EE RR II MM EE NN TT OO SS CC OO MM ÚÚ NN II CC OO FF AA TT OO RR (( OO NN EE WW AA YY ))
55 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::
Experimentos com um único fator são aqueles onde existe uma única variável de interesse
no estudo . Os testes de hipótese para comparação de duas médias (ou dois tratamentos) vistos
no capítulo 3 são um caso particular desse tipo de situação. No entanto, os procedimentos vistos
anteriormente somente podem ser utilizados em situações onde o número de tratamentos em
estudos é no máximo igual a dois.
Usualmente os estudos experimentais tem por objetivo comparar três ou mais tratamentos,
ou ainda, nessa situação, estudar um fator de interesse que apresenta três ou mais possíveis
valores (tratamentos). Por exemplo, num exemplo anterior, havia interesse e, estudar o
rendimento de uma dada reação química considerando três diferentes tipos de catalisadores.
Nesse caso existe um único fator: Catalisadores e três tratamentos que são os três (ou mais) tipos
de catalisadores a serem investigados. Abordaremos os experimento com único fator nsa situação
onde não existe restrição a aleatorização (experimentos completamente aleatorizados) e na
presença de uma única fonte de restrição (experimentos aleatorizados em blocos).
55 .. 22 .. EE XX PP EE RR II MM EE NN TT OO SS CC OO MM PP LL EE TT AA MM EE NN TT EE AA LL EE AA TT OO RR II ZZ AA DD OO SS ::
55 .. 22 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::
Um experimento completamente aleatorizado com um único fator (ONEWAY) é um
planejamento experimental que envolve apenas um fator com “a” níveis onde os tratamentos são
atribuídos as unidades experimentais sem qualquer restrição, ou ainda, toda unidade experimental
tem a mesma probabilidade de receber qualquer um dos tratamentos (níveis do fator) em estudo.
A eficiência deste tipo de planejamento esta diretamente relacionada a homogeneidade das
unidades experimentais com respeito aos objetivos do estudo. Quanto maior for a
homogeneidade melhores serão os resultados obtidos nesse tipo de planejamento experimental.
Consideremos o seguinte exemplo:
Um experimento foi realizado para verificar a produtividade de 4 tipos de variedade de
milho. A produção em cada unidade experimental (lotes homogêneos) foi a seguinte:
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 3
Varie- Repetições
dade 1 2 3 4 5
A 25 26 20 23 21
B 31 25 28 27 24
C 22 26 28 25 29
D 33 29 31 34 28
Problema:
Existe uma variedade que apresenta produtividade melhor que as demais?
Visualizando os dados observados:
Situação:
Experimento:
Completamente Aleatorizado
Um único fator – Variedades de milho
Efeitos Fixos (interesse em identificar qual das quatro variedades é a melhor).
Balanceado: todos os tratamentos foram aplicados ao mesmo número de unidades
experimentais;
Questão:
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 4
Como definir um teste para verificação da hipótese de existência ou não de diferença entre
os tratamentos?
55 .. 22 .. 22 .. AA NN ÁÁ LL II SS EE EE SS TT AA TT ÍÍ SS TT II CC AA ::
55 .. 22 .. 22 .. 11 .. NN OO TT AA ÇÇ ÃÃ OO ::
Seja:
Yij = variável resposta observada no i-ésimo tratamento e j-ésima unidade experimental;
i = 1, 2, …, a (tratamentos)
j = 1, 2, ..., ni (número de unidades experimentais por tratamento)
N =
(número total de unidades experimentais)
No exemplo:
Yij = produtividade da i-ésima variedade na j-ésima unidade experimental.
i = A, B, C, D
j = 1,2, 3, 4, 5 (para todo i)
e n1 = n2 = ... = na = n n.a = N 5*4= 20
Neste caso temos um experimento balanceado, isto é, todos os tratamentos são
aplicados no mesmo número de unidades experimentais.
AA PP RR EE SS EE NN TT AA ÇÇ ÃÃ OO DD OO SS DD AA DD OO SS ::
Tratamentos Observações Totais Médias
1 y11 y12 ... y1n1 y1. 1.y
2 y21 y22 ... y2n2 y2. 2.y
a ya1 ya2 ... yan ya. a.y
y..
a
i
in
1
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 5
i
n
1j
iji.yy (total do i-ésimo tratamento)
in
1j
.
ij
i
i.y
n
1y
i
i
n
y (média do i-ésimo tratamento)
a
i 1
n
1j
ij..
i
yy (total das observações)
No exemplo:
Varie- Repetições yi. i.
y dade 1 2 3 4 5
A 25 26 20 23 21 115 23
B 31 25 28 27 24 135 27
C 22 26 28 25 29 130 26
D 33 29 31 34 28 155 31
Totais y.. ..
y = 26.75
55 .. 22 .. 22 .. 22 .. MM OO DD EE LL OO EE SS TT AA TT ÍÍ SS TT II CC OO ::
A análise estatística para verificar o problema em estudo (igualdade ou não dos
tratamentos) passa pelo ajuste de um modelo linear estatístico definido da seguinte forma:
yij = + i + ij (chamado modelo de desvio médio) (5.1)
onde
Yij = variável resposta observada no i-ésimo tratamento e j-ésima unidade experimental;
µ = efeito comum a todos os tratamentos, parte da resposta que não depende dos tratamentos;
i = efeito específico do i-ésimo tratamento
i = erro aleatório (parte da resposta não representada pelo modelo)
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 6
Interpretação:
A resposta yiz é devida a um “efeito comum” mais um efeito específico do i-ésimo
tratamento mais um efeito aleatório.
Do ponto de vista do modelo temos na forma matricial:
Situação a = 3; ni = 3, todo i;
Problemas:
Estimar os parâmetros
Teste de Hipótese
Verificar a adequabilidade do modelo
55 .. 22 .. 22 .. 33 .. EE SS TT II MM AA ÇÇ ÃÃ OO DD EE PP AA RR ÂÂ MM EE TT RR OO SS ::
Alternativas:
Estimadores de Máxima Verossimilhança
Estimadores de Mínimos Quadrados
Usando o métodos dos mínimos quadrados coma restrição de que a
1i
ii0τc , temos:
..yμ
i..i.i yyˆ i= 1,2,....a
Interpretação:
O efeito comum é estimado pela média geral dos dados observados;
O efeito específico é estimado pela diferença entre a média das observações do especifico
tratamento em relação a média geral.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 7
No Exemplo:
Estimativa dos Parâmetros:
26.75μ 75.3ˆ1
25.0ˆ2
75.0ˆ3
4.25ˆ4
Interpretação:
O tratamento 1 (adubo A) tem em média um rendimento médio 3.75 unidades a menos
que o efeito comum (efeito obtido independente dos tratamentos).
O tratamento 2 (adubo B) tem em média um rendimento médio 0.25 unidades a mais que
o efeito comum (efeito obtido independente dos tratamentos).
O tratamento 3 (adubo C) tem em média um rendimento médio 0.75 unidades a menos
que o efeito comum (efeito obtido independente dos tratamentos).
O tratamento 4 (adubo D) tem em média um rendimento médio 4.25 unidades a mais que
o efeito comum (efeito obtido independente dos tratamentos).
Observação:
Alguns autores preferem o modelo estatístico dado por:
Yij= i + ij
Onde
i = + i
definido anteriormente.
Alguns resultados apresentam diferenças em relação ao modelo apresentado, porém as
conclusões obtidas usando qualquer uma das alternativas são exatamente as mesmas.
55 .. 22 .. 22 .. 44 .. TT EE SS TT EE DD EE HH II PP ÓÓ TT EE SS EE SS ::
O interesse no estudo é o de comparar os tratamentos que estão sendo investigados.
Como agora, três ou mais tratamentos, a hipótese inicial a ser investigada é a de que se todos os
tratamentos são iguais, ou seja, se todos são igualmente “eficientes”. No caso de não rejeição
desta hipótese, concluí-se pela igualdade dos tratamentos envolvidos, ou ainda, que não existe um
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 8
tratamento com maior efeito que os demais. No caso de rejeição de hipótese de igualdade,
conclui-se que pelo dois tratamentos são diferentes e, nesse caso, novos procedimentos devem
ser realizado para se identificar os tratamentos diferem, ou ainda, que tratamento ou tratamentos
são mais eficientes.
O teste de igualdade de tratamentos utilizando o modelo definido em (5.1) implica no teste
da seguinte hipótese.
Ho : i = 0 i = 1, ..., a
H1 : i 0 para pelo menos um i.
Interpretação:
Se a hipótese Ho não é rejeitada todos os parâmetros i são iguais a zero, ou seja, os
efeitos específicos de todos os tratamentos são iguais a zero (não existem), portanto o modelo
(5.1) fica:
yij = + ij
que não depende dos tratamentos, ou ainda, mudança nos níveis do fator não tem efeito sobre a
resposta.
Se a hipótese Ho é rejeitada todos os parâmetros, pelo menos um i diferente de zero,
ou seja, os existe pelo menos um dos tratamentos com um efeito específico que o torna melhor
(ou pior) que os demais tratamentos.
Vamos considerar alguns pressupostos sobre a componente aleatória ij do modelo 5.1.:
a) E[ ij] = 0 (os erros têm valor esperado igual a zero, ou a média dos erros é zero)
b) V[ ij] = 2 (a variância do erros éconstante e igual a uma dados valor 2)
c) ij são não correlacionados. (o que não é ajustado pelo modelo para uma unidade
experimental, não esta relacionado com o que não é explicado para uma
unidade de observação j)
Conseqüência:
E(Yi) = E ( + i + i) = + i + E( ij ) = + i
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 9
V(Yi) = E ( + i + i) = V( ij ) = 2
Se considerarmos ainda que:
ij ~ N (0, 2)
isto é, erros aleatórios, distribuídos segundo um modelo normal com média zero e variância
constante.
Portanto temos que:
Yij ~ N ( + i , 2)
Desta forma, sob a suposição acima, podemos representar nossa hipótese da seguinte
forma:
Ou seja, o teste de hipóteses, considerando as suposições acima, significa que cada
tratamento segue um modelo normal com uma dada média específica ( + i) e uma
mesma variância constante 2. O teste de hipóteses tem por objetivo verificar se estas
diferentes médias especificas são iguais, ou ainda se todos efeitos específicos i são
iguais a zero.
Problema:
Como testar as hipóteses acima?
1) No caso de dois tratamentos: Teste t
2) Dois ou mais tratamentos: Teste F – ANOVA = Análise de Variância
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 10
55 .. 22 .. 22 .. 55 .. AA NN OO VV AA –– AA NN ÁÁ LL II SS EE DD EE VV AA RR II ÂÂ NN CC II AA ::
O princípio da ANOVA é o de estudar a variabilidade dos dados de forma a identificar que
parcela desta variabilidade é devida ao efeitos dos diferentes tratamentos e que parcela dela é
devida aos erros aleatórios não controláveis.
Proposta:
Particionar a variabilidade total dos valores observados para a medida de comparação Yiz,
em duas componentes: uma devida ao modelo (parte não aleatória) e outra devida aos erros
aleatórios, isto é:
Variabilidade Total = Variabilidade Modelo + Variabilidade dos Erros
Vamos considerar como medida de variabilidade total, a soma de quadrados de desvios em
torno da média para cada uma das observações, ou seja:
a
1i
ni
1j
2
..ijy-ySQT Total adeVariabilid
A partir de alguns procedimentos algébricos temos:
SQESQTrSQT
yyn
yyyy
yy
i
i
ii
n
ii
n
i
a
i
n
j
iij
n
ii
a
i j
2
i.ij
2
..
a
i
a
i j
2
i.ij
a
i
n
j
2
..i.
...
a
i
n
j 1 1
.
a
i j
2
i.ij
2
..i.
a
i
n
j
2
..ii.ij
a
1i
ni
1j
2
....ij
a
1i
ni
1j
2
..ij
yy.
0 yyyy
2yyyy
yyyy
yy
y-ySQT
i
i
i
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 11
onde:
SQTr = SQM = Soma de Quadrados Tratamentos (modelo) : quantifica a
variabilidade entre tratamentos;
SQE = Soma quadrados dos erros: quantifica a variabilidade dos erros;
Idéia Geométrica:
Interpretando:
SQE : soma dos quadrados dos desvios das observações em relação a média de
cada tratamentos;
SQTr : soma dos quadrados dos desvios da média de cada tratamento em relação a
média geral;
A medida que cresce a soma de quadrados de tratamentos temos uma maior
variabilidade entre os tratamentos, conseqüentemente temos que existe diferença
entre os tratamentos. Caso contrário, maior variabilidade dentro dos tratamentos e
menor variabilidade entre tratamentos, temos a não existência de diferença entre
tratamentos.
Problema:
Como quantificar o quanto “pequeno” é a soma de quadrados de tratamentos?
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 12
Expressões:
a
1i
ni
1j
..2ij
a
1i
ni
1j
2..ij
n
yyy-ySQT
2
a
1i
...i
a
1i
...iin
yy
nyynSQTr
222 1
SQTrSQTSQE
Nota: n
y ..2
é usualmente chamado de fator de correção (FC)
Consideremos o seguinte quadro:
Tabela ANOVA
Fonte de
Variação
Graus de
Liberdade
Soma de
Quadrados
Quadrados
Médios
E(QM)* F
Modelo
(Tratamentos)
a-1 SQTr SQ Tr/a-1 2ii
2τn
1a1σ
QME
QMTr
Erro N-a SQE SQE/N-a 2σ
Total N-1 SQT - -
* Esta coluna não é usualmente apresentada.
A tabela acima nos mostra que se a hipótese H0 é verdadeira ( todos i = 0) em
média(E(QM)) o quadrado médio de tratamentos e o quadrado médio de erros são iguais a um
mesmo valor (2 no caso!). Portanto, se a hipótese H0 é verdadeira a razão entre QMTr/QME
deve ser próxima de 1.
Problema:
Como quantificar o quanto “próxima de 1” esta razão?
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 13
Considerando que a suposição: ij ~ N (0, 2) é verdadeira podemos provar que
(ver Mongomery páginas 270 a 273) que:
aNacF
QME
QMTrF
,1~
Consequentemente:
Rejeitamos H0 com u m nível se significância (erro tipo I) se:
)(,1 aNatc
FFQME
QMTrF
Graficamente:
Gráfico 1 – Região Critica para o Teste F.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 14
Uma alternativa usando softwares estatísticos é:
Valor P = P[ Fa-1,N-a > Fc] = c
Isto é:
Gráfico 2 – Valor para estatística F calculada
Logo:
Se c > não se rejeita H0
Se c < rejeita-se H0
Retornando ao exemplo:
Source DF Sum of Squares Mean Square F Value Pr > F
Model 3 163.7500000 54.5833333 7.80 0.0020
Error 16 112.0000000 7.0000000
Corrected Total 19 275.7500000
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 15
R-Square Coeff Var Root MSE Y Mean
0.593835 9.890659 2.645751 26.75000
Source DF Type I SS Mean Square F Value Pr > F
F 3 163.7500000 54.5833333 7.80 0.0020
Temos Fc = 7.80
Considerando = 5% temos F3,16(5%) = 3.24
Logo:
%)5(24.380.716,3
FFQME
QMTrF
tc
Portanto REJEITA-SE Ho, isto é, pelo menos dois tratamentos diferem, ou ainda existe
pelo menos um tratamento que é mais eficiente que outro (maior produtividade no caso!).
De outra forma:
Da tabela da Anova (obtida através de um software estatístico) temos que:
)%)5(05.00020.0Pr Fc
Portanto REJEITA-SE Ho.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 16
Complementação:
O ajuste do modelo :
yij = + i + ij
a partir dos dados do experimentos é dado pela estimativa dos parâmetros :
26.75μ 75.3ˆ1
25.0ˆ2
75.0ˆ3
4.25ˆ4
Consequentemente temos a seguinte decomposição dos valores observados:
0.30.30.30.2
0.30.10.00.0
0.00.275.10.3
0.20.00.20.3
0.20.40.40.2
25.475.025.075.3
25.475.025.075.3
25.475.025.075.3
25.475.025.075.3
25.475.025.075.3
75.2675.2675.2675.26
75.2675.2675.2675.26
75.2675.2675.2675.26
75.2675.2675.2675.26
75.2675.2675.2675.26
28292421
34252723
31282820
29262526
33223125
Ou ainda:
O Valor observado yij é decomposto em um efeito comum (não depende dos tratamento) +
efeito especifico i do tratamento aplicado a unidade experimental mais uma aquilo que não
pode ser incorporado pelo modelo, erro observado ij chamado de RESIDUOS do modelo e que
obtidos e denotados por:
iijˆ - ˆ -Y ˆ
ij
Por sua vez:
iijˆ ˆ Y
É chamado valor estimado ou valor PREDITO pelo modelo.
Consequentemente:
ijijY -Y ˆ
ij
Resíduos = Valor Observado – Valor Predito
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 17
PROBLEMA:
Inferências foram realizadas a partir da hipótese de que i são iid N (0, 2)
ou seja:
a) E[ ij] = 0 (os erros têm valor esperado igual a zero, ou a média dos erros é zero)
b) V[ ij] = 2 (a variância do erros é constante e igual a uma dados valor 2)
c) ij são não correlacionados. (o que não é ajustado pelo modelo para uma unidade
experimental, não esta relacionado com o que não é explicado para uma
unidade de observação j)
d) ij seguem os padrão de um modelo de probabilidade Normal.
Como verificar se as suposições acima são verdadeiras para os dados
observados no experimento?
55 .. 22 .. 33 .. DD II AA GG NN ÓÓ SS TT II CC OO DD EE MM OO DD EE LL OO ::
Objetivo:
Verificar se as suposições estabelecidas para obtenção do ajuste e teste dos parâmetros,
são satisfeitas.
Suposição:
i são iid N (0, 2)
Questões:
Presença de Valores Extremos (Dados aberrantes-discrepantes)
Independência (Aleatoriedade)
Normalidade
Homocedasticidade (Variância Constante)
Instrumentos:
Histograma e Box-Plot dos resíduos
Gráfico normal probabilístico
Gráfico de resíduos em ordem temporal (para situações onde existe uma seqüência
temporal na coleta dos dados)
Gráfico de resíduos versus predito
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 18
Gráfico de resíduos versus fatores
Testes de Igualdade de Variâncias
55 .. 22 .. 33 .. 11 .. II DD EE NN TT II FF II CC AA ÇÇ ÃÃ OO DD EE VV AA LL OO RR EE SS EE XX TT RR EE MM OO SS –– PP OO NN TT OO SS DD II SS CC RR EE PP AA NN TT EE SS
(( AA BB EE RR RR AA NN TT EE SS )) ::
A identificação de valores extremos (dados discrepantes ou aberrantes) faz parte da
análise descritiva e exploratória dos dados. No caso de planejamento de experimentos alguns
procedimentos específicos podem ser destacados na busca da verificação da existência de valores
extremos.
Procedimentos usuais que auxiliam na análise descritiva e exploratória destes dados são:
Ramos e Folhas, Diagrama de Pontos e Box Plot.
Consideremos os seguintes dados:
Tabela: Dados provenientes de um Experimento Completamente Aleatorizado – Oneway (Exemplo
Anterior)
Varie- Repetições
dade 1 2 3 4 5
A 25 26 20 23 21
B 31 25 28 27 24
C 22 26 28 25 29
D 33 29 31 34 28
Dados Originais:
Para se verificar a presença de valores extremos(ou dados discrepantes) podemos utilizar
procedimentos simples, como gráfico de dispersão e Box-Plots. Devemos verificar, neste caso,
valores que se destacam dos demais na apresentação dos valores observados. O Ramo e Folhas
pode ser uma outra alternativa para identificação destes valores. Nos dados abaixo, podemos
observar claramente a não presença de valores extremos.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 19
Resíduos:
Uma alternativa para identificação de valores extremos é a utilização dos resíduos do
modelo estimado, ou seja:
ijijijij yyeˆ
Os procedimentos acima descritos podem ser utilizados, agora não mais com os dados
originais mas sim com os resíduos estimados.
Observando as figuras abaixo podemos observar que, também neste caso, não existe
evidências da existência de algum valor extremo.
Nota:
Diversos autores propõem o uso dos chamados resíduos padronizados no lugar dos
resíduos ordinários acima definidos. Os resíduos padronizados são definidos por:
QME
ˆ
ˆVar
ˆij
ij
ij
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 20
Figura – Identificando Valores Extremos a partir dos Resíduos Estimados
PROCEDIMENTO ALTERNATIVO;
Considerando que os erros têm distribuição N(0, 2), pode-se esperar que a média
contém aproximadamente 68% dos dados, a média 2 contém aproximadamente 95% dos
dados e a média 3 contém aproximadamente 99% dos dados. Desta forma, podem ser
considerados valores extremos aqueles que forem superiores a 3 .
CONCLUSÃO:
Identificado um valor extremo, usualmente ele é excluído da análise. Porém, na pratica, é
o pesquisador quem deve determinar se um valor extremo pode realmente ser assim considerado.
Pois os valores extremos podem fornecer informações importantes sobre o experimento e
estatisticamente podem demonstrar que uma outra distribuição deve melhor representar o
comportamento dos dados.
55 .. 22 .. 33 .. 22 .. VV EE RR II FF II CC AA NN DD OO AA II NN DD EE PP EE NN DD ÊÊ NN CC II AA :: (( EE RR RR OO SS NN ÃÃ OO CC OO RR RR EE LL AA CC II OO NN AA DD OO SS ))
A independência dos resíduos, é usualmente avaliada através de um gráfico dos resíduos
vs valores preditos. Na hipótese de ser satisfeita a suposição de independência não deverá existir
nenhum padrão neste gráfico, ou seja, nenhum comportamento não aleatório dos valores
observados.
No exemplo temos:
Figura – Independência
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 21
Figura – Situações de Não Independência
NOTAS:
Existindo o registro da ordem de obtenção dos valores, recomenda-se o uso do gráfico dos
resíduos vs a ordem de coleta de forma a verificar algum padrão na resposta e,
conseqüentemente uma dependência entre as observações.
55 .. 22 .. 33 .. 33 VV EE RR II FF II CC AA NN DD OO AA NN OO RR MM AA LL II DD AA DD EE ::
A suposição de normalidade dos resíduos pode ser verificada graficamente ou através de
testes. Graficamente é usualmente utilizado o gráfico normal probabilístico e os testes mais
utilizados e implementados em softwares são: Teste de Shapiro-Wilk, Anderson-Darling,
Kolmogorov-Smirnov, Cramer-von Mises, Liliefors.
O gráfico de probabilidade e um método para determinar se os dados da amostra (erros
estimados, nessa situação) seguem uma distribuição hipotética, baseada no exame visual dos
dados. O procedimento geral e muito simples e pode ser feito rapidamente. Gráfico de
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 22
probabilidade usa tipicamente um papel gráfico especial, conhecido como papel de probabilidade,
que tem sido projetado para a distribuição hipotética. A papel de probabilidade e largamente
disponível para as distribuições normal, lognormal, Weibull e varias distribuições quadrado e
gama. Softwares estatísticos atualmente substituem o uso destes papéis, necessários durante
longo tempo.
Para construir um gráfico de probabilidade, as observações na amostra são primeiro ordenadas
da menor para a maior. Ou seja, a amostra X1., X2, .. .'Xn e arrumada como x(1),x(2) ...,x(n) em
que x(I) é a menor observação, X(2) e a segunda menor observaçao e assim por diante, com x(n)
sendo a maior. As observações ordenadas Xa(U) sao então grafadas contra suas freqüências
cumulativas observadas (j - 0,5)/n em um papel apropriado de probabilidade. Se a distribuição
hipotética descrever adequadamente os dados, os pontos picotados cairão, aproximadamente, ao
longo de uma linha reta; se os pontos plotados desviarem significativamente de uma linha reta,
então o modelo hipotético não será apropriado. Geralmente, determinar se os dados plotados
seguem ou nao a linha reta e algo subjetivo. O procedimento e ilustrado no seguinte exemplo.
Um Exemplo:
Dez observações sobre o tempo (em minutos) efetivo de vida de serviço de baterias usadas
em um computador pessoal sao: 176,191,214,220,205, 192,201,190, 183,185. Imaginemos que
a vida da bateria seja modelada adequadamente por uma distribuição normal. Para usar o gráfico
de probabilidade de modo a investigar essa hipótese, arranje primeiro as observações em ordem
crescente e calcule suas freqüências cumulativas (j- 0,5)/10 conforme segue.
j X9i) (j - 0,5)/10
1 176 0,05
2 183 0,15 3 185 0,25 4 190 0,35 5 191 0,45 6 192 0,55 7 201 0,65 8 205 0,75 9 214 0,85 10 220 0,95
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 23
Os pares de valores x(i) e (j - 0,5)/10 são agora plotados em um papel de probabilidade
normal. Esse gráfico é mostrado na figura abaixo. A maioria dos papeis de probabilidade normal
plotam 100(j - 0,5)/n na escala vertical da esquerda e 100[ 1 - (j - 0,5)/n] na escala vertical da
direita, com o valor da variável plotada na escala horizontal. Uma linha reta, escolhida
subjetivamente, foi desenhada através dos pontos plotados. Desenhando a linha reta, você deve
estar mais influenciado pelos pontos perto do meio do gráfico do que pelos pontos extremos. Uma
boa regra pratica e desenhar a linha aproximadamente entre 0 25.0 e 0 75.0 pontos percentis.
Essa é a maneira como a linha na foi determinada. Na estimação de quão perto os pontos estão
da linha reta, imagine um "lápis grosso" repousando ao longo da linha. Se todos os pontos forem
cobertos por esse lápis imaginário, então distribuição normal descreverá adequadamente os
dados. Uma vez que os pontos na Figura abaixo passaram no teste do "lápis gordo", conc1uimos
que a distribuição normal é um modelo apropriado.
Um gráfico de probabilidade normal pode também ser construído em um papel gráfico normal,
plotando os escores normais padrões Zj contra x(i), em que os escores normais padrões satisfazem:
)(][5.0
jzzZP
n
j
Por exemplo, se (j-0.5)/n = 0.05 então (zj) = -1.64. Para ilustrar, consideremos os dados
do exemplo acima.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 24
j X9i) (j - 0,5)/10 Zj
1 176 0,05 -1.64
2 183 0,15 -1.04 3 185 0,25 -0.67 4 190 0,35 -0.39 5 191 0,45 -0.13 6 192 0,55 0.13 7 201 0,65 0.39 8 205 0,75 0.67 9 214 0,85 1.04 10 220 0,95 1.64
O gráfico normal probabilístico é então dado pela seguinte figura:
Retornando ao exemplo das variedades de milho temos:
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 25
Gráfico Normal Probabilístico:
Figura – Gráfico Normal Probabilístico dos Resíduos
Neste gráfico, se os valores observados formarem uma reta, portanto os erros seguem
uma distribuição normal. A maioria dos dados deve também estar concentrada no meio da reta
para satisfazerem a suposição de normalidade. Os valores das caudas da distribuição não devem
ser considerados com tanto rigor, mas sim analisados para se verificar se são valores extremos ou
não.
55 .. 22 .. 33 .. 44 .. VV EE RR II FF II CC AA NN DD OO AA HH OO MM OO CC EE DD AA SS TT II CC II DD AA DD EE ::
A suposição de homocedasticidade significa que a variabilidade entre repetições de um
mesmo tratamento deve ser semelhante a dos demais tratamentos. A verificação desta suposição
pode ser feita através do uso de testes ou por meio de análise gráfica.
Testes para Verificação de Homocedasticidade:
Hipóteses:
Ho : 12 = 2
2 = ... = a2
H1 : i2 = i
2 para pelo menos i j,
Diferentes testes são propostos na literatura para teste da hipótese acima. Os testes mais
conhecidos são:
a) Teste de Hartley: Exige um mesmo número de repetições entre os tratamentos.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 26
b) Teste de Bartlett: Pode ser utilizado para qualquer número de repetições nos tratamentos.
c) Teste de Cochran: Pode ser utilizado para qualquer número de repetições nos tratamentos.
d) Teste de Levene: Anova para resíduos .
TESTE DE HARTLEY : F máximo
O teste de Hartley também é conhecido como teste do F máximo. A estatística do teste é
dada por:
2
2
min
maxmax
S
SF
onde:
2maxS = maior variância dentre os “a” tratamentos;
2minS = menor variância dentre os “a” tratamentos;
Fmax é comparado com o valor tabelado para H(g,r-1) da tabela de Pearson e Hartley, onde
g=número de tratamentos e r= número de repetições (mesmo para todos os tratamentos).
Se Fmax > H(g,r-1) rejeita-se H0 e conclui-se que não existe homogeneidade de variância
entre os tratamentos. Caso contrário H0 não é rejeitada.
Análise Gráfica para Verificação da Homocedasticidade:
Box-Plot dos Tratamentos vs Resíduos:
Se existe homocedasticidade, espera-se que os Box-plots seja semelhantes, ou seja,
apresentem um variabilidade muito próxima nas “caixas” dos diferentes tratamentos. Se existe
heterocedasticidade, a variabilidade é diferente entre as caixas. As vezes, a heterocedasticidade
pode ser também um indicio da falta de normalidade.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 27
Figura – Box Plot para Residuos
Problema: Pequenas Amostras.
Gráfico de Dispersão de Resíduos vs Predito:
O gráfico de resíduos vs predito é, no caso de experimentos com um fator (ONEWAY),
semelhante ao gráfico de resíduos vs tratamento. Este não será o caso quando dois ou mais
fatores estiverem envolvidos na análise.
Se existe homocedasticidade, espera-se que os desvios se distribuam de forma homogênea
dentre de um mesmo intervalo. Se os desvios apresentarem variação com diferentes amplitudes,
temos a situação de heterocedasticidade.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 28
Figura – Variância Constante
Situação ideal: A variabilidade é constante, isto é, aproximadamente a mesma nos
diferentes tratamentos.
Figura – Variância não Constante
Situação de não homocedasticidade: A variabilidade cresce a medida que cresce o
valor predito.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 29
Figura – Variância não Constante
Situação de não homocedasticidade: A variabilidade decresce a medida que cresce
o valor predito.
Figura – Variância não Constante
Situação de não homocedasticidade: A variabilidade cresce para valores próximos a
média o valor predito.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 30
Figura – Variância não Constante
Situação de não homocedasticidade: A variabilidade decresce para valores
próximos a média o valor predito.
QUESTÃO:
O que fazer quando alguma das suposições ( normalidade e/ou homocedasticidade)
não são satisfeitas?
O procedimento usualmente nestes casos é o uso de transformações na variável resposta.
O uso de transformações é um artifício matemático com bons resultados quando existe uma
relação entre média e variância (heterocedasticidade regular). Nos demais casos, as
transformações dificilmente apresentam resultados satisfatórios.
Atualmente, novos procedimentos estatísticos são propostos como alternativa ao uso de
transformação dos dados. Além dos já tradicionais procedimentos de métodos não
paramétricos, hoje estão disponíveis, inclusive em todos os softwares mais conhecidos, os
métodos de Modelos Lineares Generalizados, que levam em conta a natureza da distribuição
da variável em estudo.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 31
55 .. 22 .. 44 .. COMPARAÇÕES MULTIPLAS:
55 .. 22 .. 44 .. 11 .. IINNTTRROODDUUÇÇÃÃOO::
A análise estatística de um problema de comparação de “a” médias nem sempre chega ao
seu final com os resultados da tabela da Análise de Variância. Se não rejeitamos H0 não existe
mais nada a ser investigado, porém se rejeitamos Ho estamos concluindo pela evidencia de que
pelo menos dois dos tratamentos em estudo, diferem significativamente. Desta forma é de
interesse prosseguir a análise a fim de se identificar as diferenças entre as médias dos diferentes
tratamentos. Esta continuação da análise é feita através de técnicas estatísticas denominadas
“Comparações Múltiplas”.
Objetivo:
Identificar, quando rejeitamos Ho numa ANOVA, que tratamentos diferem
significativamente.
Proposta:
Estabelecer uma “diferença mínima significativa(d.m.s)” entre duas médias. Toda vez
que o valor absoluto da diferença entre duas médias for maior ou igual d.m.s., as médias são
consideradas estatisticamente diferentes, ao nível de significância estabelecido.
Foram propostas diversas maneiras de estabelecer uma d.m.s. Cada proposta é na
realidade, um teste que, em geral, leva o nome do seu autor. Não existe um procedimento para a
comparação de médias que seja definitivamente o “melhor”. Vários trabalhos são encontrados na
literatura fazendo estudos comparativos dos diferentes métodos que, incluindo-se novas propostas
que freqüentemente são apresentadas. Em geral é possível mostrar a existência de procedimentos
mais eficientes para situações especificas, porém não se mostrou, até hoje, um método que seja
mais eficaz para um caso geral.
Procedimentos gráficos também são propostos, mais como uma forma descritiva de
investigar as diferenças entre tratamentos (ou grupos de tratamentos).
55 .. 22 .. 44 .. 22 .. TT EE SS TT EE TT -- TT EE SS TT EE LL SS DD (( LL EE AA SS TT SS II GG NN II FF II CC AA NN TT DD II FF FF EE RR EE NN CC EE )) ::
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 32
Teste proposto por Fisher que também propos a expressão diferença mínima
significativa (least significant difference). É provavelmente, o teste menos usado.
Características:
A d.m.s. é definida por:
n
QMEtLSD
aN,2
2
(dados balanceados)
jiaN, nn
QMEtLSD11
2
(dados não balanceados)
Rejeita-se a igualdade entre dois tratamentos se:
LSDyy .j.i
55 .. 22 .. 44 .. 33 .. TT EE SS TT EE DD EE TT UU KK EE YY ::
O teste proposto por Tukey (1953) permite testar qualquer contraste, sempre, entre duas
médias de tratamentos, ou seja, não permite comparar grupos entre si. A d.m.s. é neste caso
definido por:
n
QME)f,a(q (dados balanceados)
ji nnQME
)f,a(q 11
2 (dados não balanceados)
onde q é chamada de amplitude total studentizada que depende do número de tratamentos (a) e
do número de graus de liberdade dos erros (f). (tabela encontrada em Montogomery ). O teste
preserva o nivel de significância para todos os contrastes.
Rejeita-se a igualdade entre dois tratamentos se:
.j.i yy
Nota:
O teste de Tukey foi proposto depois do teste t. O autor denominou a diferença mínima
significativa que obteve pelo teste de diferença honestamente significante. Deste fato resulta
que alguns softwares denominam este teste de HSD (honestly significant difference).
55 .. 22 .. 44 .. 44 .. AA PP RR EE SS EE NN TT AA ÇÇ ÃÃ OO DD OO SS RR EE SS UU LL TT AA DD OO SS ::
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 33
Os resultados de um teste de comparações múltiplas, qualquer que seja o método
utilizado, é usualmente apresentado através de um método de letras, da seguinte forma:
Inicialmente ordena-se as médias de tratamentos em ordem crescente (ou decrescente).
Coloca-se uma letra do alfabeto na primeira média e em seguida compara-se com as médias
seguintes. Se a diferença for superior ao valor da d.m.s. a diferença é considerada significativa e
portanto é atribuída uma outra letra a média que foi comparada.
Ao final temos que médias de tratamentos que não diferem significativamente tem em
comum uma letra enquanto que médias que diferem não tem nenhuma letra em comum.
Consideremos as seguintes situações onde as médias estão ordenadas em ordem
decrescente ( A > C > D > B):
Tratamentos Situações
Caso 1 Caso 2 Caso 3 Caso 4 Caso 5
A a a a a a
C a b b b a b
D a c c b c b c
B a d c c c
Interpretando:
Caso 1: Situação onde não foi rejeitado H0 na tabela de ANOVA, ou seja, não
existem diferenças entre quaisquer dois tratamentos.
Caso 2: Outra situação extrema, todos os tratamentos diferem entre si.
Caso 3: Temos que A C diferem de todos os tratamentos e D e B são
estatisticamente iguais entre si.
Caso 4: A difere de todos os demais tratamentos, C e D são estatisticamente iguais
mas C difere de todos os demais enquanto que D é também estatisticamente igual
a B.
Caso 5: A é estatisticamente igual a C mas difere dos demais, enquanto que C é
estatisticamente também igual a D e diferente de B. Por sua vez D é
estatisticamente igual a B.
Exemplo das Variedades de Milho:
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 34
Diferenças Mínimas Significativas:
547.35
7*2*119.22
,2 n
QMEtLSD
aN
787.45
7*04.4),(
n
QMEfaqTukey
Variedades i.y Fisher Tukey
A 23 A A
C 26 A B A B
B 27 B A B
D 31 C B
Por exemplo:
C – A = 26 – 23 = 3 < 3.54 = LSD C e A não diferem significativamente
D – A = 31 – 23 = 8 > 3.54 = LSD D e A diferem significativamente e D é superior a A
D – A = 31 – 23 = 8 > 4.78= Tukey D e A diferem significativamente e D é superior a A
..........
Conclusão:
Pelo método de Fisher temos que a Variedades que apresenta maior rendimento são é a D
que é estatisticamente superior as demais. B e C e também A e C São também estatisticamente
iguais.
Pelo método de Tukey D, B e C , B, C e A são estatisticamente iguais. D, B e C apresentam
os melhores rendimentos porém B e C também são iguais a D, logo apenas D e A são
estatisticamente iguais conseqüentemente D seria a variedade recomendada para uso.
Portanto ambos os métodos apontam para uma mesma variedade a ser utilizada.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 35
55 .. 33 .. EE XX PP EE RR II MM EE NN TT OO SS EE MM BB LL OO CC OO SS AA LL EE AA TT OO RR II ZZ AA DD OO SS ::
55 .. 33 .. 11 .. II NN TT RR OO DD UU ÇÇ ÃÃ OO ::
Existem situações experimentais onde as unidades experimentais são heterogêneas devido
a presença de uma (ou mais) fonte(s) de variação(ões) conhecida(s) e que pode(m) ser
controlada(s) quando da realização do experimento. Nestes casos o processo de aleatorização
deve ser realizado após o agrupamento das unidades experimentais em subconjuntos
homogêneos. Portanto temos uma restrição no processo de aleatorização, ou seja, a atribuição
dos tratamentos às unidades experimentais deve ser realizada somente após a identificação dos
subconjuntos homogêneos, usualmente chamado de “blocos”. Desta forma, espera-se que exista
uma variabilidade entre unidades experimentais de diferentes blocos, explicada pela fonte de
variação conhecida, e uma homogeneidade (baixa variabilidade) entre as unidades experimentais
de um mesmo “bloco”.
O uso de “blocos” pode também facilitar a condução do experimento. Pode-se por
exemplo, existir uma limitação de tempo para realização do experimento (intervalo de tempo,
dia, semana...) não sendo possível, necessariamente, garantir as mesmas condições experimentais
a cada período. Nestes casos cada período pode ser considerado como um bloco de forma a isolar
a eventuais fontes de variabilidade derivadas do fato de todos experimentos não serem realizados
ao mesmo tempo. .
De acordo com o número de fontes de variabilidade conhecidas que tornam as unidades
homogêneas, temos diferentes tipos de planejamento com restrições na aleatorização.
Uma fonte de Variação Conhecida: Planejamento Aleatorizado em Blocos
Duas Fontes de Variação Conhecidas: Planejamento em Quadrado Latino
Três Fontes de Variação Conhecidas: Planejamento em Quadrado Greco-Latino
55 .. 33 .. 22 .. PLANEJAMENTO ALEATORIZADO EM BLOCOS:
Problema:
As unidades experimentais são heterogêneas devido a presença de uma fonte de
variabilidade conhecida e que pode ser controlada na realização do experimento de forma a se
obter subgrupos homogêneos.
Objetivo:
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 36
Agrupar as unidades experimentais em subgrupos homogêneos de forma a manter sob
controle a fonte de variabilidade conhecida garantindo desta forma que os resultados a serem
obtidos serão devidos somente aos efeitos dos tratamentos em estudo.
Exemplo:
Um professor conduziu um experimento cujo objetivo era o de com comparar
quatro diferentes fontes de informação ( A – Jornal; B – Televisão; C – Revistas; D – Rádio). Para
verificar este objetivo, foi escolhido aleatoriamente um conjunto de 24 alunos dentre os quais 12
cursavam a 1a série do ensino médio (Grupo II) e 12 a 6a série do ensino fundamental (Grupo I).
Os alunos foram então divididos em 2 grupos, segundo a série que cursavam e para cada um foi
atribuído aleatoriamente uma fonte de informação. Os alunos tomaram então conhecimento de
certa noticia através da sua fonte de informação sendo então submetidos a um teste de
conhecimento sobre o assunto, cujos resultados são apresentados abaixo:
Fonte de Informação
A B C D
Grupo I 65 56 58 38
69 49 65 30
73 54 57 34
Grupo II 72 73 76 71
79 77 69 65
80 69 71 62
Representação Gráfica:
N o tas p o r G ru p o s d e A lu n o s
G ru po s d e Alu n os
No
tas
2 5
3 5
4 5
5 5
6 5
7 5
8 5
0 1 2 3
N o tas p o r F o n tes d e In fo rm ação
F o n tes d e In fo rm ação
No
tas
2 5
35
45
55
65
75
85
0 1 2 3 4 5
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 37
Definições:
Blocos: sub-grupos de unidades experimentais homogêneas
Blocos Completos: em cada bloco podemos ter pelo menos uma unidade experimental
submetida a cada tratamento.
Blocos Incompletos: o número de unidades experimentais é inferior, em um ou mais blocos, ao
número de tratamentos, logo nem todos os tratamentos são aplicados em todos os blocos.
Aleatorização: Processo de atribuição aleatória dos tratamentos às unidades experimentais
dentro de cada bloco.
Importante:
Um bloco deve ser entendido como uma restrição a aleatorização. Se não
for considerado este principio, ele provavelmente deve ser um outro fator e
deve ser tratado como tal, ou seja, como um experimento fatorial (próximo
capítulo).
N o ta s p o r F o n te s d e In fo rm a ç õ e s e G ru p o s d e A lu n o s
F o n tes d e In fo rm ação
No
tas
1
1
1
1
1
1
1
1
1
1
1
1
2
22
2
2
2
2
22 2
2
2
25
35
45
55
65
75
85
0 .5 1 .0 1.5 2 .0 2 .5 3 .0 3 .5 4 .0 4 .5
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 38
55 .. 33 .. 22 .. 11 .. AA NN ÁÁ LL II SS EE EE SS TT AA TT ÍÍ SS TT II CC AA ::
Consideremos um experimento onde se deseja comparar “a” tratamentos sujeito à
unidades experimentais heterogêneas segundo uma fonte de variação com “b” possíveis situações.
“a” tratamentos e “b” blocos.
Tratamentos Blocos
1 2 … B
1 y111 y112 y121 y122 ... y1b1 y1b2
y113 y114 y123 y124 y1b3 y1b4
…. …… …… …… …..
a ya11 ya12 ya21 ya22 ... yab1 yab2
ya13 ya1n ya23 ya2n yab3 yabn
Onde:
yijk : i = 1, 2, ..., a tratamentos
j = 1, 2, ..., b blocos
k = 1, 2, ...,nij unidades experimentais por tratamentos em cada bloco.
Observação: Se nij é o mesmo ( =n ) para todo i e j temos experimento balanceado.
Neste caso
na : número total de unidades experimentais por blocos
nab : número total de unidades experimentais no experimento
nb : número de unidades experimentais que receberam cada tratamento.
Simplificação (Caso Usual):
Consideremos a situação em que existe somente uma unidade experimental submetida a
cada tratamento em todos os blocos, isto é, n = 1 N = ab.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 39
Modelo:
yij = + i + j + ij
: efeito comum que independe de blocos ou tratamentos
i : efeito de tratamentos; i = 1, ..., a
j: efeito de blocos; j = 1, ..., b
ij : Erros aleatórios
Estimadores :
..yˆ
...ii yyˆ
..j.j yyβ
..j..i
..j..i..
Jiij
yyy
yy..yyy
ˆ ˆ ˆy
Teste de Hipóteses:
Modelo:
yij = + i + j + ij
Problema:
Verificar a igualdade de tratamentos.
Hipótese de interesse: i um menos pelo para 0 :H
i 0 :H
i1
io
Partição da Soma de Quadrados (n=1):
2
22
1
2
1
2
1 11
2
a
1i
a
1i
b
1j
..j..iij
b
1j
..j....i
a
1i
b
j
..j..ij....i
a
i
a
i
b
j
....j.j..i.i
b
j
..ij
yyyy yya yyb
.............
yyyy..yyyy
yyyyyyyyyy
ij
..ij
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 40
ou seja:
SQT = SQModelo + SQE
= SQTr + SQBloco + SQE
Graus de liberdade: (n=1)
Total: N – 1 ( N = nab = ab) tratamentos: a – 1
blocos: b – 1
erro: (a – 1) (b – 1)
Esperança dos Quadrados Médios
E (QME) = 2
E (QMT) = 2 +1
1
2
a
b
a
i
i
E (QMB) = 2 +1b
a
a
1i
2i
Sob Ho E (QME) = E (QMT) = E(QMB) = 2
Tabela de ANOVA:
ANOVA GL SQ QM
Modelo a + b – 2 SQM -
. Blocos b – 1 SQB SQB/b-1
. Tratam. a – 1 SQTr SQTr/a-1
Erro (a – 1) (b – 1) SQE SQE/(a-1)(b-1)
Total N - 1
Estatística de Teste:
QME
QMTFc
Sob a hipótese ij ~ N (0, 2)
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 41
Fc ~ Fa-1,(a-1)(b-1)
E, rejeita-se H0 se Fc > Ft
Verificar a igualdade de blocos.
Quando os blocos controlam uma causa de variação conhecida, o teste de efeitos de blocos
é totalmente desnecessário. A definição do experimento com uma estrutura de blocos é devido ao
fato de que é conhecida a variabilidade existente nas unidades experimentais em função das
características que definem os blocos
Entretanto, o pesquisador, às vezes, organiza blocos para controlar uma fonte de variação
sobre a qual tem duvidas sobre a sua significância. Nestes casos depois de realizado o
experimento, deseja-se verificar a diferença entre blocos, pois assim conclusões poderão ser
tomadas de forma a contribuir no planejamento de experimentos futuros.
Neste caso, a hipótese a ser testada é dada por:
Ho : j= 0 j
H1 : j 0 para pelo menos um j
Temos que sob Ho
E (QME) = E (QMB) = 2
Logo:
)b)(a(,b*c F~
QME
QMBF 111
e rejeita-se H0 se: )b)(a(,b*c FF 111
Se os pressupostos que levaram a fixar a estrutura de blocos estão corretos, o teste F*
deve ser sempre significativo, ou seja, deve verificar a informação de diferença entre as unidades
experimentais (olhar direto para o teste F para tratamentos e na para blocos).
Importante:
Os experimentos em blocos ao acaso são feitos essencialmente para comparar
tratamentos. Alguns autores aconselham até a não calcular o valor de F para blocos porque, como
os tratamentos são aleatorizados dentro dos blocos e os blocos são definidos de forma não
aleatória. O teste F para blocos é, portanto, inadequado.
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 42
Adequabilidade do Modelo:
Devem ser utilizados os mesmos procedimentos vistos para o caso de um único fator,
devendo no entanto o gráfico de resíduos ser utilizado nas seguintes alternativas:
- Gráfico de resíduos x predito
- Gráfico de resíduos x tratamentos
- Gráfico de resíduos x blocos
Continuação do Exemplo:
Duas Situações Ajuste do Modelo sem e com Blocos:
Modelo sem Bloco:
Source DF Sum of Squares Mean Square F Value Pr > F
Model 3 1668.000000 556.000000 4.10 0.0203
Error 20 2714.000000 135.700000
Corrected Total 23 4382.000000
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 43
R-Square Coeff Var Root MSE Nota Mean
0.380648 18.49053 11.64903 63.00000
Source DF Type I SS Mean Square F Value Pr > F
Fonte 3 1668.000000 556.000000 4.10 0.0203
Modelo com Blocos:
Source DF Sum of Squares Mean Square F Value Pr > F
Model 4 3612.000000 903.000000 22.28 <.0001
Error 19 770.000000 40.526316
Corrected Total 23 4382.000000
R-Square Coeff Var Root MSE Nota Mean
0.824281 10.10481 6.366028 63.00000
Source DF Type I SS Mean Square F Value Pr > F
Bloco 1 1944.000000 1944.000000 47.97 <.0001
Fonte 3 1668.000000 556.000000 13.72 <.0001
Capítulo 5 – Experimentos com um Único Fator(Oneway)
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta Página 44
Tukey's Studentized Range (HSD) Test for Nota
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than
REGWQ.
Alpha 0.05
Error Degrees of Freedom 19
Error Mean Square 40.52632
Critical Value of Studentized Range 3.97655
Minimum Significant Difference 10.335
Means with the same letter are
not significantly different.
Tukey Grouping Mean N Fonte
A 73.000 6 Jornal
A 66.000 6 Revistas
A 63.000 6 Televisão
B 50.000 6 Rádio