uma aplicação de modelos lineares mistos · modelos mistos prof. jomar 1 Índice 1 introduÇÃo...
TRANSCRIPT
UNIVERSIDADE FEDERAL DO PARANÁ
DEPARTAMENTO DE ESTATÍSTICA
Uma Aplicação de Modelos Lineares Mistos
Professor Jomar Antonio Camarinha Filho
CURITIBA - PARANÁ
SETEMBRO/2003ÍNDICE
Modelos Mistos Prof. Jomar 1
ÍNDICE
1 INTRODUÇÃO..............................................................................................................................................................2
2 EXEMPLOS NUMÉRICOS .......................................................................................................................................3
2.1 - EXEMPLO 1: EXPERIMENTO COM DADOS BALANCEADOS.............................................................................. 32.1.1 - Programa SAS para análise do exemplo .................................................................................................32.1.2 - Saída do PROC GLM..................................................................................................................................42.1.3 - Saída do PROC MIXED..............................................................................................................................5
2.2 - EXEMPLO 2: EXPERIMENTO COM DADOS DESBALANCEADOS....................................................................... 82.2.1 - Saída do PROC GLM..................................................................................................................................82.2.2 - Saída do PROC MIXED............................................................................................................................13
2.3 - EXEMPLO 3: EXPERIMENTO COM DADOS BALANCEADOS E COM UMA CASELA VAZIA........................... 152.3.2 - Saída do PROC MIXED............................................................................................................................19
2.4 - EXEMPLO 4: EXPERIMENTO COM DADOS DESBALANCEADOS E COM UMA CASELA VAZIA .................... 202.4.1 - Saída do PROC GLM................................................................................................................................202.4.2 - Saída do PROC MIXED............................................................................................................................24
BIBLIOGRAFIA.............................................................................................................................................................27
Modelos Mistos Prof. Jomar 2
1 Introdução
Este trabalho tem por finalidade exemplificar a metodologia de modelos lineares
mistos. Utilizou-se 4 exemplos, cada qual com sua peculiaridade em função do
experimento ser ou não completo com dados balanceados ou desbalanceados e na presença
de caselas vazias. O pacote estatística SAS, versão 8, foi utilizado para analisar os
experimentos.
Os dados a seguir referem-se à produtividade de grãos (kg/parcela de 18 m2) de
cinco híbridos de milho avaliados no delineamento inteiramente casualizado com duas
repetições em dois locais:
Híbrido
Local 1 2 3 4 5
2 3.6
2.62
5.88
5.63
5.46
6.62
4.37
3.86
7.0
6.48
3 5.5
7.2
7.17
7.49
9.83
10.74
3.38
7.02
9.35
8.15
Para análise destes dados será considerado o seguinte modelo:
yijk = µ + αj + β i + (αβ )ij + eijk
em que:
yijk é o valor observado
µ é uma constante inerente a todas as observações;
αj é o efeito do j-ésimo local ( j = 1,2) considerado fixo;
βi é o efeito do i-ésimo híbrido (i=1,2, ...,5) , t i ~ NID (0, σ2t)
(αβ )ij é o efeito da interação entre o i-ésimo híbrido e o j-ésimo local, (lt)ij ~ NID (0, σ2tl)
eijk é o erro aleatório associado à observação yijk , eijk ~ NID (0, σ2)
A título de ilustração e discussões provocou-se desbalanceamento e perda de casela
no experimento acima, criando-se deste modo, quatro exemplos.
Modelos Mistos Prof. Jomar 3
2 Exemplos Numéricos
2.1 - Exemplo 1: Experimento com Dados Balanceados
2.1.1 - Programa SAS para análise do exemplo
options nonumber nodate ps=60;
data exemplo;
input loc rep trat pg;
datalines;
2 1 5 7.0
... ... ... ...
3 2 1 5.57
;
proc glm;
class loc rep trat;
model pg=loc|trat;
random trat trat*loc/test;
lsmeans loc/pdiff;
run;
proc mixed ord;
class loc rep trat;
model pg= loc;
random trat trat*loc/ solution;
lsmeans loc/pdiff;
run;
Modelos Mistos Prof. Jomar 4
2.1.2 - Saída do PROC GLM
General Linear Models Procedure
Dependent Variable: PG
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 9 79.23798000 8.80422000 8.32 0.0014
Error 10 10.58800000 1.05880000
Corrected Total 19 89.82598000
R-Square C.V. Root MSE PG Mean
0.882128 16.15100 1.028980 6.371000
Source DF Type I SS Mean Square F Value Pr > F
LOC 1 29.71922000 29.71922000 28.07 0.0003
TRAT 4 42.79438000 10.69859500 10.10 0.0015
LOC*TRAT 4 6.72438000 1.68109500 1.59 0.2517
Source DF Type III SS Mean Square F Value Pr > F
LOC 1 29.71922000 29.71922000 28.07 0.0003
TRAT 4 42.79438000 10.69859500 10.10 0.0015
LOC*TRAT 4 6.72438000 1.68109500 1.59 0.2517
Observa-se que todas as somas de quadrados são idênticas no caso do
balanceamento. Assim, as hipóteses testadas são equivalentes.
Source Type III Expected Mean Square
LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 2 Var(LOC*TRAT) + 4 Var(TRAT)
LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)
Após o desdobramento dos graus de liberdade do modelo, vê-se que há evidência de diferença
significativa entre os locais. Porém, o padrão do GLM utiliza como denominador para realização dos testes
na análise de variância, para todos os efeitos, o quadrado médio do resíduo, cujo valor é: 1,0588, quando o
quadrado médio apropriado deveria ser àquele associado à interação. Essa conclusão pode ser tirada pela
simples análise das esperanças matemáticas dos quadrados médios. Destarte, em resumo, os quadrados
médios apropriados para testar os efeitos deveriam ser:
• Para o LOCAL, a interação LOC*TRAT;
• Para TRATAMENTOS (híbridos), a interação LOC*TRAT;
• Para a interação LOC*TRAT, o quadrado médio do resíduo.
Modelos Mistos Prof. Jomar 5
Note que, a relação entre Var (Error) + 2 Var (LOC*TRAT) + Q (LOC) e
Var (Error) + 2 Var(LOC*TRAT) fornece um teste exato. Pois, o único termo restante
nessa relação é a forma quadrática associada ao LOCAL. Nos exemplos em que há
desbalanceamento, essa relação torna-se mais complexa, necessitando uma combinação
linear entre dois ao mais graus de liberdade. Daí, o teste passa a ser aproximado.
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
1 29.71922 4 1.681095 17.6785 0.0136
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 10.698595 4 1.681095 6.3641 0.0503
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 1.681095 10 1.0588 1.5877 0.2517
Uma vez incluída na programação a opção TEST, nota-se que os quadrados médios
utilizados como denominador coincidem com aqueles ditos apropriados. Mas, não se pode
perder de vista que ao se utilizar o PROC GLM os efeitos aleatórios não são entendidos
como aleatórios, mas como fixos. Motivo pelo qual o teste realizado no quadro de
ANOVA não é correto. Least Squares Means
LOC PG Pr > |T| H0:
LSMEAN LSMEAN1=LSMEAN2
2 5.15200000 0.0003
3 7.59000000
2.1.3 - Saída do PROC MIXED
REML Estimation Iteration History
Modelos Mistos Prof. Jomar 6
Iteration Evaluations Objective Criterion
0 1 44.30868020
1 1 34.73476326 0.00000000
Convergence criteria met.
Após a construção do sistema de equações, o método REML obtém as estimativas
dos efeitos aleatórios que tem por base o método interativo de Newton-Raphson, utilizando
como valores iniciais as estimativas fornecidas pelo MIVIQUEO. Vê-se que no presente
exemplo houve a necessidade de apenas duas iterações para convergência.
Covariance Parameter Estimates (REML)
Cov Parm Estimate Std Error Z Pr > |Z|
TRAT 2.25437500 1.91446807 1.18 0.2390
LOC*TRAT 0.31114750 0.63977568 0.49 0.6267
Residual 1.05880000 0.47350975 2.24 0.0253
É de fundamental importância perceber que o PROC MIXED, ao contrário do
PROC GLM, aceita dentro de sua programação, os efeitos aleatórios como aleatórios.
Sabe-se que os estimadores de máxima verossimilhança (ML) e de máxima verossimilhança restrita
(REML) possuem distribuição assintoticamente normal e têm matriz de variância e covariância
assintoticamente conhecida. Logo, é possível a construção de intervalos e testes de hipóteses sobre os
parâmetros do modelo. A saída referente ao teste de efeitos aleatórios ilustra essa teoria. Testa-se se a
estimativa fornecida pelo método REML difere de zero. Pela análise dos p-value , conclui-se que não há
evidência de tal diferença. Portanto, os efeitos de TRAT e LOC*TRAT devem permanecer no modelo.
Model Fitting Information for PG
Description Value
Observations 20.0000
Res Log Likelihood -33.9083
Akaike's Information Criterion -36.9083
Schwarz's Bayesian Criterion -38.2438
-2 Res Log Likelihood 67.8166
Essa saída, pode ser utilizada para comparar modelos de efeitos fixos, dada uma
estrutura de covariância, quando um modelo é um caso especial do outro. Dados dois
modelos, conseqüentemente duas tabelas, pode-se analisá-las pelo valor de AIC. O modelo
que possuir o maior valor será o escolhido. Detalhes em Perri (1998).
Uma informação também advinda dessa tabela é que o teste da razão de
verossimilhança pode ser construído se utilizando dos valores de -2 Res Log Likelihood
Modelos Mistos Prof. Jomar 7
dos dois modelos sob investigação. Sabe-se que -2 Res Log Likelihood tem distribuição
assintoticamente χ2 com p graus de liberdade, sendo p o número de graus de liberdade
associado a cada um dos modelos.
Solution for Random Effects
Effect LOC TRAT Estimate SE Pred DF t Pr > |t|
TRAT 1 -1.36839569 0.85689155 10 -1.60 0.1414
TRAT 2 0.14455181 0.85689155 10 0.17 0.8694
TRAT 3 1.50999746 0.85689155 10 1.76 0.1085
TRAT 4 -1.44425378 0.85689155 10 -1.69 0.1228
TRAT 5 1.15810020 0.85689155 10 1.35 0.2063
LOC*TRAT 2 1 -0.24934974 0.50777645 10 -0.49 0.6340
LOC*TRAT 2 2 0.16970488 0.50777645 10 0.33 0.7451
LOC*TRAT 2 3 -0.23024630 0.50777645 10 -0.45 0.6599
LOC*TRAT 2 4 0.15075412 0.50777645 10 0.30 0.7726
LOC*TRAT 2 5 0.15913705 0.50777645 10 0.31 0.7604
LOC*TRAT 3 1 0.06048458 0.50777645 10 0.12 0.9075
LOC*TRAT 3 2 -0.14975392 0.50777645 10 -0.29 0.7741
LOC*TRAT 3 3 0.43865526 0.50777645 10 0.86 0.4079
LOC*TRAT 3 4 -0.35008917 0.50777645 10 -0.69 0.5062
LOC*TRAT 3 5 0.00070325 0.50777645 10 0.00 0.9989
As estimativas acima são os BLUP’s para os efeitos aleatórios, que são muito úteis no
melhoramento genético.
Tests of Fixed Effects
Source NDF DDF Type III F Pr > F Ord F
LOC 1 4 17.68 0.0136 0.0013
Least Squares Means
Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t
LOC 2 5.15200000 0.78675568 4 6.55 0.0028 0.0008
LOC 3 7.59000000 0.78675568 4 9.65 0.0006 0.0001
Differences of Least Squares Means
Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t
LOC 2 3 -2.43800000 0.57984394 4 -4.20 0.0136 0.0055
Para esse exemplo em que não há desbalanceamento a análise realizada pelo PROC
MIXED nos fornece os mesmos resultados obtidos pelo PROC GLM, após a indispensável
inclusão da opção TEST.
Modelos Mistos Prof. Jomar 8
Na área de genética e melhoramento é comum conduzir-se experimentos no intuito
de avaliar o potencial genético de uma população para o melhoramento, nessas situações os
materiais avaliados (genótipos) são por definição aleatórios e os demais fatores, como
locais, por exemplo podem ser considerados de efeitos fixos. O procedimento usual nesse
caso é de se realizar uma análise do experimento através de um modelo misto (genótipos
aleatórios e locais fixo), testar a hipótese de que a variância genética entre estes materiais
seja diferente de zero, o que pode ser realizado pelo PROC GLM. Caso esta hipótese seja
rejeitada, o melhorista terá interesse em identificar quais são os melhores genótipos dentre
os avaliados, para tanto utiliza-se de suas médias ou médias ajustadas. Neste ponto, o
melhorista abandona a pressuposição de que o efeito de genótipos é aleatório e os
considera fixos (pois suas médias não são estimáveis quando estes são considerados
aleatórios) devendo refazer a análise para obtenção das estimativas destas médias. Uma
outra opção seria utilizar a teoria de modelos mistos apresentada neste trabalho, e realizar a
seleção dos materiais com base no BLUP e não nas médias, deste modo o melhorista não
necessita de mudar suas pressuposições no decorrer da análise, além de obter todas as
informações que necessita em um único procedimento SAS, pois o PROC MIXED fornece
as estimativas dos componentes de variância, com seus respectivos testes, testes sobre os
efeitos fixos do modelo, e BLUP’s.
2.2 - Exemplo 2: Experimento com Dados Desbalanceados
Do exemplo 1 eliminou-se três observações: 1ª, 9ª e 16ª, tornando o experimento desbalanceado.
A maioria das dificuldades encontrada quando se utiliza o PROC GLM para
experimentos desbalanceados com modelos mistos pode ser contornada pelo uso do PROC
MIXED.
2.2.1 - Saída do PROC GLM
General Linear Models Procedure
Dependent Variable: PG
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 9 64.57723824 7.17524869 5.23 0.0201
Error 7 9.60275000 1.37182143
Modelos Mistos Prof. Jomar 9
Corrected Total 16 74.17998824
R-Square C.V. Root MSE PG Mean
0.870548 18.57216 1.171248 6.306471
Source DF Type I SS Mean Square F Value Pr > F
LOC 1 22.63801601 22.63801601 16.50 0.0048
TRAT 4 35.23529722 8.80882431 6.42 0.0170
LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822
Source DF Type II SS Mean Square F Value Pr > F
LOC 1 26.37606667 26.37606667 19.23 0.0032
TRAT 4 35.23529722 8.80882431 6.42 0.0170
LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822
Source DF Type III SS Mean Square F Value Pr > F
LOC 1 20.68369615 20.68369615 15.08 0.0060
TRAT 4 31.93052500 7.98263125 5.82 0.0219
LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822
Source DF Type IV SS Mean Square F Value Pr > F
LOC 1 20.68369615 20.68369615 15.08 0.0060
TRAT 4 31.93052500 7.98263125 5.82 0.0219
LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822
Nesse caso, as somas de quadrados diferem, pois, há o desbalanceamento. Apenas
as somas de quadrados dos tipos III e IV não diferiram devido ausência de casela vazia.
Os exemplos 3 e 4 ilustram o fato.
Source Type I Expected Mean Square
LOC Var(Error) + 1.8154 Var(LOC*TRAT) + 0.0507 Var(TRAT) + Q(LOC)
TRAT Var(Error) + 1.7003 Var(LOC*TRAT) + 3.3403 Var(TRAT)
LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)
Source Type II Expected Mean Square
LOC Var(Error) + 1.7733 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.7003 Var(LOC*TRAT) + 3.3403 Var(TRAT)
LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)
Source Type III Expected Mean Square
Modelos Mistos Prof. Jomar 10
LOC Var(Error) + 1.5385 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.64 Var(LOC*TRAT) + 3.28 Var(TRAT)
LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)
Source Type IV Expected Mean Square
LOC Var(Error) + 1.5385 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.64 Var(LOC*TRAT) + 3.28 Var(TRAT)
LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)
Da mesma forma do exemplo 1, os testes para os efeitos do modelo estão
incorretos. Faz-se primordialmente necessária a análise das esperanças dos quadrados
médios para cada um dos tipos (I, II, III e IV).
Assim, discutindo para o efeito fixo LOCAL:
Tipo I:
• não é adequada, pois, não está ajustada para TRAT;
Tipo II:
• pode ser adequada. Porém, o teste será aproximado, pois, a relação entre Var (Error) + 1.7733 Var
(LOC*TRAT) + Q(LOC) e Var (Error) + 1.64 Var (LOC*TRAT) não isola o termo Q(LOC). A
combinação entre quadrados médios, com já discutido, será necessária;
Tipo III:
• Será a mais adequada. Pois, a relação entre Var (Error) + 1.5385 Var (LOC*TRAT) + Q(LOC) e Var
(Error) + 1.64 Var (LOC*TRAT), embora também não proporcione o isolamento da forma quadrática
Q(LOC), fornece um teste de melhor aproximação em relação ao Tipo II. Isso ocorre porque a diferença
entre 1,55385 e 1,64 (Tipo III) é menor que a diferença 1,7333 e 1,64 (Tipo II);
Tipo IV:
• Equivale a do Tipo III.
A seguir, apenas como ilustração e advertência, tem-se os quadros das análises de
variância para todos os tipos. Porém, como discutido opta-se pela Tipo III após a análise
dos quadros das esperanças dos quadrados médios.
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Modelos Mistos Prof. Jomar 11
Source: LOC
Error: 0.0152*MS(TRAT) + 1.0912*MS(LOC*TRAT) - 0.1064*MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
1 22.638016013 3.91 1.8165003666 12.4624 0.0251
Source: TRAT
Error: 1.0368*MS(LOC*TRAT) - 0.0368*MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
4 8.8088243056 3.77 1.6871605659 5.2211 0.0754
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
4 1.67598125 7 1.3718214286 1.2217 0.3822
Source: LOC
Error: 1.0813*MS(LOC*TRAT) - 0.0813*MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
1 26.376066667 3.52 1.7007096908 15.5089 0.0217
Source: TRAT
Error: 1.0368*MS(LOC*TRAT) - 0.0368*MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
4 8.8088243056 3.77 1.6871605659 5.2211 0.0754
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
4 1.67598125 7 1.3718214286 1.2217 0.3822
Source: LOC
Error: 0.9381*MS(LOC*TRAT) + 0.0619*MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
1 20.683696154 4.44 1.6571495913 12.4815 0.0204
Modelos Mistos Prof. Jomar 12
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 7.98263125 4 1.67598125 4.7630 0.0799
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 1.67598125 7 1.3718214286 1.2217 0.3822
Veja que o quadrado médio apropriado para o teste de LOCAL é dado pela combinação linear de
quadrados médios: 0.9381*MS(LOC*TRAT) + 0.0619*MS(Error) e que os graus de liberdade associado a
esse quadrado médio vale 4,44, ambos os procedimentos visam obter uma melhor aproximação para a
realização do teste.
A obtenção desses resultados são executados das seguintes formas:
A Combinação Linear dos Quadrados Médios 0.9381*MS(LOC*TRAT) +
0.0619*MS(Error):
Primeiramente, deve-se calcular uma estimativa para o denominador apropriado, σ2 + 1.5385 σ2tl .
Do quadro das Esperanças dos Quadrados Médios (Tipo III), tem-se que:
MS(ERROR) é uma estimativa de σ2;
MS(LOC*TRAT) é uma estimativa de σ2 + 1.64 σ2tl .
Depois, isolando-se σ2tl de σ2 + 1.64 σ2
tl , segue:
σ2tl = (MS(LOC*TRAT) - σ2 )/ 1.64
Logo, a estimativa de σ2 + 1.5385 σ2tl fica:
MS(ERROR) + 1,5385 x ((MS(LOC*TRAT) - MS(ERROR))/1.64)=
MS(ERROR) + 0.93810 MS(LOC*TRAT) - 0.93810MS(ERROR)=
= 0.9381*MS(LOC*TRAT) + 0.0619*MS(ERROR) = 1.657153757142.
Agora, o valor de 4,44 do número de graus de liberdade do denominador apropriado é obtido pela
fórmula de Satterthwaite que estima os graus de liberdade pela combinação linear entre os quadrados
médios associada ao quadrado médio apropriado. Assim, sejam MS1, . . . , MSk, quadrados médios
independentes com graus de liberdade df1, . . . , dfk , respectivamente. Então, a combinação linear:
Modelos Mistos Prof. Jomar 13
MS = a1MS1 + a2MS2 + . . . + akMSk
fornece uma aproximação dos graus de liberdade, dada por:
k
2kk
1
211
2
df)MS(a
...df
)MS(a
)MS(df
++
=
Para esse exemplo,
MS = 1.657153757142;
MS1 = 1.37182143; df1 = 7 e a1 = 0.0619;
MS2 = 1.67598125; df2 = 4 e a2 = 0.9381.
Portanto, a estimativa df fica: df = 4,44
Least Squares Means
LOC PG Pr > |T| H0:
LSMEAN LSMEAN1=LSMEAN2
2 5.15100000 0.0060
3 7.47000000
2.2.2 - Saída do PROC MIXED
REML Estimation Iteration History
Iteration Evaluations Objective Criterion
0 1 37.79186016
1 3 32.12320890 0.02440661
2 2 31.87985876 0.00008260
3 1 31.87856824 0.00000015
4 1 31.87856578 0.00000000
Convergence criteria met.
Covariance Parameter Estimates (REML)
Cov Parm Estimate Std Error Z Pr > |Z|
TRAT 1.93776964 1.83183330 1.06 0.2901
LOC*TRAT 0.34141878 0.83881946 0.41 0.6840
Residual 1.28549552 0.64980174 1.98 0.0479
Modelos Mistos Prof. Jomar 14
Model Fitting Information for PG
Description Value
Observations 17.0000
Res Log Likelihood -29.7234
Akaike's Information Criterion -32.7234
Schwarz's Bayesian Criterion -33.7854
-2 Res Log Likelihood 59.4467
Solution for Random Effects
Effect LOC TRAT Estimate SE Pred DF t Pr > |t|
TRAT 1 -1.20821687 0.84389933 7 -1.43 0.1953
TRAT 2 0.22326752 0.84389933 7 0.26 0.7990
TRAT 3 1.51519215 0.84389933 7 1.80 0.1156
TRAT 4 -1.27152457 0.87079772 7 -1.46 0.1876
TRAT 5 0.74128178 0.90683190 7 0.82 0.4406
LOC*TRAT 2 1 -0.25379914 0.53526599 7 -0.47 0.6498
LOC*TRAT 2 2 0.16718349 0.53526599 7 0.31 0.7639
LOC*TRAT 2 3 -0.18213033 0.53526599 7 -0.34 0.7436
LOC*TRAT 2 4 0.12417463 0.54652593 7 0.23 0.8268
LOC*TRAT 2 5 0.14457136 0.54958261 7 0.26 0.8001
LOC*TRAT 3 1 0.04092145 0.53476833 7 0.08 0.9411
LOC*TRAT 3 2 -0.12784562 0.53476833 7 -0.24 0.8179
LOC*TRAT 3 3 0.44909450 0.53476833 7 0.84 0.4288
LOC*TRAT 3 4 -0.34820660 0.53966300 7 -0.65 0.5393
LOC*TRAT 3 5 -0.01396372 0.54932372 7 -0.03 0.9804
Tests of Fixed Effects
Source NDF DDF Type III F Pr > F Ord F
LOC 1 4 13.06 0.0225 0.0028
Least Squares Means
Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t
LOC 2 5.04981290 0.79140606 4 6.38 0.0031 0.0009
LOC 3 7.47525756 0.77747956 4 9.61 0.0007 0.0001
Differences of Least Squares Means
Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t
LOC 2 3 -2.42544466 0.67127483 4 -3.61 0.0225 0.0100
Nota-se que o p-value para o teste para o efeito fixo dado pelo PROC GLM, depois das devidas
correções, é 0,0204, aproximadamente dez vezes maior que o fornecido pelo PROC MIXED (0,0028). E, as
estimativas dadas pelo LSMEANS nas duas declarações também diferem. Isso ocorre porque, como já dito, o
Modelos Mistos Prof. Jomar 15
GLM não reconhece os efeitos aleatórios como aleatórios.
Conclui-se, portanto, que o PROC MIXED é mais apropriado na presença de desbalanceamento.
2.3 - Exemplo 3: Experimento com Dados Balanceados e com uma Casela
Vazia.
Do exemplo 1 eliminou-se apenas a casela referente ao tratamento 4 no local 2
tornando o experimento incompleto, porém, balanceado.
2.3.1 - Saída do PROC GLM
General Linear Models Procedure
Dependent Variable: PG
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 67.92790000 8.49098750 7.31 0.0037
Error 9 10.45795000 1.16199444
Corrected Total 17 78.38585000
R-Square C.V. Root MSE PG Mean
0.866584 16.27926 1.077958 6.621667
Source DF Type I SS Mean Square F Value Pr > F
LOC 1 21.09756250 21.09756250 18.16 0.0021
TRAT 4 42.39421875 10.59855469 9.12 0.0031
LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413
Source DF Type II SS Mean Square F Value Pr > F
LOC 1 30.83025625 30.83025625 26.53 0.0006
TRAT 4 42.39421875 10.59855469 9.12 0.0031
LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413
Source DF Type III SS Mean Square F Value Pr > F
LOC 1 30.83025625 30.83025625 26.53 0.0006
TRAT 4 42.39421875 10.59855469 9.12 0.0031
LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413
Source DF Type IV SS Mean Square F Value Pr > F
LOC 1* 30.83025625 30.83025625 26.53 0.0006
Modelos Mistos Prof. Jomar 16
TRAT 4* 36.46199231 9.11549808 7.84 0.0052
LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413
* NOTE: Other Type IV Testable Hypotheses exist which may yield different SS.
Embora a análise de variância esteja incorreta, dado que os quadrados médios para os
denominadores não são os apropriados, vê-se que as somas de quadrados dos Tipos II, III e IV são iguais.
Logo, os testes serão equivalentes. Porém, na verdade, isso só ocorre porque há apenas dois níveis para o
efeito fixo LOCAL. Caso houvesse mais de dois níveis a hipótese do Tipo III será diferente da do Tipo IV.
Esse fato pode ser visto pelo fator TRAT.
Source Type I Expected Mean Square
LOC Var(Error) + 2 Var(LOC*TRAT) + 0.2222 Var(TRAT) + Q(LOC)
TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)
LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)
Source Type II Expected Mean Square
LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)
LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)
Source Type III Expected Mean Square
LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)
LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)
Source Type IV Expected Mean Square
LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.3846 Var(TRAT)
LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)
De modo análogo ao exemplo 2, pode-se perceber que o quadrado médio apropriado será o da
interação (LOC*TRAT). Mas, consegue-se isolar a forma quadrática sem a necessidade de se encontrar
combinações lineares dos quadrados médios, pois, os coeficientes de var (LOC*TRAT) são iguais e de valor
2.
Com a introdução do comando /TEST, tem-se as especificações dos testes apropriados e suas saídas
são:
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Modelos Mistos Prof. Jomar 17
Source: LOC
Error: 0.0635*MS(TRAT) + 0.9365*MS(LOC*TRAT)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
1 21.0975625 5.63 2.057744246 10.2528 0.0203
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
4 10.598554687 3 1.47870625 7.1675 0.0687
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
3 1.47870625 9 1.1619944444 1.2726 0.3413
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
1 30.83025625 3 1.47870625 20.8495 0.0197
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
4 10.598554687 3 1.47870625 7.1675 0.0687
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
3 1.47870625 9 1.1619944444 1.2726 0.3413
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Modelos Mistos Prof. Jomar 18
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
1 30.83025625 3 1.47870625 20.8495 0.0197
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 10.598554687 3 1.47870625 7.1675 0.0687
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
3 1.47870625 9 1.1619944444 1.2726 0.3413
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
1 30.83025625 3 1.47870625 20.8495 0.0197
Source: TRAT
Error: MS(LOC*TRAT)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
4 9.1154980769 3 1.47870625 6.1645 0.0835
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
3 1.47870625 9 1.1619944444 1.2726 0.3413
Least Squares Means
LOC PG
LSMEAN
2 Non-est
3 7.59000000
Devido à casela vazia não foi possível estimar a média para o local 2.
Modelos Mistos Prof. Jomar 19
2.3.2 - Saída do PROC MIXED
REML Estimation Iteration History
Iteration Evaluations Objective Criterion
0 1 40.79014622
1 4 32.82324801 .
2 1 32.72284896 0.00046929
3 1 32.71465207 0.00000618
4 1 32.71454991 0.00000000
Convergence criteria met.
Covariance Parameter Estimates (REML)
Cov Parm Estimate Std Error Z Pr > |Z|
TRAT 2.89164548 2.48942264 1.16 0.2454
LOC*TRAT 0.18364199 0.70053050 0.26 0.7932
Residual 1.16203526 0.54778868 2.12 0.0339
Model Fitting Information for PG
Description Value
Observations 18.0000
Res Log Likelihood -31.0603
Akaike's Information Criterion -34.0603
Schwarz's Bayesian Criterion -35.2192
-2 Res Log Likelihood 62.1206
As explicações para esses quadros são as mesmas dadas para o exemplos
anteriores. Solution for Random Effects
Effect LOC TRAT Estimate SE Pred DF t Pr > |t|
TRAT 1 -1.33971806 0.92834675 9 -1.44 0.1829
TRAT 2 0.24566459 0.92834675 9 0.26 0.7973
TRAT 3 1.67648348 0.92834675 9 1.81 0.1044
TRAT 4 -1.89016849 1.03059372 9 -1.83 0.0999
TRAT 5 1.30773849 0.92834675 9 1.41 0.1925
LOC*TRAT 2 1 -0.11743665 0.40641319 9 -0.29 0.7792
LOC*TRAT 2 2 0.13704290 0.40641319 9 0.34 0.7437
LOC*TRAT 2 3 -0.13813896 0.40641319 9 -0.34 0.7417
LOC*TRAT 2 5 0.11853270 0.40641319 9 0.29 0.7772
LOC*TRAT 3 1 0.03235413 0.40584541 9 0.08 0.9382
LOC*TRAT 3 2 -0.12144129 0.40584541 9 -0.30 0.7716
Modelos Mistos Prof. Jomar 20
LOC*TRAT 3 3 0.24460871 0.40584541 9 0.60 0.5616
LOC*TRAT 3 4 -0.12004041 0.41983698 9 -0.29 0.7814
LOC*TRAT 3 5 -0.03548113 0.40584541 9 -0.09 0.9322
Tests of Fixed Effects
Source NDF DDF Type III F Pr > F Ord F
LOC 1 3 18.78 0.0227 0.0016
Least Squares Means
Effect LOC LSMEAN Std Error DF t Pr > |t|
LOC 2 4.93870788 0.89427688 3 5.52 0.0117
LOC 3 7.59000000 0.85513801 3 8.88 0.0030
Differences of Least Squares Means
Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t
LOC 2 3 -2.65129212 0.61182839 3 -4.33 0.0227 0.0070
Observa-se, novamente, que existem diferenças nos resultados entre as duas
declarações. Uma vez que, além da perda da casela o GLM ignora o efeito aleatório.
Utilizando-se o PROC MIXED é possível obter a estimativa da média ajustada mesmo na presença
de caselas vazias.
2.4 - Exemplo 4: Experimento com Dados Desbalanceados e com uma
Casela Vazia
Do exemplo 2 eliminou-se a casela referente ao tratamento 4 no local 2 tornando o
experimento desbalanceado e incompleto. Esse caso é visto na literatura como o mais
complexo, requerendo, portanto uma atenção redobrada.
2.4.1 - Saída do PROC GLM
General Linear Models Procedure
Modelos Mistos Prof. Jomar 21
Dependent Variable: PG
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 61.13707333 7.64213417 5.54 0.0256
Error 6 8.27430000 1.37905000
Corrected Total 14 69.41137333
R-Square C.V. Root MSE PG Mean
0.880793 18.10933 1.174330 6.484667
Source DF Type I SS Mean Square F Value Pr > F
LOC 1 22.19425190 22.19425190 16.09 0.0070
TRAT 4 33.69007669 8.42251917 6.11 0.0261
LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662
Source DF Type II SS Mean Square F Value Pr > F
LOC 1 27.79442193 27.79442193 20.15 0.0042
TRAT 4 33.69007669 8.42251917 6.11 0.0261
LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662
Source DF Type III SS Mean Square F Value Pr > F
LOC 1 24.38116364 24.38116364 17.68 0.0057
TRAT 4 31.21982080 7.80495520 5.66 0.0310
LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662
Source DF Type IV SS Mean Square F Value Pr > F
LOC 1* 24.38116364 24.38116364 17.68 0.0057
TRAT 4* 21.22892317 5.30723079 3.85 0.0697
LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662
* NOTE: Other Type IV Testable Hypotheses exist which may yield different SS.
Source Type I Expected Mean Square
LOC Var(Error) + 1.8071 Var(LOC*TRAT) + 0.3405 Var(TRAT) + Q(LOC)
TRAT Var(Error) + 1.6903 Var(LOC*TRAT) + 2.8482 Var(TRAT)
LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)
Source Type II Expected Mean Square
LOC Var(Error) + 1.7018 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.6903 Var(LOC*TRAT) + 2.8482 Var(TRAT)
LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)
Source Type III Expected Mean Square
Modelos Mistos Prof. Jomar 22
LOC Var(Error) + 1.4545 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.6265 Var(LOC*TRAT) + 2.7908 Var(TRAT)
LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)
Source Type IV Expected Mean Square
LOC Var(Error) + 1.4545 Var(LOC*TRAT) + Q(LOC)
TRAT Var(Error) + 1.5366 Var(LOC*TRAT) + 2.6098 Var(TRAT)
LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)
De forma similar ao exemplo 2 conclui-se que o Tipo IV é a que fornecerá uma
melhor aproximação para o teste em comparação com as dos Tipos III e IV. Pois, 1,5366
(Tipo IV) está mais próximo de 1,5439 que 1,6265 (Tipo III). A do Tipo I não é vista como
apropriada. Caso o efeito TRAT fosse fixo, a do Tipo IV seria, também, a escolhida.
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Error: 0.1195*MS(TRAT) + 1.0397*MS(LOC*TRAT) - 0.1592*MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
1 22.194251905 4.98 2.6076392036 8.5112 0.0333
Source: TRAT
Error: 1.0949*MS(LOC*TRAT) - 0.0949*MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
4 8.4225191729 2.60 1.7861922756 4.7153 0.1379
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type I MS DF MS F Value Pr > F
3 1.7509149123 6 1.37905 1.2697 0.3662
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Modelos Mistos Prof. Jomar 23
Error: 1.1023*MS(LOC*TRAT) - 0.1023*MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
1 27.79442193 2.57 1.788946551 15.5368 0.0384
Source: TRAT
Error: 1.0949*MS(LOC*TRAT) - 0.0949*MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
4 8.4225191729 2.60 1.7861922756 4.7153 0.1379
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type II MS DF MS F Value Pr > F
3 1.7509149123 6 1.37905 1.2697 0.3662
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Source: LOC
Error: 0.9421*MS(LOC*TRAT) + 0.0579*MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
1 24.381163636 3.29 1.7294020661 14.0980 0.0281
Source: TRAT
Error: 1.0535*MS(LOC*TRAT) - 0.0535*MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
4 7.8049552007 2.76 1.7708252309 4.4075 0.1387
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type III MS DF MS F Value Pr > F
3 1.7509149123 6 1.37905 1.2697 0.3662
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: PG
Modelos Mistos Prof. Jomar 24
Source: LOC
Error: 0.9421*MS(LOC*TRAT) + 0.0579*MS(Error)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
1 24.381163636 3.29 1.7294020661 14.0980 0.0281
Source: TRAT
Error: 0.9953*MS(LOC*TRAT) + 0.0047*MS(Error)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
4 5.3072307927 3.02 1.7491627772 3.0342 0.1932
Source: LOC*TRAT
Error: MS(Error)
Denominator Denominator
DF Type IV MS DF MS F Value Pr > F
3 1.7509149123 6 1.37905 1.2697 0.3662
Least Squares Means
LOC PG
LSMEAN
2 Non-est
3 7.63300000
Especificando, assim, os testadores adequados.
2.4.2 - Saída do PROC MIXED
REML Estimation Iteration History
Iteration Evaluations Objective Criterion
0 1 33.79284544
1 4 29.32765763 .
2 2 29.10771846 0.00330471
3 1 29.05112462 0.00038671
4 1 29.04504334 0.00000735
5 1 29.04493511 0.00000000
Convergence criteria met.
Covariance Parameter Estimates (REML)
Modelos Mistos Prof. Jomar 25
Cov Parm Estimate Std Error Z Pr > |Z|
TRAT 2.16347433 2.39192133 0.90 0.3657
LOC*TRAT 0.48026042 1.18015518 0.41 0.6840
Residual 1.29693898 0.70732788 1.83 0.0667
Model Fitting Information for PG
Description Value
Observations 15.0000
Res Log Likelihood -26.4687
Akaike's Information Criterion -29.4687
Schwarz's Bayesian Criterion -30.3161
-2 Res Log Likelihood 52.9373
Solution for Random Effects
Effect LOC TRAT Estimate SE Pred DF t Pr > |t|
TRAT 1 -0.93832819 0.93266044 6 -1.01 0.3532
TRAT 2 0.23846422 0.90338217 6 0.26 0.8006
TRAT 3 1.52330107 0.90338217 6 1.69 0.1427
TRAT 4 -1.58415783 1.02222907 6 -1.55 0.1722
TRAT 5 0.76072073 0.96137844 6 0.79 0.4589
LOC*TRAT 2 1 -0.35089330 0.63094658 6 -0.56 0.5982
LOC*TRAT 2 2 0.27381062 0.62578874 6 0.44 0.6770
LOC*TRAT 2 3 -0.15160742 0.62578874 6 -0.24 0.8166
LOC*TRAT 2 5 0.22869010 0.64226818 6 0.36 0.7340
LOC*TRAT 3 1 0.14259783 0.63725385 6 0.22 0.8304
LOC*TRAT 3 2 -0.22087496 0.62329949 6 -0.35 0.7352
LOC*TRAT 3 3 0.48975851 0.62329949 6 0.79 0.4619
LOC*TRAT 3 4 -0.35166042 0.65202934 6 -0.54 0.6091
LOC*TRAT 3 5 -0.05982095 0.64089268 6 -0.09 0.9287
Tests of Fixed Effects
Source NDF DDF Type III F Pr > F Ord F
LOC 1 3 11.87 0.0411 0.0043
Least Squares Means
Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t
LOC 2 4.87301360 0.88607513 3 5.50 0.0118 0.0030
LOC 3 7.61064618 0.83792348 3 9.08 0.0028 0.0005
Modelos Mistos Prof. Jomar 26
Differences of Least Squares Means
Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t
LOC 2 3 -2.73763258 0.79447682 3 -3.45 0.0411 0.0150
Para esse caso, cabe a mesma discussão feita para os exemplos 2 e 3.
Modelos Mistos Prof. Jomar 27
Bibliografia
GRAYBIL,F.A. Theory and application of the linear model. Duxbury, North State, Massachusetts, 1976,
__p.
HARTLEY,H.O. ; RAO, J.N.K. Maximum likelihood estimation for the mixed analysis of variance model.
Biometrika, 54, p. 93-108, 1967.
HENDERSON,C.R. Estimation of variance and covariance components, Biometrics, 17:226-52, 1953
SEARLE, S.R. Linear Models for Unbalanced data. New York: John Wiley, 1987. 536p.
SEARLE, S.R. Linear models . New York, John Wiley & Sons, 1971. 532p.
SEARLE, S.R. Variance Component . New York, John Wiley & Sons, 1992. 501p.