fam ilias estruturadas de modelos com modelo …n! matriz nula de ordem n i n! matriz identidade de...
TRANSCRIPT
ELSA ESTEVAO FACHADAS NUNES MOREIRA
FAMILIAS ESTRUTURADAS DE MODELOS
COM MODELO BASE ORTOGONAL
Teoria e Aplicacoes
Dissertacao apresentada para obtencao do Grau de Doutor em Matematica com
especializacao em Estatıstica pela Universidade Nova de Lisboa, Faculdade de
Ciencias e Tecnologia.
Lisboa
2008
ii
AGRADECIMENTOS E DEDICATORIAS
Sendo este o espaco reservado para referir as pessoas que realmente me ajudaram
e apoiaram neste trabalho, comeco pelo meu orientador, o Professor Doutor Joao
Tiago Mexia. Foi com ele que tudo isto comecou. Foi ele que me trouxe para o
mundo da investigacao, primeiro com o mestrado e agora com o doutoramento e
os projectos em que estive e continuo envolvida, dando inıcio a uma nova fase da
minha vida profissional onde me sinto melhor que nunca. Apesar do grande numero
de doutoramentos orientados pelo Prof. Mexia durante todo o perıodo em que se
processou o meu doutoramento, ele esteve quase sempre disponıvel para responder
as minhas duvidas, para me orientar no caminho a seguir e para em pouco tempo
dar um retorno sobre o material que lhe ia entregando. Mais do que O Professor, o
Prof. Mexia e um grande amigo com a ajuda do qual sei que posso contar noutras
situacoes.
A segunda pessoa que quero referir, e sem duvida, o meu colega do Centro de Ma-
tematica e Aplicacoes (CMA) e grande amigo Miguel Fonseca, sempre disposto para
discutir comigo as multiplas questoes que iam surgindo ao longo de todo processo.
Quero agradecer tambem a todos os outros meus colegas que diariamente ou
com alguma frequencia se encontram na sala do CMA, e que contribuem para o
bom ambiente de trabalho que aı se vive, o qual proporcionou a realizacao do meu
doutoramento.
Um grande agradecimento ao Professor Doutor Luıs Santos Pereira, meu co-
iv
orientador na area da hidrologia e coordenador do projecto de PTDC/AGR-AAM/
71649/2006 -“Gestao do risco em secas: Identificacao, monitorizacao, caracterizacao,
predicao e mitigacao”do qual sou bolseira de investigacao. Gracas a ele tive finan-
ciamento durante o ultimo ano de doutoramento e tive tambem a oportunidade de
estar inserida neste projecto e de ter publicado nas melhores revistas internacionais
da area da hidrologia. Obrigado por acreditar em mim.
Alem disso gostava tambem de agradecer a Professora Doutora Alexandra Ri-
beiro minha co-orientadora e coordenadora do projecto de investigacao POCTI/
32927/AGR/2000 - “Removal of Cu, Cr, As and creosote from impregnated wood
waste aiming its recycling”, no qual tiveram origem os dados que serviram de base
ao trabalho de aplicacao apresentado no capitulo 9 desta dissertacao.
Por fim dedico esta dissertacao a minha famılia: aos meus pais, porque a eles
devo grande parte do que sou, ao meu marido Joao Paulo que sempre me incentivou
a seguir em frente e a procurar uma actividade profissional em que me sentisse
realizada e ao meu pequenino Daniel, a luz que ilumina a minha vida e que da
sentido a tudo isto.
RESUMO
As famılias estruturadas de modelos (f.e.m.) sao constituıdas por modelos elementa-
res que correspondem aos tratamentos do modelo base, o qual pode ser ortogonal de
efeitos fixos com cruzamento-encaixe de factores. Por sua vez, os modelos elemen-
tares podem ser regressoes lineares multiplas nas mesmas variaveis, considerando
homocedasticidade entre as regressoes ou entao modelos log-lineares ajustados a
tabelas de contingencia. No tratamento das f.e.m., numa primeira fase, condensa-
se a informacao contida nos vectores de observacoes correspondentes aos modelos
elementares nas respectivas estatısticas suficientes e na segunda fase aplicam-se os
algoritmos desenvolvidos para o modelo base aos resultados obtidos na primeira fase.
Dado um modelo ortogonal λ =∑m
i=1 Xiαi associado a uma algebra de Jor-
dan comutativa, diz-se que y = Lλ + e e um modelo L-ortogonal se os vecto-
res coluna de L forem linearmente independentes. No caso nao equilibrado das
f.e.m. com regressoes multiplas, L sera uma matriz diagonal por blocos da forma
L = D(X1, ..., Xc), onde Xj sao as matrizes das regressoes individuais as quais di-
ferem de tratamento para tratamento. Desta forma, ultrapassa-se a restricao usual
requerendo que todas as regressoes tenham a mesma matriz de modelo.
Tres aplicacoes a dados reais sao apresentadas. Nas duas primeiras, aplicam-se
as f.e.m. com modelos log-lineares a hidrologia, atraves da analise de transicoes
entre classes de seca. Na terceira, analisam-se dados de experiencias de remocao
electrodialıtica de metais pesados utilizando o caso nao equilibrado das f.e.m..
vi
ABSTRACT
Structuralized family of models (s.f.m.) are constituted by unit models correspon-
ding to the treatments of the base model, which can be orthogonal of fixed effects
with cross-nesting. On its side, the unit models can be multiple linear regressions
on the same variables, considering homoscedasticity between regressions or then,
log-linear models fitted to contingency tables. Following the treatment of s.f.m., in
a first step, information inside the observation vectors correspondent to unit models
is condensate in sufficient statistics and in second step, the algorithms developed for
the base model are applied to the results obtained in the first fase.
Given a orthogonal model λ =∑m
i=1 Xiαi associated to a commutative Jordan
algebra, it is said that y = Lλ+e is a L-orthogonal model if the column vectors the
matrix L are linearly independent. In the no-balanced case of the s.f.m. with multi-
ple regressions, L will be a diagonal by blocks matrix of the form L = D(X1, ..., Xc),
where Xj are the model matrices of the individuais regressions which can differ from
treatment to treatment. In this way, the usual restriction requiring all regressions
to have the same model matrix is overcame.
Three applications to real data are presented. In the two first applications,
s.f.m. with loglinear unit models are applied to hydrology, through the analysis of
transitions between drought classes. In the third one, data originated in experiments
of electrodialytic removal of heavy metals are analyzed using the non-balanced case
of s.f.m..
viii
SIMBOLOGIA E NOTACOES
v → vector (letra minuscula a negrito)
0 → vector nulo
1 → vector de 1’s
Y → vector aleatorio (letra maiuscula a negrito)
A → matriz (letra maiuscula a negrito)
On → matriz nula de ordem n
In → matriz identidade de ordem n
Jn → matriz de 1’s de ordem n
AT → matriz transposta de A
A−1 → matriz inversa de A
A+ → matriz inversa generalizada de Moore-Penrose de A
⊗ → produto de Kronecker entre matrizes
Car(A) → caracterıstica da matriz A
Det(A) → determinante da matriz A
R(A) → Espaco imagem da matriz A
N(A) → Espaco nulidade da matriz A
dim(V) → Dimensao do sub-espaco V
x
V⊥/W → Complemento ortogonal do sub-espaco V relativamente a W
vV → projeccao ortogonal de v sobre o sub-espaco V
Q(V) → Matriz de projeccao ortogonal sobre o sub-espaco V
→ Soma directa ortogonal de sub-espacos
E(X) → Valor esperado da variavel aleatoria X
V (X) → Variancia da variavel aleatoria X
COV (X;Y ) → Covariancia entre a variavel aleatoria X e Y
E(Y) → Vector medio do vector aleatorio Y
COV(Y) → Matriz de covariancia do vector aleatorio Y
COV(X; Y) → Matriz de covariancia cruzada dos vectores aleatorios X e Y
D(d1, ..., dn) → Matriz diagonal com elementos principais d1, ..., dn
Pr() → Probabilidade
UMVUE → Uniforme minimal variance unbiased estimator
BLUE → Best linear unbiased estimator
a.j.c → Algebras de Jordan comutativas
f.e.m → Famılias estruturadas de modelos
CONTEUDO
1. Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Definicoes e Resultados Preliminares . . . . . . . . . . . . . . . . . . . . . 7
2.1 Matrizes Ortogonais Estandardizadas, Diagonalizadoras Ortogonais
e Matrizes Uniformizadoras . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Sub-Espacos e Algegras . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Matrizes Inversas Generalizadas de Moore-Penrose . . . . . . . . . . . 10
2.4 Matrizes de Projeccao Ortogonal . . . . . . . . . . . . . . . . . . . . 11
2.5 Produto de Kronecker entre Matrizes . . . . . . . . . . . . . . . . . . 12
2.6 Vector Medio, Matriz de Covariancia e Matriz de Covariancia Cruzada 14
2.7 Estatısticas Suficientes, Completas e Estimadores UMVUE . . . . . . 16
2.8 Testes de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.9 Vectores Normais e Testes F . . . . . . . . . . . . . . . . . . . . . . . 23
2.10 Modelos de Regressao Multipla . . . . . . . . . . . . . . . . . . . . . 26
2.10.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.10.2 Estimacao dos Coeficientes da Regressao . . . . . . . . . . . . 29
2.10.3 Testes de Hipoteses para Modelos de Regressao Multipla . . . 34
2.11 Modelos Log-Lineares e Tabelas de Contingencia . . . . . . . . . . . . 38
2.11.1 Modelos Log-lineares com 2 dimensoes . . . . . . . . . . . . . 41
xii Conteudo
3. Algebras de Jordan Comutativas . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 Primeiros Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2 Geracao de Algebras de Jordan Comutativas . . . . . . . . . . . . . . 48
3.3 Operacoes Binarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4. Modelos Lineares Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.1 Modelos Associados a uma Algebra de Jordan Comutativa . . . . . . 55
4.2 Estimadores UMVUE . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3 Inferencia para o Modelo de Efeitos Fixos . . . . . . . . . . . . . . . 61
4.4 Vectores Estimaveis e Testes F para os Efeitos Fixos . . . . . . . . . 64
4.5 Construcao de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5.1 Modelos para Encaixe . . . . . . . . . . . . . . . . . . . . . . 65
4.5.2 Modelos para Cruzamento-Encaixe . . . . . . . . . . . . . . . 68
5. Famılias Estruturadas de Modelos:
Caso Equilibrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Modelo Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.3 Modelos Elementares . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.1 Regressoes Multiplas . . . . . . . . . . . . . . . . . . . . . . . 75
5.3.2 Modelos Log-Lineares . . . . . . . . . . . . . . . . . . . . . . . 79
6. Modelos L-Ortogonais para Efeitos Fixos . . . . . . . . . . . . . . . . . . . 85
6.1 Projeccoes e Estatısticas . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.3 Um Primeiro Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.4 Modelos Regressionais Multiplos: Caso nao Equilibrado . . . . . . . . 94
Conteudo xiii
6.4.1 Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
6.4.2 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas
de Modelos Log-lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.3 Ajustamento de Modelos Log-lineares com Duas Dimensoes . . . . . . 103
7.4 Analise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.5 Resultados e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . 111
8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul
de Portugal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.3 Analise da Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . 117
8.4 Modelo Base “Two-Way” . . . . . . . . . . . . . . . . . . . . . . . . . 119
8.5 Resultados e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . 121
9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de
Resıduos de Madeira . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.2 Experiencias e Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.3 Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As
nos Electrolitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
9.3.1 Analise Regressional . . . . . . . . . . . . . . . . . . . . . . . 133
9.4 Interpretacao dos Resultados e Conclusoes . . . . . . . . . . . . . . . 141
xiv Conteudo
10. Conclusoes e Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . 143
Apendice 153
A. Tabelas Anexas ao Capitulo 7 . . . . . . . . . . . . . . . . . . . . . . . . . 155
B. Tabelas Anexas ao Capitulo 8 . . . . . . . . . . . . . . . . . . . . . . . . . 159
C. Artigos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
LISTA DE TABELAS
2.1 Tabela de contingencia com 2 dimensoes . . . . . . . . . . . . . . . . 41
7.1 Classificacao das classes de seca segundo o SPI . . . . . . . . . . . . . 102
7.2 Tabelas de contingencia com duas dimensoes: frequencias observadas
para Portalegre, Elvas, Evora, Beja, Barrancos e Almodovar . . . . . 103
7.3 Frequencias observadas e esperadas - Almodovar . . . . . . . . . . . . 106
7.4 Resultado das comparacoes multiplas de Scheffe para Almodovar . . . 111
7.5 Valores da estatıstica F para Portalegre, Elvas, Evora, Beja, Barran-
cos e Almodovar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.1 Definicao das zonas 1, 2, 3 e 4 . . . . . . . . . . . . . . . . . . . . . . 116
8.2 Valores das estatısticas F(h) para as diferentes frequencias esperadas
do numero de transicoes entre classes de seca . . . . . . . . . . . . . . 124
9.1 Tratamentos (condicoes experimentais) . . . . . . . . . . . . . . . . . 129
9.2 Estimadores dos coeficientes das regressoes para o Cobre, Cromio e
Arsenio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
9.3 Resultados dos testes F para o Cu . . . . . . . . . . . . . . . . . . . 136
9.4 Resultados do metodo de Scheffe para o Cu . . . . . . . . . . . . . . 137
9.5 Resultados dos testes F para o Cr . . . . . . . . . . . . . . . . . . . . 138
9.6 Resultados do metodo de Scheffe para o Cr . . . . . . . . . . . . . . . 138
9.7 Resultados dos testes F para o As . . . . . . . . . . . . . . . . . . . . 140
xvi Lista de Tabelas
9.8 Resultados do metodo de Scheffe para o As . . . . . . . . . . . . . . . 140
9.9 Resultados do metodo de Boferroni para o As . . . . . . . . . . . . . 140
A.1 Valores para os estimadores dos parametros dos modelos de quasi-
associacao ajustados as tabelas de contingencia e respectivos desvios
residuais das 6 estacoes. . . . . . . . . . . . . . . . . . . . . . . . . . 156
A.2 Resultado das comparacoes multiplas de Scheffe para Portalegre, El-
vas, Evora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
A.3 Resultado das comparacoes multiplas de Scheffe para Beja, Barrancos
e Almodovar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
B.1 Tabelas de contingencia para zona 1 e 2 . . . . . . . . . . . . . . . . . 160
B.2 Tabelas de contingencia para zona 3 e 4 . . . . . . . . . . . . . . . . . 161
B.3 Estimadores dos parametros dos modelos de quasi-associacao ajusta-
dos as tabelas de contingencia e respectivos desvios residuais das 40
estacoes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
B.4 Valores para yi e V (yi) . . . . . . . . . . . . . . . . . . . . . . . . . . 163
1. INTRODUCAO
As combinacoes de nıveis dos factores que intervem num modelo correspondem aos
tratamentos. Uma famılia de modelos e estruturada quando os respectivos modelos
correspondem aos tratamentos doutro modelo. Diz-se que este ultimo e o modelo
base para o destingir dos modelos constituintes da famılia estruturada, modelos esses
designados de modelos elementares.
No que diz respeito a teoria desenvolvida nesta dissertacao ira considerar-se o
caso em que:
1. O modelo base e de efeitos fixos com cruzamento-encaixe completo e equili-
brado de 2 ou mais factores e esta associado a uma algebra de Jordan comu-
tativa A, e
2. Os modelos elementares podem corresponder a regressoes lineares nas mesmas
variaveis ou a modelos log-lineares ajustados a tabelas de contingencia.
As famılias estruturadas de modelos correspondem a uma formalizacao dos modelos
regressionais multiplos introduzidos em Mexia (1987). Desde entao, alguns desen-
volvimentos particulares e aplicacoes tem sido efectuados, nomeadamente na tese de
Moreira (2004) onde foram contempladas as situacoes de multicolinariedade e hete-
rocedasticidade dos modelos de regressao multipla para um modelo base de efeitos
fixos com 1 factor e correspondente aplicacao a remocao electrodialıtica de metais
pesados. Nas teses de Saraiva (1996), Cruz (2001) e Ferreira (1996) com a aplicacao
2 1. Introducao
dos delineamentos regressionais multiplos quando o delineamento base e de quadra-
dos latinos, blocos casualizados e planos completos, respectivamente. Tambem foi
extendida a teoria delineamentos regressionais ao caso em que o modelo base e um
plano factorial de base 2 em Domingues (1997) e factorial de base prima em Oliveira
(2005).
No tratamento de famılias estruturadas de modelos tendera a seguir-se uma es-
trategia que agora ira procurar por-se em evidencia. Assim, numa primeira fase,
comecar-se-a por condensar a informacao contida nos vectores de observacoes cor-
respondentes aos modelos elementares nas respectivas estatısticas suficientes e numa
segunda fase aplicar-se-ao os algoritmos desenvolvidos para o modelo base aos re-
sultados obtidos na primeira fase.
Em primeiro lugar, admite-se que os modelos elementares sao indexados por
i = 1, ..., c, tem vectores de observacao yi e vectores de parametros relevantes φi,
com c o numero de tratamentos do modelo base.
Concretize-se para o caso dos modelos regressionais multiplos. Neste caso, φi
sera composto pelo vector dos coeficientes da regressao βi e pela variancia σ2i . Muitas
vezes admite-se a homocedasticidade, i.e., σ2i = σ2, i = 1, ..., c, ou seja a variancia
do erro nao varia de modelo elementar para modelo elementar. Quando se tem
yi ∼ N(Xiβi, σ
2Ini)
onde Xi e a matriz do modelo regressional do tipo ni × k, as estatısticas suficientes
serao
βi =(XTi Xi
)+XTi yi, i = 1, ..., c
e
SQEi = yTi yi − yTi Xiβi, i = 1, ..., c
com A+ a inversa de Moore-Penrose de A. Contudo, o caso que sera analisado e o
3
caso regular, para o qual se admite Xi = X, i = 1, ..., c e supoe-se que X e do tipo
n× (k + 1) com vectores coluna linearmente independentes. Tem-se entao,
βi =(XT X
)−1XTyi ∼ N
(βi, σ
2(XT X)−1)
independente de
SQEi = yTi yi − yTi Xβi ∼ σ2χ2n−k−1.
Os pares(βi, SQEi
), i = 1, ..., c conterao toda a informacao transportada pelos
vectores das observacoes.
Nos modelos regressionais multiplos esta-se interessado em coeficientes individu-
ais da regressao, ou nas suas combinacoes lineares. Sendo a o vector dos coeficientes
duma combinacao linear, faz-se
yi = aT βi
e
SSQE =c∑i=1
SQEi ∼ σ2χ2g′
com g′ = c(n−k−1). Alem disso vem E(yi) = aTβi = µi e V (yi) = σ2aT (XT X)−1a.
Ordenem-se os tratamentos do modelo base mediante os ındices i = i(j) = 1, ..., c.
Seja y o vector cujas componentes sao os valores yi reordenados pelos ındices i. Este
vector sera normal e ira constituir para o modelo base, o vector de observacoes para
o qual vem
E(yi) = µ
com µ o vector cujas componentes sao as combinacoes lineares µi, com ındices
i = 1, ..., c, dos βi. Aplicando o algoritmo correspondente ao modelo base a y pode-
se estudar a influencia dos factores do modelo base nos valores das combinacoes
lineares dos coeficientes das regressoes.
4 1. Introducao
No que diz respeito a estrutura da dissertacao que segue, comeca-se por apresen-
tar resultados preliminares de forma a ter-se uma dissertacao auto-suficiente. Estes
resultados serao de natureza algebrica e de natureza estatıstica. Os resultados de
natureza algebrica referir-se-ao principalmente as algebras de Jordan comutativas e
operacoes binarias sobre algebras de Jordan. Estas algebras sao espacos vectoriais
constituıdos por matrizes simetricas que comutam e que contem os quadrados das
respectivas matrizes simetricas. As mesmas sao utilizadas para estudar modelos
normais ortogonais [5], [7] e [2].
Os resultados mais importantes de natureza estatıstica referir-se-ao a estatısticas
suficientes e completas, estimadores UMVUE, testes de hipoteses, vectores normais
e ao tratamento das regressoes lineares e modelos log-lineares.
Segue-se o tratamento de modelos ortogonais associados a algebras de Jordan
comutativas, comecando pelo caso usual
y =w∑j=1
Xjαj + e
com os αj, j = 1, ...,m vectores fixos, os αj, j = m + 1, ..., w e e vectores normais
independentes com valores medios nulos e matrizes de covariancia σ2j Icj , j = m +
1, ..., w e σ2In respectivamente. Como adiante sera visto, admitida a normalidade do
modelo, consegue-se obter estatısticas suficientes e completas que permitem obter
estimadores UMVUE podendo-se, em seguida, estudar-se a inferencia para os para
modelos de efeitos fixos. No seguimento constroem-se os modelos para o cruzamento-
encaixe de factores.
Com vista a conjugar a teoria dos modelos regressionais multiplos com os mo-
delos ortogonais associados a algebras de Jordan comutativas, deparou-se com a
necessidade de desenvolver outro tipo de modelos, designados de L-ortogonais, os
quais ja saem um pouco fora da ortogonalidade. Estes modelos permitem o estudo
5
do caso nao equilibrado, relativo aos modelos regressionais multiplos, com modelo
base de efeitos fixos, caso esse em que as matrizes Xj poderao nao ser iguais para
todos os tratamentos.
Para por em evidencia a versatilidade e potencia das tecnicas desenvolvidas
apresentam-se aplicacoes a duas situacoes bem distintas:
• Analise de transicoes entre classes de seca na hidrologia, e
• Experiencias de remocao electrodialıtica de metais pesados na remediacao am-
biental.
Na primeira e segunda aplicacoes os modelos elementares sao log-lineares e na ter-
ceira sao regressoes polinomiais.
6 1. Introducao
2. DEFINICOES E RESULTADOS PRELIMINARES
2.1 Matrizes Ortogonais Estandardizadas, Diagonalizadoras
Ortogonais e Matrizes Uniformizadoras
Dado um numero inteiro s considerem-se as matrizes ortogonais
Ps =
1√s1sT
...
Ts
em que Ts e uma sub-matriz de Ps constituıda pelas linhas de Ps menos a primeira.
As linhas de Ts sao vectores de contrastes mutuamente ortogonais de norma um.
Vectores de contrastes sao vectores cujas componentes sao os coeficientes duma
combinacao linear sendo a soma das componentes desse vector nula. As matrizes Ps
assim definidas sao chamadas ortogonais estandardizadas. Estas matrizes sao
muito utilizadas para analisar a accao de factores com nıveis quantitativos [18].
Sendo A uma matriz simetrica de ordem k, existem matrizes ortogonais P de
ordem k tais que
PAPT = D(r1, r2, ..., rk)
com D(r1, r2, ..., rk) uma matriz diagonal, cujos elementos da primeira diagonal (ele-
mentos principais) r1, r2, ..., rk sao os valores proprios da matriz A. Enquanto P e
a matriz diagonalizadora ortogonal de A, os seus vectores linha x1,x2, ...,xk
8 2. Definicoes e Resultados Preliminares
serao vectores proprios ortonormados de A associados aos valores proprios com o
mesmo ındice [35].
Se A for definida positiva ter-se-a rj > 0, j = 1, ..., k, estando definida a matriz
G0 = D(r−1/21 , r
−1/22 , ..., r
−1/2k )P
que e solucao da equacao matricial
MAMT = Ik.
As solucoes desta equacao serao as matrizes uniformizadoras de A, representando-
se a respectiva familia por U(A). Em particular G0 sera a uniformizadora directa
de A.
Mostra-se que, ver [14],
• G ∈ U(A)⇐⇒ A−1 = GTG
• se G ∈ U(A) com M regular tem-se GM−1 ∈ U(MAMT );
• se G ∈ U(A), G′ ∈ U(A) se e so se G′G−1 for uma matriz ortogonal.
Assim, G ∈ U(A) se e so se G = PG0, com P ortogonal.
Tendo as matrizes simetricas que comutam especial interesse nesta dissertacao,
apresenta-se o seguinte resultado
Proposicao 2.1.1. Sejam A1, ...,Am matrizes k × k simetricas. Entao existe uma
matriz ortogonal P tal que para cada i, PTAiP = Di e uma matriz diagonal cu-
jos elementos principais sao os valores proprios de Ai se e so se AiAj = AjAi
para todos os pares (i, j), i, j = 1, ...,m, isto e, se e so se as matrizes A1, ...,Am
comutarem.
Demonstracao. Ver [35].
2.2. Sub-Espacos e Algegras 9
2.2 Sub-Espacos e Algegras
Sendo V um sub-espaco vectorial proprio do espacoW ⊆ Rn, o conjunto dos vectores
de W ortogonais a todos os vectores de V constituem um sub-espaco denominado
complemento ortogonal de V relativamente a W . Sendo V⊥/W o complemento
ortogonal de V relativamente a W , todo o vector de W sera a soma dum vector de
V com um vector de V⊥/W , sendo W a soma directa ortogonal de V com V⊥/W ,
visto essa decomposicao ser unica. QuandoW = Rk por-se-a V⊥/W = V⊥, tendo-se
(V⊥)⊥ = V .
Recorde-se que um sub-espaco W ⊆ Rn e a soma directa dos sub-espacos V1
e V2 se todo o vector v ∈ W tiver uma decomposicao unica v = v1 + v2 com
vj ∈ Vj, j = 1, 2. Se todo o vector de V1 for ortogonal a todo o vector de V2, entao
V1 e V2 serao sub-espacos ortogonais cuja soma directa ortogonal sera W . vj sera a
projeccao ortogonal de v sobre Vj, j = 1, 2.
Segundo Seber(1980), dada a matriz A do tipo n×k, o seu sub-espaco imagem
sera
R(A) = v : v = Au
enquanto que o seu sub-espaco nulidade sera
N(A) = u : Au = 0
tendo-se
R(AT ) = N(A)⊥.
Recorde-se agora tambem a definicao de algebra. Uma algebra A e um espaco
linear equipado com uma operacao binaria ∗, usualmente chamada de produto, para
o qual as propriedades seguintes se verificam para todos os α ∈ R e a,b, c ∈ A:
• a ∗ (b + c) = a ∗ b + a ∗ c;
10 2. Definicoes e Resultados Preliminares
• (a + b) ∗ c = a ∗ c + b ∗ c;
• α(a ∗ b) = (αa) ∗ b = a ∗ (αb).
Alem do mais, uma algebra A e associativa se e so se, para todos os a,b, c ∈ A,
(a ∗ b) ∗ c = a ∗ (b ∗ c)
e e comutativa se e so se, para todos os a,b ∈ A,
a ∗ b = b ∗ a.
Sublinhe-se que as propriedades associativa e comutativa nao sao necessarias para
que um espaco linear seja uma algebra.
2.3 Matrizes Inversas Generalizadas de Moore-Penrose
Qualquer que seja a matriz A existe uma e uma so matriz A+ tal que, ver [30],
1)AA+A = A
2)A+AA+= A+
3)(AA+
)T= AA+
4)(A+A
)T= A+A
.
A matriz A+ denomina-se a inversa de Moore-Penrose de A. Se A for regular
A+=A−1. Por outro lado, sendo A simetrica k × k com Car(A) = l < k, pode-se
sempre ordenar os vectores linha de uma matriz P diagonalizadora ortogonal de A
de forma a ter-se
PAPT = D(r1, r2, ..., rl, 0, ..., 0)
com r1, r2, ..., rl os valores proprios nao nulos de A, tendo-se
A = PTD(r1, r2, ..., rl, 0, ..., 0)P
2.4. Matrizes de Projeccao Ortogonal 11
e
A+ = PTD(r−11 , ..., r−1
l , 0, ..., 0)P.
2.4 Matrizes de Projeccao Ortogonal
DadoW um espaco vectorial soma directa ortogonal dos sub-espacos V1 e V2, definiu-
se atras a projeccao ortogonal vVj de v ∈ W sobre Vj, j = 1, 2. Ter-se-a ainda
vVj = Q(Vj)v, j = 1, 2
com Q(Vj) a matriz de projeccao ortogonal sobre Vj, j = 1, 2. Verifica-se
facilmente que
Q(V⊥) = In −Q(V)
vindo
vV⊥ = v − vV = (I−Q(V))v.
Recorde-se ainda que Q e matriz de projeccao ortogonal se e so se for
idempotente e simetrica.
De seguida irao ser recordados alguns resultados bem conhecidos sobre matrizes
de projeccao ortogonal [14].
Proposicao 2.4.1. Dada a matriz X do tipo n× k e tomando-se
Ω = R(X)
ℵ = R(XT )
as matrizes de projeccao ortogonal sobre Ω e ℵ serao
Q(Ω) = X(XTX)+XT
Q(ℵ) = (XTX)+(XTX).
12 2. Definicoes e Resultados Preliminares
Proposicao 2.4.2. Para v ∈ Ω tem-seQ(Ω)v = v
Q(Ω⊥)v = 0.
Proposicao 2.4.3. Dado um vector v, o vector u ∈ Ω que minimiza ‖v − u‖2 e
vΩ.
Proposicao 2.4.4. Fazendo v = (XTX)+XTz com z um vector arbitrario tem-se
zΩ = Xv, ou seja zΩ ∈ R(X).
2.5 Produto de Kronecker entre Matrizes
Dadas as matrizes A = [ai,j] do tipo m×n e B do tipo p× q, o respectivo produto
de Kronecker e dado pela matriz por blocos de ordem mp× nq
A⊗B =
a11B a12B · · · a1nB
a21B a22B · · · a2nB
· · · · · · · · · · · ·
am1B am2B · · · amnB
. (2.1)
Verifica-se facilmente que, estando definidos os produtos usuais A1A2 e B1B2,
se tem
(A1 ⊗B1)(A2 ⊗B2) = (A1A2)⊗ (B1B2) (2.2)
(A⊗B)T = AT ⊗BT .
Certas classes de matrizes sao “fechadas” para o produto⊗, assim, com Js = 1s1s
2.5. Produto de Kronecker entre Matrizes 13
tem-se
1u ⊗ 1v = 1uv
Iu ⊗ Iv = Iuv
Ju ⊗ Jv = Juv
vendo-se ainda que o produto ⊗ de matrizes ortogonais, ortogonais estandardizadas,
simetricas, idempotentes da respectivamente matrizes ortogonais, ortogonais estan-
dardizadas, simetricas, idempotentes. Daqui resulta que o produto ⊗ de matrizes
de projeccao ortogonal da matrizes de projeccao ortogonal.
Sendo D(γ1) e D(γ2) matrizes diagonais cujos elementos principais sao as com-
ponentes do vectores γ1 e γ2 respectivamente, tem-se
D(γ1)⊗D(γ2) = D(γ1 ⊗ γ2). (2.3)
Dadas as matrizes simetricas M1 e M2, existem matrizes ortogonais P1 e P2 e
matrizes diagonais D(γ1) e D(γ2) tais que
PjMjPTj = D(γj), j = 1, 2.
Os elementos principais de D(γj), j = 1, 2 sao os valores proprios de Mj correspondendo-
lhes, como vectores proprios, os vectores linha de Pj, j = 1, 2 (seccao 2.1). Ter-se-a
entao, atendendo a (2.2) e a (2.3):
(P1 ⊗P2) (M1 ⊗M2) (P1 ⊗P2)T =(P1M1P
T1
)⊗(P2M2P
T2
)= D (γ1 ⊗ γ2)
(2.4)
pelo que os valores proprios de M1 ⊗M2 serao os produtos dos valores proprios
de M1 e M2 e os vectores proprios sao os vectores linha de P1 ⊗ P2. Como a
caracterıstica de uma matriz simetrica e o numero dos seus valores proprios nao
nulos, ve-se que
Car(M1 ⊗M2) = Car(M1)Car(M2). (2.5)
14 2. Definicoes e Resultados Preliminares
Sendo o determinante de Mj, j = 1, 2 o produto dos seus valores proprios, o mesmo
acontecendo para o determinante de M1 ⊗M2, ter-se-a
Det (M1 ⊗M2) = Det (M1)Det (M2) . (2.6)
Por outro lado, ver [38], para qualquer matriz Vj tem-se
Car(Vj) = Car(VjVTj ), j = 1, 2
e como
(V1 ⊗V2) (V1 ⊗V2)T =(V1V
T1
)⊗(V2V
T2
)ter-se-a
Car (V1 ⊗V2) =2∏j=1
Car(VjV
Tj
)=
2∏j=1
Car (Vj). (2.7)
E ainda facil de verificar que, ver [38],(m∑i=1
aiVi
)⊗
(n∑j=1
bjUj
)=
m∑i=1
n∑j=1
aibj(Vi ⊗Uj) (2.8)
e utilizando (2.2), tem-se
(V1 ⊗V2)+ = V+1 ⊗V+
2 . (2.9)
Em particular se V1 e V2 forem regulares tem-se tambem
(V1 ⊗V2)−1 = V−11 ⊗V−1
2 . (2.10)
2.6 Vector Medio, Matriz de Covariancia e Matriz de Covariancia
Cruzada
Um vector aleatorio sera um vector cujas componentes sao variaveis aleatorias en-
quanto que uma matriz aleatoria sera uma matriz cujos elementos sao variaveis
aleatorias.
2.6. Vector Medio, Matriz de Covariancia e Matriz de Covariancia Cruzada 15
Dado um vector aleatorio
X =
X1
...
Xn
o vector medio de X tera como componentes os valores medios das componentes
de X, assim
E (X) =
E (X1)...
E (Xn)
quando estes valores medios estao definidos. Analogamente os elementos da matriz
media de uma matriz aleatoria serao os valores medios, supostos definidos, dos
elementos da matriz aleatoria. Em particular a matriz da covariancia do vector
aleatorio X sera
COV (X) = E[(X− E (X)) (X− E (X))T
]=
V (X1) . . . COV (X1, Xn)...
. . ....
COV (Xn, X1) · · · V (Xn)
supondo-se as variancias V (Xj), j = 1, ..., n e as covariancias COV (Xj, Xi), j, i =
1, ...n, j 6= i todas definidas. Uma matriz de covariancia e sempre simetrica.
Dado o par (X; Y) de vectores aleatorios de ordem n e m respectivamente, a
respectiva matriz de covariancia cruzada sera
COV (X; Y) = E[(X− E (X)) (Y− E (Y))T
]=
COV (X1, Y1) . . . COV (X1, Ym)...
. . ....
COV (Xn, Y1) · · · COV (Xn, Ym)
.supondo-se, mais uma vez, definidas as COV (Xj, Yi), j = 1, ...n, i = 1, ...,m. Se os
vectores X e Y forem independentes tem-se COV (X; Y) = On,m (matriz nula do
tipo n×m).
16 2. Definicoes e Resultados Preliminares
Utilizando a linearidade do operador E mostra-se facilmente que
• E (AX + a) = AE(X) + a
• COV (AX + a) = ACOV(X)AT
• COV (AX + a; BX + b) = ACOV(X)BT
• COV (AX + a; BY + b) = ACOV (X; Y) BT
onde A e B sao matrizes do tipo r×n e s×m, respectivamente e a e b vectores de
ordem r e s respectivamente. Alem disso, como
X + Y = [I : I]
X
Y
e COV(X,Y) e a matriz nula quando X e Y sao independentes, pode-se mostrar
entao que
COV (X + Y) = COV(X) + COV (Y) .
2.7 Estatısticas Suficientes, Completas e Estimadores UMVUE
Represente-se por En o espaco amostral constituıdo por todas as amostras possıveis
de dimensao n. Seja x uma amostra de dimensao n que sera vista como uma
realizacao vector aleatorio X, tendo-se Pr(X ∈ En) = 1. As probabilidade associadas
a X podem ser determinadas pela respectiva distribuicao F (x|θ) = Pr(X ≤ x|θ),
com θ um parametro a variar no espaco parametrico Ω. A funcao densidade de
X, caso exista, representa-se por f(x,θ), no caso discreto f(x,θ) sera a funcao de
probabilidade.
2.7. Estatısticas Suficientes, Completas e Estimadores UMVUE 17
Dada uma particao de En em conjuntos Ci, disjuntos dois a dois, atendendo ao
teorema da probabilidade total, tem-se
F (x|θ) =∑i
Pr(X ∈ Ci|θ) Pr(X 6 x|X ∈ Ci,θ) =∑i
Pr(X ∈ Ci|θ)F (x|Ci,θ)
(2.11)
com
F (x|Ci,θ) = Pr(X 6 x|X ∈ Ci, θ).
Uma particao diz-se suficiente quando as distribuicoes condicionais nao dependem
de θ, tendo-se
F (x|θ) =∑i
Pr(X ∈ Ci|θ)F (x|Ci). (2.12)
Uma estatıstica T(x) sera uma qualquer funcao escalar ou vectorial definida
no espaco amostral. As imagens inversas dadas por T(x) constituem uma particao
de En. Se a particao induzida por uma estatıstica for suficiente, entao a estatıstica
sera suficiente. Por outras palavras, T(x) ser suficiente significa que T(x) contem
toda a informacao acerca de θ que esta contida na amostra, podendo proporcionar
uma reducao de dados sem perda de informacao.
Um importante criterio de suficiencia e dado pela
Proposicao 2.7.1. Teorema da Factorizacao
A estatıstica T(x) e suficiente se e so se existirem funcoes nao negativas g e h tal
que
f(x|θ) = g (T(x)|θ)h(x)
onde h(x) nao depende de θ.
A seguir apresenta-se a demonstracao para o caso discreto, no entanto a tese
tambem e valida para o caso contınuo [13].
18 2. Definicoes e Resultados Preliminares
Demonstracao. Admita-se que se verifica a factorizacao. Quando T(x) = t, ter-se-a
Pr(T(x) = t|θ) =∑
x∈T−1(t)
f(x|θ) =∑
x∈T−1(t)
g(T(x)|θ)h(x) = g(t|θ)∑
x∈T−1(t)
h(x)
vindo para x ∈ T−1(t)
Pr(X = x|T = t,θ) =Pr [(X = x) ∩ (T = t)|θ]
Pr(T = t|θ)=
Pr(X = x|θ)
Pr(T = t|θ)
=g(t|θ)h(x)
g(t|θ)∑
x′∈T−1(t′)
h(x′)=
h(x)∑x′∈T−1(t′)
h(x′)
o que mostra que as distribuicoes condicionais nao dependem de θ, pelo que a
estatıstica sera suficiente.
Inversamente, por um lado igualmente se tem
Pr(X = x|T = t,θ) =Pr(X = x|θ)
Pr(T = t|θ)=
f(x|θ)
Pr(T = t|θ)
e por outro
Pr(X = x|T = t,θ) = h(x)
onde h(x) nao depende de θ por T(x) ser suficiente. Basta pois fazer g(t|θ) =
Pr(T = t|θ) para concluir que se tem a factorizacao.
Por outro lado, se para uma qualquer funcao g de T se tiver
E (g(T)|θ) = 0, ∀θ ∈ Ω =⇒ Pr (g(T) = 0|θ) = 1, ∀θ ∈ Ω,
T(x) sera uma estatıstica completa. Tem-se ainda
Proposicao 2.7.2. Se X tem distribuicao pertencente a familia exponencial de
dimensao s ou seja se
f(x|θ) = b(θ)h(x) exp
(s∑i=1
li(θ)Ti(x)
)
2.7. Estatısticas Suficientes, Completas e Estimadores UMVUE 19
onde b e li sao funcoes do parametro θ e Ti sao estatısticas e alem disso se um pro-
duto cartesiano de intervalos nao degenerados estiver contido no espaco parametrico
Ω, a estatıstica T(x) = [T1(x)...Ts(x)] sera suficiente e completa.
Demonstracao. Ver [13], [12] e [38].
Um estimador dum parametro sera uma estatıstica cujos valores sao “apro-
ximacoes” aos verdadeiros valores do parametro. Entre as propriedades convenien-
tes que um estimador pode ter esta ser UMVUE (estimador centrado de variancia
uniformemente mınima). Diz-se que g(X) e UMVUE de g(θ) se for centrado, i.e.
E(g(X)) = g(θ)
e se para todo θ se tem
V (g(X)|θ) ≤ V (g(X)|θ)
onde g(X) e qualquer outro estimador centrado de g(θ).
Como se ira ver, as estatısticas suficientes e completas sao uteis para se obter
UMVUE’s. Com efeito tem-se o
Proposicao 2.7.3. Teorema de Rao-Blackwell
Seja g uma funcao convexa e g um estimador centrado de g(θ). Dada a estatıstica
suficiente T(x)
• g(t) = E(g(X)|T(x) = t) e funcao da estatıstica suficiente T(x) = t mas nao
e funcao de θ;
• g(T(x)) e um estimador centrado de g(θ);
• V (g|θ) ≤ V (g|θ) para todo o θ.
Demonstracao. Ver [12].
20 2. Definicoes e Resultados Preliminares
e o
Proposicao 2.7.4. Teorema de Blackwell-Lehmann-Scheffe
Se T for uma estatıstica suficiente e completa e existir um estimador centrado g
para g(θ), g(t) = E(g(X)|T(x) = t) sera estimador UMVUE de g(θ).
Demonstracao. Atendendo ao teorema de Rao-Blackwell, sabe-se que g e estimador
centrado de g e a variancia deste nunca excede a variancia de g. Supondo agora
que existia um outro estimador centrado g para g, devido mais uma vez ao teorema
Rao-Blackwell, sabe-se que ˇg(t) = E(g(X)|T = t) e funcao de t mas nao de g(θ),
sendo estimador centrado de g e V (ˇg|θ) ≤ V (g|θ).
Como T e estatıstica suficiente e completa e g(t) se g(t) sao funcoes de t com o
mesmo valor medio, qualquer que seja θ, ter-se-a Pr(g(T) = g(T)|θ) = 1, qualquer
que seja θ, o que estabelece a tese.
2.8 Testes de Hipoteses
Atraves de um teste de hipoteses, pretende-se, de um modo geral, tomar uma decisao
ou fazer uma escolha de entre duas hipoteses alternativas, baseada na informacao
conhecida. Nesta seccao apenas serao abordados os testes de hipoteses parametricos,
para os quais a decisao e feita relativamente a um parametro desconhecido θ per-
tencente a um conjunto conhecido Θ em que
θ ∈ Θ0 ∨ θ ∈ Θ1, com Θ0,Θ1 ⊂ Θ e Θ0 ∩Θ1 = ∅.
Portanto, a escolha sera feita de entre a hipotese
H0 : θ ∈ Θ0
designada de hipotese nula a outra hipotese possıvel
H1 : θ ∈ Θ1
2.8. Testes de Hipoteses 21
designada de hipotese alternativa.
Considere-se uma amostra X = [X1, ..., Xn]T de variaveis aleatorias independen-
tes e identicamente distribuıdas, pertencentes a uma classe de densidades
F = fθ(.) : θ ∈ Θ.
Os testes de hipoteses sao regras criadas para tomar uma decisao e aos quais estao
associados um risco e uma perda.
Defina-se φ(x) a regra de decisao, que tomara o valor 0 se a H0 for aceite e o
valor 1 se esta for rejeitada em favor de H1.
Em qualquer processo de decisao existem associados erros. Nos testes de hipoteses
em que existe hipotese nula e alternativa existem 2 tipos de erro:
1. Erro tipo I: Probabilidade de rejeitar H0 quando H0 e verdadeira;
2. Erro tipo II: Probabilidade de aceitar H0 quando H1 e verdadeira.
Associado a um teste de hipoteses existe tambem uma regiao de aceitacao
R0 = x : φ(x) = 0
e uma regiao crıtica
R1 = x : φ(x) = 1.
O tamanho dum teste e dado pelo
supθ∈Θ
Pr(X ∈ R1)
o qual representa, de facto, o valor maximo que o erro tipo I pode assumir. Nos
testes de hipoteses a ser utilizados tem-se
supθ∈Θ
Pr(X ∈ R1) ≤ q
22 2. Definicoes e Resultados Preliminares
onde q representa o nıvel de significancia escolhido para um teste, que usualmente
pode assumir os valores 0.1, 0.05 e 0.01. Ao inverso, pode ser obtido o mais pequeno
nıvel de significancia abaixo do qual a hipotese nula seria rejeitada. A esse valor
chama-se “p-value”.
A potencia dum teste para algum θ ∈ Θ1 e dada por
Pot = Pr(X ∈ R1)
e a funcao potencia de um teste φ por
Potφ(θ) = Pr(X ∈ R1),θ ∈ Θ.
A funcao potencia dum teste da, em funcao do parametro, a probabilidade de
se rejeitar a hipotese nula, ou por outras palavras descreve a eficiencia dum teste a
detectar o afastamento dos dados da hipotese nula.
Nesse sentido, pretende-se pois maximizar a funcao potencia. Para tal, tomando
φ(x) =
0, x ∈ R0
1, x ∈ R2
ha que maximizar
Potφ(θ) = E(φ(x)), ∀θ ∈ Θ1
sujeito a condicao
E(φ(x)) ≤ q,∀θ ∈ Θ0.
Quando Θ0 e Θ1 tem apenas um elemento, a solucao e dada pela
Proposicao 2.8.1. (Lema Fundamental de Neyman-Pearson). Seja Θ0 = θ0 e
Θ1 = θ1, entao existe uma constante c tal que
1. φ(x) =
0,
fθ1(x)
fθ0(x)< c
1,fθ1(x)
fθ0(x)> c
;
2.9. Vectores Normais e Testes F 23
2. θ = θ0 ⇒ E(φ(X)) = q;
e φ e o mais potente teste para H0 : θ = θ0 vs. H1 : θ = θ1 ao nıvel de significancia
q. Alem disso, se φ∗ for um teste mais potente entao se satisfaz 1. tambem satisfaz
2. com probabilidade 1.
Demonstracao. Ver [13].
Nos testes de hipoteses e impossıvel escolher a melhor regra de decisao. A solucao
para este problema podera ser restringir a classe de regras de decisao de modo que
estas retenham propriedades desejaveis. Uma dessas propriedades e serem testes
nao distorcidos.
Um teste φ tal que Potφ(θ) ≤ q,∀θ ∈ Θ0
Potφ(θ) ≥ q,∀θ ∈ Θ1
diz-se nao distorcido, isto e, a potencia do teste para θ ∈ Θ1 e sempre maior que
o erro tipo I. Quando Potφ(θ0) = q, a probabilidade de rejeitar H0 quando H1 e
verdadeira e maior que a probabilidade de rejeitar H0 quando H0 e verdadeira.
2.9 Vectores Normais e Testes F
Dado Y um vector aleatorio de ordem n a respectiva funcao geradora de momentos
sera
ϕY(u) = E(eu
TY)
sendo facil de se verificar que
ϕAY+b(v) = ebTvϕY(ATv).
24 2. Definicoes e Resultados Preliminares
Sendo E(Y) = µ
COV(Y) = M
se a funcao geradora de momentos de Y for
ϕY(u) = eµTu+ 12uTMu (2.13)
o vector aleatorio Y, ver [14], sera normal escrevendo-se
Y ∼ N(µ,M).
Utilizando a expressao (2.13) e facil de mostrar que
AY + a ∼ N(Aµ+ a,AMAT ).
Dado agora Y ∼ N(µ, σ2In), ‖Y‖2 sera, ver [14], o produto por σ2 dum qui-
quadrado com n graus de liberdade e parametro de nao centralidade
δ =1
σ2‖µ‖2
escrevendo-se
‖Y‖2 ∼ σ2χ2n,δ.
Seja agora S ∼ σ2χ2m independente de Y
F =‖Y‖2/nS/m
tera, ver [14], distribuicao F com n e m graus de liberdade e parametro de nao
centralidade δ, escrevendo-se
F ∼ Fn,m,δ.
Em particular se µ = 0, δ = 0, vindo
‖Y‖2 ∼ σ2χ2n
2.9. Vectores Normais e Testes F 25
e portanto F tera distribuicao F central, escrevendo-se
F ∼ Fn,m.
Mais geralmente, ver [14], se Y ∼ N(µ, σ2M) com Car(M) = l ≤ n tem-se
(Y − b)TM+(Y − b) ∼ σ2χ2l,δ
com
δ =(µ− b)TM+(µ− b)
σ2
e b um vector qualquer, e se SQ ∼ σ2χ2m for independente de Y, ter-se-a que
F =m
l
(Y − b)TM+(Y − b)
SQ∼ Fl,m,δ.
F sera a estatıstica de um teste de hipoteses F com l e m graus de liberdade para
testar a hipotese
H0 : µ = b.
Em particular se b = µ ou seja se H0 se verificar, δ = 0, vindo
(Y − µ)TM+(Y − µ) ∼ σ2χ2l
logo
F ′ = m
l
(Y − µ)TM+(Y − µ)
SQ∼ Fl,m
ou seja F ′ tem distribuicao F central com l e m graus de liberdade.
Sendo F1−q,l,m o quantil para a probabilidade 1− q de Fl,m tem-se
Pr [F ′ ≤ F1−q,l,m] = 1− q
ou seja, como δ = 0 tem, neste caso, Pot = Pr [F ′ > F1−q,l,m,] = q donde o teste
sera nao distorcido. Como consequencia, as desigualdades
(µ−Y)TM+(µ−Y) ≤ lF1−q,l,mSQ
m
26 2. Definicoes e Resultados Preliminares
definem elipsoides de confianca nıvel 1− q para µ, isto e, a probabilidade de µ estar
coberto pelo elipsoide anterior e 1 − q, donde o teste F de nıvel q nao rejeita a H0
se e so se b pertencer ao elipsoide de confianca nıvel 1 − q atras definido. Diz-se,
neste caso, que o teste goza de dualidade [15] e [17].
Quando M e definida positiva, M+ = M−1 tambem e definida positiva, vindo
δ =(µ− b)TM−1(µ− b)
σ2,
podendo reescrever-se a hipotese nula como H0 : δ = 0, uma vez que
µ = b⇐⇒ δ = 0.
Neste caso, o teste e estritamente nao distorcido [14].
2.10 Modelos de Regressao Multipla
2.10.1 Introducao
Quando se tem uma variavel resposta y que depende de k variaveis independentes
ou variaveis controladas x1, x2, ..., xk, a relacao entre estas variaveis e caracterizada
por um modelo matematico, chamado modelo regressional.
O modelo regressional pode ser linear
y = α0 + α1x1 + α2x2 + ...+ αkxk + ε (2.14)
ou nao linear, como por exemplo exponencial, logarıtmico, etc. A equacao (2.14)
representa um modelo regressional multiplo linear, dado que se trata duma funcao
linear nos parametros ou coeficientes desconhecidos da regressao α1, α2, ..., αk.
No modelo regressional multiplo, cada αj, j = 1, ..., k representa a variacao es-
perada na variavel resposta y por unidade de variacao de xj, quando as restantes
2.10. Modelos de Regressao Multipla 27
variaveis controladas xi, i 6= j sao mantidas constantes e ε representa a variavel
aleatoria erro do modelo, para o qual usualmente se assume ε ∼ N(0, σ2).
Considere-se o caso mais geral, para o qual se dispoe de n > (k+ 1) observacoes
y1, y2, ..., yn para a variavel resposta y. A cada observacao yi corresponde um valor
xij, para a j-esima variavel controlada, j = 0, ..., k, i = 1, ..., n. O modelo regressio-
nal multi-linear pode ser entao escrito em termos de valores observados tomando-se
yi =k∑j=0
αjxij + εi, i = 1, 2, ..., n; j = 0, ..., k (2.15)
onde os ε1, ..., εn sao os erros aleatorios nao correlacionados entre si. A equacao
(2.15) pode ser escrita na forma matricial
y = Xα+ ε (2.16)
onde
y =
y1
...
yn
representa o vector das observacoes,
α =
α0
...
αk
e o vector dos coeficientes da regressao,
ε =
ε1...
εn
28 2. Definicoes e Resultados Preliminares
o vector dos erros aleatorios e
X =
1 x11 · · · x1k
1 x21 . . . x2k
......
1 xn1 · · · xnk
e a matriz do modelo do tipo n× (k + 1), isto e, a matriz dos valores das variaveis
controladas, havendo nesta matriz uma coluna por variavel controlada.
As variaveis controladas poderao estar relacionadas entre si como ,por exemplo,
numa regressao polinomial, onde estas sao potencias duma mesma variavel base.
Caso exista dependencia linear entre as variaveis controladas esta-se perante uma
situacao de multicolinariedade, em que Car(X) e inferior ao numero de variaveis
controladas. Considerando a situacao mais geral admitir-se-a que p = Car(X) ≤
k + 1.
Como ja foi referido, e usual admitir-se que os erros aleatorios εi, i = 1, ..., n tem
valor medio nulo e variancia σ2, sendo tambem independentes entre si, donde
COV(ε) = σ2In.
Contudo, dado que, na pratica, existem situacoes de correlacao entre os erros, mais
uma vez considerar-se-a o caso geral em que
COV(ε) = σ2C
onde C uma matriz conhecida e regular.
O modelo (2.15) representa um caso particular deste modelo.
Para o modelo em questao ter-se-a, portanto, y normal comE(y) = Xα = µ
COV(y) = σ2C.
2.10. Modelos de Regressao Multipla 29
Perante a ausencia de homocedasticidade no modelo, ou seja de igualdade e
independencia de variancias entre as variaveis aleatorias, ha que realizar uma trans-
formacao em y, chamada reducao da heterocedasticidade, de forma a obter-se a
homocedasticidade.
Com G ∈ U(C), tome-se y′ = Gy
X′ = GX(2.17)
atendendo aos resultados sobre matrizes uniformizadoras, ver [14], obtem-seE(y′) = X′α
COV(y′) = GTCOV(y)G = σ2GTCG = σ2In
passando a ter-se o modelo homocedastico
y′ = X′α+ ε′. (2.18)
2.10.2 Estimacao dos Coeficientes da Regressao
O metodo dos mınimos quadrados e o metodo mais usualmente utilizado para a
estimacao dos coeficientes da regressao. Este metodo consiste na obtencao de valores
para os coeficientes αj tais que a soma dos quadrados dos resıduos seja minimizada,
ou seja, encontra-se o vector α estimador de α que minimiza
‖y′ −X′α‖2. (2.19)
Para encontrar o vector α, ira ser utilizado um instrumento de algebra matricial
de grande importancia na estatıstica, que e o de matriz de projeccao ortogonal.
Tome-se Ω = R(X′)
ℵ = R(X′T )
30 2. Definicoes e Resultados Preliminares
e recorde-se que as matrizes de projeccao ortogonal sobre ℵ e Ω sao, ver seccao 2.4,Q(Ω) = X′(X′TX′)+X′T
Q(ℵ) = (X′TX′)+(X′TX′)(2.20)
Ora como o vector X′α que minimiza (2.19) e y′Ω = Q(Ω)y′ (proposicao 2.4.3),
atendendo a primeira das expressoes (2.20) vem
X′α = X′(X′TX′)+X′Ty′
donde
α = (X′TX′)+X′Ty′. (2.21)
Como y e normal, α sera tambem normal com
E(α) = (X′TX′)+X′TE(y′) = (X′TX′)+X′TX′α = Q(ℵ)α = αℵ (2.22)
pelo que α nao e necessariamente um estimador centrado de α. Contudo, os vectores
estimaveis vao permitir ultrapassar a limitacao anterior [14].
Um vector λ = Aα diz-se estimavel se existir um estimador linear centrado
λ∗ = By de λ.
Tem-se entao Aα = E(λ∗) = E(By) = BX′α para todo o α, logo A = BX′ e
AT = X′TBT . Donde λ e estimavel se e so se os vectores linha de A pertencerem a
ℵ.
Observe-se agora que, se c ∈ ℵ, tem-se
E(cT α) = cTαℵ = cTQ(ℵ)α =(Q(ℵ)Tc
)Tα = (Q(ℵ)c)T α = cTα
uma vez que as matrizes de projeccao ortogonal sao simetricas e a projeccao orto-
gonal de c sobre ℵ e o proprio vector c pois este encontra-se em ℵ. Portanto cT α
sera um estimador centrado de cTα, sendo que cTα e estimavel.
2.10. Modelos de Regressao Multipla 31
Por fim, pelo conhecido Teorema de Gauss-Markov, ver [14], os estimadores
da forma Aα sao BLUE (Estimadores Lineares Centrados Optimos) de Aα os quais
tem variancia mınima quando comparados com outros estimadores lineares centrados
de Aα [15].
Atendendo as propriedades das inversas generalizadas de Moore-Penrose tem-se
ainda
COV(α) = (X′TX′)+X′TCOV(y′)X′(X′TX′)+ = (X′TX′)+X′T (σ2In)X′(X′TX′)+
= σ2(X′TX′)+X′TX′(X′TX′)+ = σ2(X′TX′)+
(2.23)
portanto, o modelo ajustado tera a forma
y′ = X′α = y′Ω. (2.24)
Uma vez ajustado o modelo e frequentemente necessario estimar σ2, para a qual
se tem o estimador centrado
σ2 =SQE
n− p(2.25)
em que
SQE = ‖y′ − y′‖2= ‖y′ − y′Ω‖
2
representa a soma dos quadrados dos resıduos. Ora recorde-se que
y′ − y′Ω = y′Ω⊥ = (In −Q(Ω))y′ = Q(Ω⊥)y′
(seccao 2.4) pelo que
SQE = ‖y′Ω⊥‖2
=∥∥Q(Ω⊥)y′
∥∥2= y′
TQ(Ω⊥)TQ(Ω⊥)y′
dado Q(Ω⊥) ser idempotente e simetrica, logo
SQE = y′TQ(Ω⊥)y′ = y′
T(In −Q(Ω))y′ = y′
Ty′ − y′
TQ(Ω)y′ = y′
Ty′ − y′
Ty′Ω
32 2. Definicoes e Resultados Preliminares
vindo por fim
SQE = y′Ty′ − y′
TX′α. (2.26)
Um resultado importante e do Teorema de Fisher, ver [14], o qual estabelece
que, quando y e normal, α e independente de SQE e
SQE ∼ σ2χ2n−p.
Um outro resultado referente as matrizes uniformizadoras de C estabelece que
GTG = C−1, ver [14], vindo
X′TX′ = XTGTGX = XTC−1X
X′Ty′ = XTGTGy = XTC−1y
y′TX′ = yTGTGX = yTC−1X
y′Ty′ = yTGTGy = yTC−1y
obtendo-se para (2.21), (2.23) e (2.26) as expressoes
α =(XTC−1X
)+XTC−1y (2.27)
COV(α) = σ2(XTC−1X
)+(2.28)
SQE = yTC−1y − yTC−1Xα (2.29)
donde se conclui que, na realidade, estas expressoes podem ser calculadas sem haver
necessidade de efectuar a transformacao (2.17), bastando para tal inverter a matriz
C.
De referir que, caso se tenha COV(y) = σ2In e nao haja multicolinariedade,
tendo-se Car(X) = k+ 1, XTX e regular, logo (XTX)+ = (XTX)−1 vindo portanto
α = (XTX)−1XTy (2.30)
E(α) = α (2.31)
2.10. Modelos de Regressao Multipla 33
COV(α) = σ2(XTX)−1 (2.32)
SQE = yTy − yTXα (2.33)
σ2 =SQE
n− k − 1. (2.34)
Uma medida estatıstica para o ajustamento do modelo regressional as observacoes
e dada pelo coeficiente de determinacao multipla
R2 = 1− SQE
SQT; 0 6 R2 6 1
em que SQT representa soma dos quadrados dos resıduos para a media, dada por
SQT =n∑i=1
(y′i − y′)2
a qual e ainda dada por
SQT =n∑i=1
y′2i − ny′2 = y′Ty′ − ny′2 (2.35)
com
y′ =
n∑i=1
y′2i
n.
Este coeficiente mede a fraccao da variacao total entre observacoes da variavel de-
pendente que e explicada pela regressao. Para atender ao numero de variaveis
controladas pode substituir-se R2 por
R2adj = 1−
SQE/(n− p)SQT/(n− 1)
(2.36)
de forma a considerar-se menos bom um ajustamento conseguido aumentando muito
o numero de variaveis controladas.
34 2. Definicoes e Resultados Preliminares
2.10.3 Testes de Hipoteses para Modelos de Regressao Multipla
Testam-se hipoteses acerca dos parametros de modelos de regressao multipla com o
objectivo de medir a sua significancia, ou seja a sua utilidade para o modelo.
Como base de partida para construir os testes admite-se que y ∼ N(Xα, σ2C),
passando a ter-se, apos reducao da heterocedasticidade, y′ ∼ N(X′α, σ2In) e ex-
pressoes para α, COV(α) e SQE independentes da uniformizadora de C.
As hipoteses a serem testadas em geral sao da forma
H0 : ψ = ψ0
onde ψ = Aα, com A uma matriz cujos vectores linha pertencem a ℵ e ψ0 um
vector de R(A).
Dado que as componentes de ψ sao estimaveis, ψ = Aα sera um vector normal
com E(ψ) = E(Aα) = Aα = ψ
COV(ψ) = ACOV(α)AT = σ2A(XTC−1X
)+AT
independente de SQE, uma vez que α e independente de SQE, logo Aα tambem
o e.
Com h = Car(A(XTC−1X
)+AT)
, atendendo aos resultados apresentados na
seccao 2.9, tem-se
(ψ −ψ0)T(A(XTC−1X
)+AT)+
(ψ −ψ0) ∼ σ2χ2h,δ (2.37)
onde
δ =(ψ −ψ0)T
(A(XTC−1X
)+AT)+
(ψ −ψ0)
σ2
e como a forma quadratica que figura na expressao (2.37) e independente de SQE ∼
2.10. Modelos de Regressao Multipla 35
σ2χ2n−p por ser funcao de ψ, tem-se
F =n− ph
(ψ −ψ0)T(A(XTC−1X
)+AT)+
(ψ −ψ0)
SQE∼ Fh,n−p,δ
o que permite utilizar F como estatıstica de teste F para testar a hipotese H0 : ψ =
ψ0.
Por outro lado, quando ψ = ψ0, δ = 0, vindo
F0 =n− ph
(ψ −ψ)T(A(XTC−1X
)+AT)+
(ψ −ψ)
SQE∼ Fh,n−p
ou seja F tem distribuicao F central, logo estes testes sao nao distorcidos (seccao
2.9). O teste F de nıvel q nao rejeita H0 se e so se o vector ψ0 pertencer ao elipsoide
de confianca de nıvel 1− q
(ψ −ψ)T(A(XTC−1X
)+AT)+
(ψ −ψ) ≤ hF1−q,h,n−pSQE
(n− p)
onde F1−q,h,n−p e o quantil de probabilidade nıvel 1− q de Fh,n−p. Neste caso diz-se
que o teste F goza de dualidade. Equivalentemente, a hipotese H0 e rejeitada ao
nıvel q se e so se
F > F1−q,h,n−p.
Se se tiver(A(XTC−1X
)AT)+
=(A(XTC−1X
)AT)−1
, pode-se testar directa-
mente a hipotese H0 : δ = 0 e o teste sera estritamente nao distorcido (seccao
2.9).
Em particular, fazendo A = Ik+1 e ψ0 = 0, facilmente se ve que esta a ser
testada a hipotese
H0 : α0 = α1 = ... = αk = 0
contra
36 2. Definicoes e Resultados Preliminares
H1 : αj 6= 0 pelo menos para um j
Testa-se esta hipotese para saber se, de facto, existe uma relacao linear entre a
variavel resposta y e o conjunto de variaveis controladas x1, ..., xk . Rejeitar H0 im-
plica que pelo menos uma das variaveis xj, j = 1, ..., k e significativamente diferente
de zero e logo contribui significativamente para o modelo, estando-se portanto na
presenca de uma relacao linear.
Quando a matriz A e uma matriz linha cT e c ∈ ℵ, vem ψ = cTα e a hipotese
a testar sera
H0 : ψ = ψ0
entao ψ = cT α sera uma variavel aleatoria normal com valor medio ψ e
V (ψ) = σ2cT(XTC−1X
)+cT
logo F0 com as devidas substituicoes tera distribuicao F com 1 e n − p graus de
liberdade, obtendo-se a partir daı os intervalos de confianca para ψ
(ψ − ψ)T(cT(XTC−1X
)+c)+
(ψ − ψ) ≤ F1−q,1,n−pSQE
(n− p)
ou, equivalentemente,[ψ −
√F1−q,1,n−p
(cT (XTC−1X)+ c
) SQEn− p
; ψ +
√F1−q,1,n−p
(cT (XTC−1X)+ c
) SQEn− p
]
ou seja tambem neste caso os testes F gozam de dualidade.
Como particularidade interessante tem-se que a raiz quadrada da estatıstica F
t0 =ψ − ψ0√
cT (XTC−1X)+ cSQEn−p
(2.38)
tem distribuicao t-Student com n−p graus de liberdade, podendo ser utilizada para
construir testes bilaterais, unilaterais direitos e unilaterais esquerdos [14]. Assim,
2.10. Modelos de Regressao Multipla 37
se a unica componente nao nula de c for a j-esima e for igual a 1, tem-se ψ =
αj. Fazendo ψ0 = 0, os resultados anteriores corresponderao agora a intervalos de
confianca para αj e ao teste bilateral para
H0 : αj = 0, j = 0, ..., k
contra
H1 : αj 6= 0, j = 0, ..., k
reduzindo-se neste caso a estatıstica t0 a
t0 =αj√wjj
SQEn−p
onde wjj representa o elemento da linha j e coluna j da matriz W = (XTC−1X)+.
A hipotese H0 sera rejeitada ao nıvel de significancia q se
|t0| > t1−q/2,n−p
em que t1−q/2,n−p representa o quantil de probabilidade de nıvel 1 − q/2 de cada
uma das caudas da distribuicao t-Student. A rejeicao de H0 indica pois que αj e
significativamente diferente de zero e, portanto, a variavel xj deve ser mantida no
modelo. Se pelo contrario H0 nao for rejeitada, conclui-se que a variavel xj pode ser
eliminada do modelo.
Este teste t serve pois para testar hipoteses acerca dos coeficientes da regressao
individualmente, sendo util para determinar a importancia de uma determinada
variavel controlada no modelo. Dependendo do caso, um modelo pode ser mais
eficiente se se adicionar uma ou mais variaveis controladas ou, pelo contrario, se se
eliminar alguma(s) das ja existentes.
Para concluir observe-se que se nao houver multicolinariedade, ℵ = Rk+1, logo
os vectores linha de A podem ser quaisquer e continua-se a poder sempre estudar
questoes relativas aos varios coeficientes da regressao.
38 2. Definicoes e Resultados Preliminares
2.11 Modelos Log-Lineares e Tabelas de Contingencia
Os modelos log-lineares descrevem padroes de associacao entre variaveis categoricas
e sao utilizados para modelar as contagens por celula em tabelas de contingencia
[1]. O modelo amostral de Poisson para contagens e usualmente usado em tabelas
de contingencia e assume que as contagens sao realizacoes de variaveis aleatorias
independentes de Poisson.
Suponha-se que se tem (n1, ..., nN) contagens em N celulas duma tabela de con-
tingencia (frequencias observadas) com n =∑
i ni. Como ja foi referido, assume-se
que (n1, ..., nN) sao realizacoes de variaveis independentes com distribuicao de Pois-
son com parametros mi = E(ni), chamados de frequencias esperadas, aos quais
correspondem probabilidades πi, i = 1, ..., N . A funcao de probabilidade para cada
um dos ni, i = 1, ..., N eexp(−mi)m
nii
ni!(2.39)
satisfazendo V (ni) = E(ni) = mi.
O modelo log-linear e definido por
logmi =s∑j=1
xijθj, i = 1, ..., N (2.40)
ou na forma matricial
log m = Xθ (2.41)
onde m e o vector cujas componentes sao os mi, n o vector com componentes ni,
i = 1, ..., N , X = [xij], i = 1, ..., N, j = 1, ..., s e a matriz do modelo contendo os
valores das variaveis explıcitas para as N celulas e θ e o vector cujas componentes
sao os parametros do modelo θj, j = 1, ..., s.
Nos modelos log-lineares para amostras de Poisson independentes, a estimacao
dos parametros e realizada utilizado o metodo da maxima verosimilhanca. Sendo
2.11. Modelos Log-Lineares e Tabelas de Contingencia 39
que neste caso a funcao de verosimilhanca e dada por
L(m) =N∏i=1
exp(−mi)mnii
ni!(2.42)
donde o logaritmo da funcao de verosimilhanca que interessa maximizar e dado por
logL(m) =N∑i=1
ni logmi −N∑i=1
mi =N∑i=1
ni
(s∑j=1
xijθj
)−
N∑i=1
exp
(s∑j=1
xijθj
).
(2.43)
Derivando, obtem-se
∂ logL(m)
∂θj=
N∑i=1
nixij −N∑i=1
mixij (2.44)
dado que mi = exp[∑s
j=1 xijθj]. Para obter os estimadores da maxima verosimi-
lhanca θj de θj, j = 1, ..., s, igualam-se essas derivadas a zero. Obtem-se, deste
modo, em notacao matricial, as equacoes
XTn = XTm (2.45)
onde m tem componentes mi = exp[∑s
j=1 xij θj], i = 1, ..., N .
Na estimacao por maxima verosimilhanca, a matriz de informacao (INF) e a
variancia de ∂ logL(m)/∂θj. Ora a matriz de informacao e dada pelo pela simetrica
do valor esperado da matriz Hessiana. Sendo a matriz Hessiana constituıda pelos
elementos
∂2 logL(m)
∂θjθk= −
N∑i=1
xij∂mi
∂θk= −
N∑i=1
xij
∂
∂θk
[exp(
s∑h=1
xihθh)
]= −
N∑i=1
xijxikmi
(2.46)
os quais nao dependem das frequencias observadas n, vem
INF = XTD(m)X (2.47)
40 2. Definicoes e Resultados Preliminares
onde D(m) e a matriz diagonal cujos elementos principais sao as componentes de
m [1].
Para um numero fixo de celulas, o estimador da maxima verosimilhanca θ tem
distribuicao assimptoticamente normal, com valor medio θ e matriz de covariancia
igual a INF−1 [1]. Donde, para amostras de Poisson, a matriz de covariancia esti-
mada de θ e
COV(θ) =(XTD(m)X
)−1. (2.48)
Para cada celula i, duma tabela de contingencia, o resıduo estandardizado e dado
por
ei =ni − mi
m1/2i
. (2.49)
Quando o modelo se ajusta bem, os ei, i = 1, ..., N sao assimptoticamente normais
com valor medio nulo e variancias assimptoticas inferiores a 1 [1].
Seja e = [e1, ..., eN ]T , entao a estatıstica de Pearson X2 = eTe tem distribuicao
assimptotica qui-quadrado com N − s graus de liberdade. Por outras palavras, X2
tem distribuicao qui-quadrado aproximada, com graus de liberdade iguais ao numero
de celulas da tabela de contingencia menos o numero de parametros linearmente
independentes estimados do modelo [1].
Nos modelos log-lineares a “bondade” do ajustamento e dada pelo desvio residual
G2 = 2N∑i=1
ni log(ni/mi). (2.50)
Supondo que πi > 0, i = 1, ..., N quando o modelo se ajusta bem e n→∞, o desvio
residual, ver [1], distribui-se assimptoticamente como um qui-quadrado com N − s
graus de liberdade, o que e o mesmo que dizer que G2 converge em distribuicao para
um qui-quadrado com N − s graus de liberdade, ver [32], pondo-se
G2 d−→ χ2N−s.
2.11. Modelos Log-Lineares e Tabelas de Contingencia 41
Para avaliar a “bondade” do ajustamento de um model log-linear, um teste de
qui-quadrado pode ser utilizado, ver [21] e [28], no qual se testa a hipotese nula,
de o modelo se ajustar bem aos dados. Nao se rejeita H0 se o modelo tiver um
desvio residual inferior ou igual ao quantil do qui-quadrado para uma probabilidade
1 − q = 0.95 com N − s graus de liberdade. Por outras palavras, se o p − value
do teste for superior ao nıvel de significancia q, o modelo pode considerar-se bem
ajustado.
2.11.1 Modelos Log-lineares com 2 dimensoes
Suponha-se uma tabela de contingencia com 2 dimensoes, isto e, com 2 criterios de
classificacao/ variaveis (A e B), com a e b nıveis respectivamente (Tab. 2.1). As
frequencias observadas ntl com t = 1, ..., a e l = 1, ..., b representam as contagens
efectuadas para cada uma das celulas da tabela, as quais correspondem a todas as
combinacoes dos nıveis dos criterios A e B, havendo N = a× b celulas.
As frequencias observadas sao a variavel resposta na modelacao log-linear e, como
resultado desta modelacao, obtem-se para cada celula da tabela de contingencia
estimativas das frequencias observadas, designadas por frequencias esperadas mt,l.
Os modelos log-lineares com 2 dimensoes terao um papel central nas aplicacoes
apresentadas nos capıtulos 7 e 8. Existem diversos tipos de modelos log-lineares
Tab. 2.1: Tabela de contingencia com 2 dimensoes
B
A 1 ... b
1 n11 ... n1b
... ... ... ...
a na1 ... nab
42 2. Definicoes e Resultados Preliminares
com 2 dimensoes [1] e [24]. Os mais conhecidos sao os modelos de associacao linear,
efeito linhas, efeito colunas, quasi-associacao, quasi-independencia, quasi-simetria,
diagonal, etc. Contudo, aqui apenas se vai abordar um caso particular do modelo
de quasi-associacao, o qual interessa para a aplicacao apresentada, e cuja expressao
e dada por
log mtl = λ+ λAt + λBl + β × t× l + δtI(t = l) (2.51)
com parametros:
• λ - termo constante;
• λAt - t-esimo nıvel do criterio A;
• λBl - l-esimo nıvel do criterio B;
• β - parametro de associacao linear;
• δt - t-esimo elemento da diagonal AB;
onde
I(condicao) =
0 se condicao verdadeira
1 se condicao falsa. (2.52)
Sendo o modelo anterior um modelo completo, atraves do metodo de “backward
elimination” podera reduzir-se o numero de parametros do modelo ajustado, sem
perda significativa de informacao. Este metodo permite a seleccao dum sub-modelo
alternativo, por eliminacao dos parametros menos significativos do modelo completo.
A descricao deste metodo podera ser encontrada em [1] e [21].
3. ALGEBRAS DE JORDAN COMUTATIVAS
3.1 Primeiros Resultados
Neste capıtulo introduzem-se as Algebras de Jordan comutativas e operacoes binarias
sobre estas algebras, as quais permitirao estudar, em capıtulos seguintes, modelos
mistos e em particular modelos de efeitos fixos, em que se consideram todas as
combinacoes dos nıveis de dois ou mais factores/modelos.
Algebras de Jordan Comutativas sao espacos lineares vectoriais constituıdos por
matrizes simetricas que comutam, contem os quadrados das respectivas matrizes, e
tem uma unica base constituıda por matrizes de projeccao ortogonal mutuamente
ortogonais, chamada de base principal [37].
Observe-se que os espacos imagem das matrizes da base principal serao tambem
mutuamente ortogonais.
Estas algebras serao designadas doravante neste texto por a.j.c. e as matrizes
com que trabalhamos sao de ordem n× n, caso nada seja dita nada em contrario.
Sejam g1, ..., gw as caracterısticas das matrizes da base principal Q1, ...,Qw
duma a.j.c. A, se
w∑j=1
Qj = In ∈ A
diz-se que A e completa, o que significa quew∑j=1
gj = n, caso contrario tem-se
44 3. Algebras de Jordan Comutativas
w∑j=1
gj < n e as matrizes da base podem ser completadas juntando-lhe a matriz
Qw+1 = In −w∑j=1
Qj.
Diz-se que a a.j.c. A com base principal Q1, ...,Qw,Qw+1 e a completada de A.
Por outro lado, se1
nJn =
1
n1n1
Tn ∈ A
diz-se queA e regular. E facil verificar que 1nJn e uma matriz de projeccao ortogonal
uma vez que e simetrica e idempotente. Um exemplo muito simples de uma a.j.c.
completa e regular e a algebra A(s), que tem como base principal 1sJs, Is − 1
sJs.
Dada M uma matriz de projeccao ortogonal pertencente a A ter-se-a M =w∑j=1
ajQj. Como M e idempotente e as Q1, ...,Qw sao mutuamente ortogonais tem-se
w∑j=1
ajQj =M = M2 =w∑j=1
a2jQj (3.1)
vindo aj = a2j , pelo que aj = 0 ou aj = 1 com j = 1, ..., w. Sendo ϕ = j : aj 6= 0
ter-se-a
M =∑j∈ϕ
Qj (3.2)
pelo que as matrizes de projeccao ortogonal pertencentes a A serao somas de todas
ou de um subconjunto do conjunto das matrizes da base Q1, ...,Qw.
Seja M =w∑j=1
ajQj e ∇j = R(Qj), j = 1, ..., w, representando por a soma
directa ortogonal de sub-espacos vectoriais, tem-se
R(M) =∑j∈ϕ
ajR(Qj) = j∈ϕ∇j (3.3)
uma vez que os subespacos ∇j, j = 1, ..., w sao ortogonais entre si, logo ter-se-a
Car(M) = dim (R(M)) =∑j∈ϕ
dim (∇j) =∑j∈ϕ
Car (Qj) =∑j∈ϕ
gj (3.4)
3.1. Primeiros Resultados 45
com gj = Car(Qj) = dim(∇j) j = 1, ..., w.
Proposicao 3.1.1. Seja M =w∑j=1
ajQj com Q1, ...,Qw a base principal duma
a.j.c. completa A, entao os a1, ..., aw serao os valores proprios de M com multi-
plicidades g1 = Car(Q1), ..., gw = Car(Qw), caso os a1, ..., aw sejam distintos. Se
houver grupos de aj identicos somam-se as multiplicidades.
Demonstracao. Sendo as Qi, i = 1, ..., w matrizes de projeccao ortogonal n×n, logo
simetricas e idempotentes, os seus valores proprios sao iguais a 1, com multiplicidade
gi e a 0 com multiplicidade n − gi, i = 1, ..., w, tendo-sew∑j=1
gj = n porque a a.j.c.
e completa. Dados os gi vectores proprios de Qi associados ao valor proprio 1, os
mesmos constituem uma base ortonormada para ∇i = R(Qi), i = 1, ..., w, sendo
estes sub-espacos mutuamente ortogonais [14]. Juntando as bases dos sub-espacos
∇i obtem-se uma base v1,1, ...,vg1,1, ....,v1,w, ...,vgw,w para Rn. Nesta base de Rn,
os primeiros g1 vectores constituem uma base para ∇1, e assim sucessivamente,
ate que os ultimos gw vectores constituem uma base para ∇w. Ora, sendo M =w∑j=1
ajQj, a matriz cujos vectores linha sao os vectores desta base de Rn e a matriz
diagonalizadora ortogonal P, tendo-se
PMPT = D(a1, ..., a1, ..., aw, ..., aw).
Logo os a1, ..., a1, ..., aw, ..., aw sao os valores proprios de M com multiplicidades
g1, ..., gw. Os vectores proprios associados a estes valores proprios sao os vectores
linha v1,1, ...,vg1,1, ....,v1,n, ...,vgw,w de P, o que estabelece a tese.
Recordando as inversas de Moore-Penrose: se Q for uma matriz de projeccao
ortogonal tem-se Q+ = Q [35]. Alem disso, se M =w∑j=1
ajQj ∈ A com Q1, ...,Qw
a base principal de A ter-se-a, dado as Q1, ...,Qw serem idempotentes e mutuamente
46 3. Algebras de Jordan Comutativas
ortogonais
M+ =w∑j=1
a+j Qj (3.5)
com
• a+j = 0 se aj = 0
• a+j = a−1
j se aj 6= 0
para j = 1, ..., w.
Segue-se a
Proposicao 3.1.2. A a.j.c. A contem matrizes regulares se e so se for completa.
Demonstracao. Seja M ∈ A regular, entao M =∑j∈ϕ
ajQj com ϕ = j : aj 6= 0, logo
por (3.4) n = Car(M) =∑j∈ϕ
gj =∑j∈ϕ
Car(Qj), vindo ϕ = 1, ..., w ew∑j=1
Qj = In,
logo A e completa.
Na prova da inversa, como A e completa tem-se que In =w∑j=1
Qj ∈ A e In e uma
matriz regular, logo A contem matrizes regulares.
Assim, com A a.j.c. completa, M =w∑j=1
ajQj ∈ A e regular se e so se aj 6= 0, j =
1, ..., w. Pela proposicao 3.1.1 os aj, j = 1, ..., w sao os valores proprios da matriz M
e como a matriz M e regular, todos os seus valores proprios sao nao nulos.
Tambem facilmente se ve que, caso M seja regular, se tem
M−1 =w∑j=1
a−1j Qj (3.6)
e, alem disso, que Det(M) =∏w
j agjj .
Sendo as Qj, j = 1, ..., w matrizes de projeccao ortogonal tem-se
Qj = ATj Aj
3.1. Primeiros Resultados 47
com AjATj = Igj sendo os vectores linha de Aj uma base ortonormada para ∇j,
j = 1, ..., w [14]. Portanto, se A for completa os vectores linha da matriz
P(A) = [AT1 ...A
Tw]T
constituirao uma base ortonormada de Rn, visto ter-se
In =w∑j=1
Qj =w∑j=1
ATj Aj.
Entao por definicao, P(A) sera uma matriz ortogonal que esta associada a A. Inver-
samente, dada uma matriz ortogonal P e uma particao de n = 1, ..., n em w con-
juntos ϕj, j = 1, ..., w, disjuntos dois a dois, ter-se-a In =w∑j=1
Qj com Qj = ATj Aj,
sendo as Aj constituıdas pelos vectores linha de P com ındices em ϕj, j = 1, ...w.
E facil de verificar que estas matrizes sao simetricas e idempotentes sendo, por-
tanto, matrizes de projeccao ortogonal e tambem mutuamente ortogonais. Assim,
Q1, ...,Qw sera a base principal duma a.j.c. completa que tem P como matriz
ortogonal associada.
Sendo M ∈ A uma matriz de projeccao ortogonal, entao atendendo (3.2) e (3.4),
se Car(M) = 1, M tera de pertencer a base principal Q1, ...,Qw.
Se A for uma a.j.c. regular com base principal Q1, ...,Qw convenciona-se que
Q1 = 1nJn e ter-se-a
Q1 =1
nJn =
(1√n
1n
)(1√n
1Tn
)vindo
A1 =1√n
1Tn .
Logo P(A) tem uma primeira linha com elementos iguais a 1√n
e alem disso, tem-se
AjAT1 = 0gj , j = 2, ..., w.
48 3. Algebras de Jordan Comutativas
Como a soma de componentes de qualquer vector linha de Aj, j = 2, ..., w e nula,
esses vectores serao vectores de contrastes. Portanto as Aj, j = 2, ..., w serao ma-
trizes de contrastes e P(A) sera uma matriz ortogonal estandardizada (ver seccao
2.1).
3.2 Geracao de Algebras de Jordan Comutativas
Seja F(P) uma famılia de matrizes simetricas que tem como P a sua diagonalizadora
ortogonal, entao tem-se o seguinte resultado, apresentado em Ferreira(2006):
Proposicao 3.2.1. F(P) e uma a.j.c..
Demonstracao. F(P) e um espaco vectorial uma vez, que dadas as matrizes M1, ...,Ms ∈
F(P), uma sua combinacao linear
M =s∑j=1
bjMj ∈ F(P)
pois PMPT = P(s∑j=1
bjMj)PT =
s∑j=1
bjDj continua a ser uma matriz diagonal e
facilmente se verificam todas as outras condicoes para ser espaco vectorial.
Segundo a proposicao 2.1.1, as matrizes pertencentes a esta famılia comutam, e
alem disso tem-se (PMPT )(PMPT ) = D2 , isto e, PM2PT = D2 e uma matriz
diagonal, logo M2 ∈ F(P).
Sejam αn1 , ...,αnn os vectores linha de P e r1, ..., rn os valores proprios de M ∈
F(P), entao tem-se, ver [35],
M =n∑j=1
rjαnjα
njT .
Sendo portanto M uma matriz qualquer pertencente a F(P) e que pode ser escrita
como uma combinacao linear nao nula das matrizes Qj = αnjαnjT linearmente in-
dependentes, entao as matrizes Qj, j = 1, ..., n constituirao uma base para F(P).
3.2. Geracao de Algebras de Jordan Comutativas 49
Ve-se ainda facilmente, devido ao facto dos vectores αn1 , ...,αnn serem ortonormados,
que as Qj sao matrizes de projeccao ortogonal e que sao mutuamente ortogonais, ou
seja, QjQi = On, para j 6= i e j = 1, ..., n. Assim sendo F(P) tem dimensao n.
Falta ainda provar, relativamente a proposicao anterior, que a base e unica. Efec-
tivamente, Seely(1971) chamou as a.j.c. espacos vectoriais comutativos quadraticos
e apresentou o seguinte resultado:
Proposicao 3.2.2. Uma condicao necessaria e suficiente para um subespaco A ser
a.j.c. e a existencia de uma base Q1, ...,Qw para esse subespaco, tal que cada
matriz simetrica Qj, j = 1, ..., w e idempotente e QiQj = On para i 6= j. Alem
disso, independentemente do ındice das matrizes na base, essa base e unica.
Demonstracao. A parte da condicao necessaria e suficiente e facilmente provada [37].
A demonstracao de que essa base e unica apresenta-se de seguida.
Seja Q1, ...,Qw uma base de uma a.j.c. A, constituıda por matrizes de
projeccao ortogonal mutuamente ortogonais. Supondo que se tinha outra base
R1, ...,Rw para A formada por matrizes de projeccao ortogonal mutuamente or-
togonais. Fixando m ∈ 1, ..., w, sejam ai numeros reais tais que Rm =w∑i=1
aiQi e
bh,j numeros reais tais que Qh =w∑j=1
bh,jRj para h = 1, ..., w, entao, uma vez que as
matrizes Qi para i = 1, ..., w sao mutuamente ortogonais e idempotentes, vem
RmQh = (w∑i=1
aiQi)Qh = ahQhQh = ahQh
o mesmo para matrizes Rj para j = 1, ..., w
RmQh = Rm(w∑j=1
bh,jRj) = Rmbh,mRm = bh,mRm
logo ahQh = bh,mRm para h = 1, ..., w. Como as Qi sao linearmente independentes
tem-se Rm 6= O e como Qh e Rm sao matrizes pertencentes a bases tem-se que
50 3. Algebras de Jordan Comutativas
(ah = 0 ou ah = 1) e (bh,m = 0 ou bh,m = 1), donde Rm = Qh para algum h. Dado
que esta igualdade se verifica para m = 1, ..., w, entao esta provada a unicidade da
base Q1, ...,Qw.
No caso de F(P), a base principal sera Q1, ...,Qn com Qj = αnjαnjT , j =
1, ..., n.
Sejam T1 e T2 duas famılias de matrizes simetricas e E(T1) e E(T2) os espaco vec-
toriais gerados por T1 e T2 respectivamente. Estabelece uma relacao de equivalencia
ε e entre famılias de matrizes
T1εT2 se E(T1) = E(T2).
Esta relacao verifica-se para bases duma a.j.c..
Dada T = M1, ...,Mw uma famılia de matrizes simetricas pertencentes a
F(P), como a interseccao de a.j.c.’s continua a ser uma a.j.c., a interseccao de
todas as a.j.c. que contem T sera tambem uma a.j.c., a a.j.c. A(T ) gerada por
T . Nao e no entanto certo que M1, ...,Mw seja uma base para a a.j.c. gerada
por estas matrizes.
Assumindo que as M1, ...,Mw sao linearmente independentes, interessa obter
condicoes para que E(T ) = A(T ). Os vectores linha α1, ...,αn de P sao os vectores
proprios das matrizes M1, ...,Mw associados aos valores proprios rl,j, l = 1, ..., w,
entao tem-se
Ml =n∑j=1
(αjTMlα
nj )αjαj
T =n∑j=1
rl,jαjαjT , l = 1, ..., w.
Defina-se agora a relacao de equivalencia γ no conjunto α1, ...,αn
αiγαj se rl,i = rl,j, l = 1, ..., w.
Deste modo, definem-se C1, ..., Cw classes de equivalencia γ com w ≤ n. A classe de
equivalencia γ e primaria, se existir pelo menos uma matriz Ml que tenha um valor
3.2. Geracao de Algebras de Jordan Comutativas 51
proprio nao nulo associado com os vectores na classe de equivalencia. Suponha-se
que existem m classes de equivalencia primarias, podendo existir a classe m + 1 se
existir uma classe de equivalencia secundaria para os vectores com valores proprios
nulos para todas as matrizes de T . Considere-se que os vectores incluıdos nas classes
de equivalencia primarias sao os vectores linha das matrizes A1, ...,Am, os vectores
da classe secundaria (se existir) sao os vectores linha da matriz Am+1. As matrizes
Q1, ...,Qm, com Qj = ATj Aj, j = 1, ...,m[m+1] constituem uma famılia de matrizes
de projeccao ortogonal mutuamente ortogonais que sera a base principal duma a.j.c.
A+(T ) e, se existir uma classe secundaria, as matrizes Q1, ...,Qm e Qm+1 serao a
base principal da completada de A+(T ), A+(T ). Alem disso, tem-se que
E(T ) ⊆ A(T ) ⊆ A+(T ) (3.7)
e
w ≤ m
dado que w = dim(E(T )), porque as M1, ...,Mw sao linearmente independentes e
m = dim(A+(T )). Estabeleca-se agora a proposicao
Proposicao 3.2.3. Se as matrizes M1, ...,Mw sao linearmente independentes, para
que se tenha E(T ) = A(T ), e necessario e suficiente que E(T ) contenha uma famılia
de w matrizes de projeccao ortogonal mutuamente ortogonais V, as quais consti-
tuirao a base principal de A(T ).
Demonstracao. Se E(T ) = A(T ) entao dim(A(T )) = w logo a base principal de
A(T ) sera uma famılia de matrizes de projeccao ortogonal mutuamente ortogonais
com w matrizes contidas em E(T ). Inversamente, se E(T ) contem uma famılia
de matrizes de projeccao ortogonal mutuamente ortogonais V , constituıda por w
matrizes, entao V sera uma base de E(T ) o qual tem dim(E(T )) = w. Alem disso
52 3. Algebras de Jordan Comutativas
ve-se ainda que E(T ) e a.j.c., uma vez que E(T ) e gerado por T uma famılia
de w matrizes linearmente independentes, simetricas que comutam. Como toda a
a.j.c. que contem T , contem a a.j.c. mınima que inclui T (ou seja A(T )), vem
A(T ) ⊆ E(T ). Por outro lado, a partida, tem-se que E(T ) ⊆ A(T ) para alem
do facto de ter de se ter dim(A(T )) ≥ w, por A(T ) ser espaco linear e conter T .
Obtem-se, portanto, A(T ) = E(T ).
3.3 Operacoes Binarias
Nesta seccao, serao estudadas as operacoes sobre algebras de Jordan comutativas,
mais exactamente sobre as suas bases principais. Estas operacoes sobre a.j.c. permi-
tirao, em capıtulos seguintes, construir modelos complexos a partir de modelos mais
simples. Neste sentido, operacoes envolvendo algumas das mais simples algebras de
Jordan terao um papel importante.
O produto de Kronecker ⊗ de a.j.c. intervem na construcao de modelos obtidos
por cruzamento.
Estabeleca-se a proposicao
Proposicao 3.3.1. Sendo Qj,1, ...,Qj,wj a base principal da a.j.c. Aj constituıda
por matrizes nj × nj, para j = 1, 2, entao
A1 ⊗A2 =
w1∑i=1
w2∑j=1
ai,j(Q1,i ⊗Q2,j)
sera a.j.c. com base principal Q1,i ⊗Q2,j, i = 1, ..., w1, j = 1, ..., w2. Alem disso,
se A1 e A2 forem completas[regulares], A1 ⊗A2 tambem sera completa[regular].
Demonstracao. Sendo Qj,1, ...,Qj,wj a base principal da a.j.c. Aj, constituıda
por matrizes de projeccao ortogonal mutuamente ortogonais e, como o produto
3.3. Operacoes Binarias 53
⊗ de matrizes de projeccao ortogonal da matrizes de projeccao ortogonal, tem-
se que, por (2.2), as matrizes Q1,i ⊗ Q2,j, i = 1, ..., w1, j = 1, ..., w2 sao tambem
matrizes de projeccao ortogonal mutuamente ortogonais. Alem disso, utilizando
a propriedade distributiva (2.8) e a propriedade (2.2), facilmente se verifica que
A1 ⊗A2 =
w1∑i=1
w2∑j=1
ai,j(Q1,i ⊗Q2,j)
e um espaco vectorial, constituıdo por matri-
zes simetricas, que comutam, e contendo o quadrado dessas matrizes, logo A1 ⊗A2
sera a.j.c. Como as matrizes Q1,i ⊗ Q2,j, i = 1, ..., w1, j = 1, ..., w2 sao matrizes
de projeccao ortogonal mutuamente ortogonais, consequentemente linearmente in-
dependentes, as mesmas constituem a base principal de A1⊗A2. Por outro lado, sewl∑i=1
Ql,i = Inl , l = 1, 2, devido a propriedade (2.8) do produto de Kronecker, ter-se-a
w1∑i=1
w2∑j=1
Q1,i ⊗Q2,j = In1 ⊗ In2 = In1n2
e, caso 1nl
Jnl ∈ Al, l = 1, 2, vira
(1
n1
Jn1)⊗ (1
n2
Jn2) =1
n1n2
Jn1n2 ∈ A
Mostra-se que, se A1, A2 e A3 forem a.j.c. entao
A1 ⊗ (A2 ⊗A3) = (A1 ⊗A2)⊗A3 (3.8)
isto e, o produto de kronecker de a.j.c e associativo [9].
Tem-se ainda a
Proposicao 3.3.2. Tem-se P(A1 ⊗A2) = P(A1)⊗P(A2)
Demonstracao. Como ja foi visto P(Al) = [ATl,1, ...,A
Tl,wl
]T com Ql,j = ATl,jAl,j,
j = 1, ..., wl, l = 1, 2, pelo que por (2.2) tem-se
Q1,i ⊗Q2,j = (AT1,i ⊗AT
2,i)(A1,j ⊗A2,j)
54 3. Algebras de Jordan Comutativas
para i = 1, ..., w1, j = 1, ..., w2, vindo
P(A1⊗A2) = [AT1,1⊗AT
2,1, ...,AT1,w1⊗AT
2,w2]T =
[AT
1,1, ...,AT1,w1
]T⊗[AT2,1, ...,A
T2,w2
]T= P (A1)⊗P (A2)
O produto restrito * de a.j.c. intervem na construcao de modelos obtidos por
encaixe. Quando cada tratamento dum modelo encaixa todos os tratamentos de
outro modelo, diz-se que o primeiro modelo encaixa o segundo. Se dois modelos
iniciais estao associados as a.j.c. A1 e A2, completas e regulares, entao o modelo
obtido por encaixe estara associado a a.j.c. A1*A2, ver [9]. Sendo Ql,1, ...,Ql,wl
a base principal da a.j.c. completa Al, l = 1, 2, assumindo que Q2,1 = 1n2
Jn2 , entao
a base principal de A1*A2 sera
Q1,1 ⊗1
n2
Jn2 , ...,Q1,w1 ⊗1
n2
Jn2 ∪ In1 ⊗Q2,2, ..., In1 ⊗Q2,w2.
Dada uma outra a.j.c A3 com base principal Q3,1, ...,Q3,w3, assumindo Q3,1 =
1n3
Jn3 , prova-se ainda que, ver [9],
(A1*A2)*A3 = A1*(A2*A3).
Esta operacao apenas e abordada de passagem, uma vez que a sua aplicacao
da-se quando se considera modelos com r repeticoes, para os quais seguidamente
se apresenta uma breve descricao. Seja A a a.j.c. associada a um modelo com
uma observacao por tratamento. Quando se tem r observacoes por tratamento, o
modelo passa a estar associado a a.j.c. A*A(r) tendo A(r) como base principal
1rJr, Ir − 1
rJr, ver [9]. Como ja foi referido anteriormente, A(r) e completa e
regular sendo a unica a.j.c. constituıda por matrizes r × r cuja base principal e
constituıda por essas matrizes. AA(r) esta associada ao modelo usual para amostras
de dimensao r com distribuicao normal e observacoes independentes e identicamente
distribuıdas.
4. MODELOS LINEARES ORTOGONAIS
Neste capıtulo apresentam-se os modelos associados a a.j.c.. Do ponto de vista
da estrutura do modelo, esta associacao permite estudar o cruzamento e encaixe
de modelos multi-factor. Na sequencia dos modelos associados a a.j.c., surgem os
modelos normais ortogonais na forma canonica, isto e, na forma conveniente para
aplicar as a.j.c. e obter estatısticas completas e suficientes e subsequentemente
estimadores UMVUE com vista a realizar inferencia.
4.1 Modelos Associados a uma Algebra de Jordan Comutativa
Diz-se que o modelo linear
y =w∑i=1
Xiαi + e (4.1)
com ci = Car(Xi), i = 1, ..., w + 1, esta associado a a.j.c. A se a famılia de
matrizes M1, ...,Mw,Mw+1 com Mi = XiXTi , i = 1, ..., w e Mw+1 = In for uma
base para A. Por outro lado, como Mw+1 = In ∈ A, A e completa. Em geral
assume-se que X1 = 1√n1n vindo 1
nJn ∈ A ou seja A e regular.
O modelo anterior e ortogonal porque as matrizes da base M1, ...,Mw+1 co-
mutam, ou seja,
MiMj = MjMi, i, j = 1, ..., w + 1.
O modelo linear atras apresentado podera ser o modelo misto (efeitos fixos +
aleatorios). Para tal, admite-se que os αi, i = 1, ...,m sao vectores fixos e que os αi,
56 4. Modelos Lineares Ortogonais
i = m + 1, ..., w sao normais, independentes, com vectores medios nulos e matrizes
de covariancia σ2i Ici , i = m + 1, ..., w. O vector do erro e sera tambem normal,
independente dos anteriores vectores aleatorios, com vector medio nulo e matriz de
covariancia σ2In. Escrito de outro modo
αi ∼ N(0, σ2i Ici), i = m+ 1, ..., w
e
e ∼ N(0, σ2In).
Entao, tem-se y ∼ N(µ,V), vendo-se facilmente queµ = E(y) =
m∑i=1
Xiαi
V = COV(y) =w∑
i=m+1
σ2iMi + σ2In
(4.2)
Note-se que, em geral, tem-se α1 = µ.
Sendo Q1, ...,Qw,Qw+1 a base principal de A tem-seMi =
w+1∑j=1
bi,jQj, i = 1, ..., w + 1
In =w+1∑j=1
Qj
. (4.3)
Fazendo bw+1,j = 1, j = 1, ..., w+1, a matriz B = [bi,j], i, j = 1, ..., w+1 sera regular
uma vez que se trata de uma matriz de transformacao de bases. A B chamar-se-a
matriz de transicao de A. Seja gj a caracterıstica de Qj, j = 1, ..., w + 1, entao por
(4.3) tem-se Wi = R(Mi) = R(Xi) = j∈ϕi∇j, i = 1, ..., w + 1
ci =∑j∈ϕi
gj(4.4)
4.1. Modelos Associados a uma Algebra de Jordan Comutativa 57
onde ∇j = R(Qj) = R(Aj), j = 1, ..., w + 1, ϕi = j : bi,j 6= 0, i = 1, ..., w + 1,
representa a soma directa ortogonal de sub-espacos e Xw+1 = In.
Devido a primeira das expressoes em (4.2) e, como µ ∈ mi=1Wi, resulta que
µ ∈ Ω com
Ω = R([X1...Xm]) = R([X1...Xm][X1...Xm]T ) = R(m∑i=1
Mi)
[38], e como as matrizes Mi, i = 1, ..., w + 1 sao semi-definidas positivas tem-se
ϕ = ϕ(m∑i=1
Mi) = ∪mi=1ϕi
vindo
Ω = j∈ϕ∇j.
Por outro lado, devido a (4.3), obtem-se
V =w∑
i=m+1
σ2i
(w+1∑j=1
bi,jQj
)+ σ2
w+1∑j=1
Qj.
Fazendo σ2i = 0, i = 1, ...,m, facilmente se ve que
w∑i=m+1
σ2i
(w+1∑j=1
bi,jQj
)=
w+1∑j=1
w∑i=1
bi,jσ2iQj
vindo
V =w+1∑j=1
(w∑i=1
bi,jσ2iQj + σ2Qj
)=
w+1∑j=1
(w∑i=1
bi,jσ2i + σ2
)Qj =
w+1∑j=1
γjQj (4.5)
e, como bw+1,j = 1, tem-se o sistema de equacoes
γj =w+1∑i=m+1
bi,jσ2i =
w∑i=m+1
bi,jσ2i + σ2, j = 1, ..., w + 1. (4.6)
58 4. Modelos Lineares Ortogonais
em que σ2w+1 = σ2. Tomando bi,w+1 = 0 para i = m+1, ..., w, tem-se γw+1 = σ2. No
seguimento, como as Qj, j = 1, ..., w+1 sao idempotentes e mutuamente ortogonais,
tem-se V−1 =w+1∑j=1
1γj
Qj.
Estabeleca-se agora a
Proposicao 4.1.1. Estando o modelo associado a a.j.c A com µ ∈ Ω, Q(Ω) a
matriz de projeccao ortogonal sobre o espaco Ω pertence a A bem como V.
Demonstracao. Q(Ω) ∈ A ja que Q(Ω) =∑
j∈ϕ Qj devido a Ω = j∈ϕ∇j. Por
ultimo V ∈ A devido a (4.5).
Ordenem-se agora as matrizes de base principal de A, de modo a obter-se ϕ =
1, ...,m. Com ja foi referido no capıtulo 3, relembre-se que as matrizes Qj, j =
1, ..., w + 1 sendo matrizes de projeccao ortogonal, sao simetricas e idempotentes e
tem valores proprios iguais a 0 ou a 1. Alem disso, Qj = ATj Aj com AjA
Tj = Igj
sendo os gj vectores linha de Aj os vectores proprios de Qj, j = 1, ..., w+1 associados
ao valor proprio 1. Por outro lado, como A e completa tem-seIn =
w+1∑j=1
Qj
n =w+1∑j=1
gj
e dado as Q1, ...,Qw+1 serem mutuamente ortogonais tem-se
Rn = w+1j=1∇j. (4.7)
Por fim, como os vectores linha de Aj pertencem a ∇j e os vectores coluna de Qj′
pertencem a ∇j′ , e para j 6= j′, ∇j = R(Qj) e ortogonal a ∇j′ = R(Qj′), vindo
AjQj′ = Ogj×n, j 6= j′.
4.1. Modelos Associados a uma Algebra de Jordan Comutativa 59
Entao para j 6= j′ facilmente se ve queAjVAT
j = Aj
(w+1∑i=1
γiQi
)ATj = γjAjQjA
Tj = γjAjA
Tj AjA
Tj = γjIgj
AjVATj′ = Aj
(w+1∑i=1
γiQi
)ATj′ = γjAjQjA
Tj′ = γjAj (Aj′Qj)
T = Ogj×gj′
(4.8)
Assim sendo, tomando ηj = Ajµ e ηj = Ajy, vemE(ηj) = ηj
COV(ηj) = γjIgj
, j = 1, ..., w + 1 (4.9)
bem como y = Iny =
w+1∑j=1
Qjy =w+1∑j=1
ATj Ajy =
w+1∑j=1
ATj ηj
µ =w+1∑j=1
Qjµ =w+1∑j=1
ATj Ajµ =
w+1∑j=1
ATj ηj =
m∑j=1
ATj ηj
(4.10)
ja que
ηj = Ajµ = 0, j = m+ 1, ..., w + 1 (4.11)
devido aos vectores linha de Aj pertencerem ∇j, µ ∈ Ω e ∇j⊥Ω, j = m+1, ..., w+1.
Na primeira das expressoes (4.10), o modelo diz-se escrito na forma canonica.
Nesta formulacao intervem os parametros canonicos η1, ...,ηm e γ1, ...,γw+1. A
ortogonalidade deste modelo e baseada na expressao (4.7), ou seja, na particao
ortogonal do espaco da amostra, de forma que as projeccoes ortogonais dos vectores
das observacoes nesses sub-espacos (particoes ortogonais) sao nao correlacionadas.
Quando comparado o modelo (4.1) com o modelo da primeira das expressoes em
(4.10), observa-se que o vector dos erros aleatorios e = y − µ nao aparece isolado,
e facilmente se verifica que este corresponde, sem ser identico, ao termo ATw+1ηw+1
da formulacao canonica.
60 4. Modelos Lineares Ortogonais
4.2 Estimadores UMVUE
Devido a (4.11) vem
‖ηj − ηj‖2 =
(y − µ)TATj Aj(y − µ) se j = 1, ...,m
yTATj Ajy = ‖ηj‖2 se j = m+ 1, ..., w + 1
. (4.12)
Dado que se tem y ∼ N(µ,V) por (4.9) vem
ηj ∼ N(ηj, γjIgj), j = 1, ..., w + 1
pois Ajy sera um vector normal. Alem disso, tem-se que os ηj, j = 1, ..., w + 1
sao independentes, visto ter-se matrizes de covariancia cruzadas nulas devido as
igualdades de (4.8).
Ponha-se
SQj = ‖ηj‖2, j = 1, ..., w + 1 (4.13)
e estabeleca-se a
Proposicao 4.2.1. O vector das observacoes y =∑w+1
j=1 ATj ηj tem densidade
n(y|µ,V) =e− 1
2
m∑j=1
‖ηj−ηj‖2
γj+
w+1∑j=m+1
SQjγj
(2π)n2
w+1∏j=1
γgj2j
e os ηj para j = 1, ...,m e os SQj, j = m + 1, ..., w + 1 sao estatısticas suficientes
e completas.
Demonstracao. Por (4.12) vem
(y − µ)TV−1(y − µ) =m∑j=1
‖ηj − ηj‖2
γj+
w+1∑j=m+1
SQj
γj. (4.14)
4.3. Inferencia para o Modelo de Efeitos Fixos 61
Por outro lado, recorde-se que Det(V) =∏w+1
j=1 γgij . Substituindo (4.14) e Det(V)
na funcao densidade de y, demonstra-se a primeira parte da tese.
Para a segunda parte, basta evocar o teorema da factorizacao (proposicao 2.7.2),
pelo que as estatısticas serao suficientes e como a distribuicao normal pertence a
famılia exponencial e o espaco parametrico contem o produto cartesiano de intervalos
nao degenerados, as estatısticas serao tambem completas, ver [13] e [38].
Sabe-se que (seccao 2.9)
SQj ∼ γjχ2gj ,δj
(4.15)
com δj = 1γj‖ηj‖2, j = 1, ..., w+ 1 devido a (4.9) e (4.11), sendo estes qui-quadrados
independentes. Entao, como δj = 0, j = m+ 1, ..., w + 1, tem-se
E(SQj) = gjγj, j = m+ 1, ..., w + 1
obtendo-se, deste modo, os estimadores centrados γj =SQjgj, j = m + 1, ..., w e
σ2 = SQw+1
gw+1, dado que γw+1 = σ2. Ponha-se SQe = SQw+1 e g = gw+1 = n−
∑wj=1 gj.
Utilizando o teorema de Blackwell-Lehmann-Scheffe (seccao 2.7) facilmente se
verifica que os ηj, j = 1, ...,m sao estimadores UMVUE para os vectores medios
ηj, j = 1, ...,m, e que os estimadores γj =SQjgj
sao tambem UMVUE para os γj,
j = m + 1, ..., w, assim como σ2 = SQeg
o e para σ2. Observe-se ainda que os ηj,
j = 1, ...,m alem de independentes entre si, como ja vimos, sao independentes dos
γj, j = m+ 1, ..., w e de σ2, os quais tambem sao independentes entre si.
4.3 Inferencia para o Modelo de Efeitos Fixos
Este trabalho centra-se na inferencia para modelos de efeitos fixos. Assim, no modelo
(4.1), considera-se que w = m ou seja os αi, i = 1, ...,m sao vectores fixos. Entao,
62 4. Modelos Lineares Ortogonais
de (4.6) resulta γi = σ2, i = 1, ...,m, dondeE(ηi) = ηi
COV(ηi) = σ2Igi
com ηi = Aiµ e ηi = Aiy para i = 1, ...,m+ 1, assim comoy =
m+1∑i=1
ATi ηi
µ =m∑i=1
ATi ηi
. (4.16)
As hipoteses relativas aos factores de efeitos fixos que interessam testar sao
H0,i : ηi = 0, i = 1, ...,m (4.17)
que equivalem a testar a nulidade dos vectores que intervem na parte de efeitos fixos
αi, i = 1, ...,m (alias a unica).
Ora, por (4.13) e (4.15), tem-se
SQi = yTATi Aiy ∼ σ2χ2
gi,δi, i = 1, ...,m
com
δi =1
σ2µTAT
i Aiµ, i = 1, ...,m.
Por outro lado, SQe = SQm+1 = ‖ηm+1‖2 ∼ σ2χ2g,δm+1
com δm+1 = 1σ2‖ηm+1‖2.
Devido a (4.11) δm+1 = 0, donde SQe ∼ σ2χ2g, a qual e independente dos SQi, i =
1, ...,m. Assim sendo, as hipoteses H0,i, i = 1, ...,m podem ser reescritas como
H0,i : δi = 0, i = 1, ...,m
obtendo-se para estas, testes F com gi e g graus de liberdade e estatısticas
Fi =g
gi
SQi
SQe
, i = 1, ...,m (4.18)
4.3. Inferencia para o Modelo de Efeitos Fixos 63
as quais terao distribuicoes F com gi e g graus de liberdade e parametros de nao
centralidade δi, ou seja Fi ∼ F (z|gi, g, δi), i = 1, ...,m.
Ora, quando H0,i se verifica, δi = 0, i = 1, ...,m, e o teste e estritamente nao
distorcido (seccao 2.9). Rejeita-se H0,i, i = 1, ...,m para o nıvel de significancia 1−q
se Fi > F1−q,gi,g, onde F1−q,gi,g o quantil da distribuicao F com gi e g graus de
liberdade para o nıvel 1− q.
Sendo ηi =
ηi,1...
ηi,gi
e ηi =
ηi,1...
ηi,gi
, H0,i verifica-se, se e so se, se verificarem as
sub-hipoteses
H0,i,j : ηi,j = 0, i = 1, ...,m, j = 1, ..., gi. (4.19)
Para estas sub-hipoteses, constroem-se testes F com 1 e g graus de liberdade e
estatısticas
Fi,j = gη2i,j
SQe
, i = 1, ...,m, j = 1, ..., gi (4.20)
ou seja, Fi,j ∼ F (z|1, g, δi,j), i = 1, ...,m, j = 1, ..., gi, com
δi,j =1
σ2η2i,j, i = 1, ...,m, j = 1, ..., gi (4.21)
Facilmente se verifica, para i = 1, ...,m, que δi =gi∑j=1
δi,j e Fi = 1gi
gi∑j=1
Fi,j. As
hipoteses e as sub-hipoteses deverao ser testadas simultaneamente, ver [16]. A si-
tuacao mais comum e H0,i nao ser rejeitada a um dado nıvel, mas uma ou mais
sub-hipoteses serem-no.
Para os testes de hipoteses referentes as componentes de variancia consultar [8],
[9], [10] e [5], onde a teoria anteriormente apresentada e desenvolvida.
64 4. Modelos Lineares Ortogonais
4.4 Vectores Estimaveis e Testes F para os Efeitos Fixos
Considerem-se os vectores estimaveis
ψi = Biηi, i = 1, ...,m. (4.22)
onde os vectores linha das Bi sao os coeficientes de combinacoes lineares das com-
ponentes dos ηi, i = 1, ...,m. Admita-se que os si vectores linha das matrizes Bi,
i = 1, ...,m, sao linearmente independentes, logo Car(Bi) = si e BiBTi sera de-
finida positiva [38]. Dado que as componentes de ψi, i = 1, ...,m sao estimaveis,
atendendo ao teorema de Blackwell-Lehmann-Scheffe, tem-se entao os estimadores
UMVUE ψi = Biηi ∼ N(ψi, σ2Wi) com Wi = BiB
Ti , i = 1, ...,m, os quais sao
independentes de SQe ∼ σ2χ2g. Recorrendo aos resultados da seccao 2.9, obtem-se
para os ψi, i = 1, ...,m, os elipsoides de confianca
Pr
((ψi − ψi)
TW−1i (ψi − ψi) 6 siF1−q,si,g
SQe
g
)= 1− q, i = 1, ...,m (4.23)
em que F1−q,si,g e o quantil para a probabilidade 1− q de F (z|si, g, 0), i = 1, ...,m.
Utilizando agora o teorema de Scheffe, ver [34], obtem-se
Pr
[⋂di
(∣∣∣dTi ψi − dTi ψi
∣∣∣ 6√siF1−q,si,gdTi Widi
SQe
g
)]= 1− q, i = 1, ...,m
onde⋂di
indica que se consideram todos os vectores di ∈ Rni . Tem-se assim os
intervalos de confianca simultaneos, dados pelas desigualdades∣∣∣dTi ψi − dTi ψi
∣∣∣ 6√siF1−q,si,gd
Ti Widi
SQeg
, i = 1, ...,m, ver [16].
Por outro lado, para um vector bi ∈ R(Bi), i = 1, ...,m tem-se
(ψi − bi)TW−1i (ψi − bi) ∼ σ2χ2
si,δi(bi)(4.24)
com
δi(bi) =1
σ2(ψi − bi)TW−1
i (ψi − bi). (4.25)
4.5. Construcao de Modelos 65
Assim, como (4.24) e independente de SQe, para testar hipoteses do tipo
H0,i(bi) : ψi = bi, i = 1, ...,m (4.26)
obtem-se testes F com si e g graus de liberdade e estatısticas
Fi(bi) =g
si
(ψi − bi)TW−1i (ψi − bi)
SQe
(4.27)
com distribuicao F (z|si, g, δi(bi)), i = 1, ...,m. Quando a hipotese H0,i(bi) se veri-
fica, tem-se δi(bi) = 0, i = 1, ...,m e vem
F ′i(bi) =g
si
(ψi −ψi)TW−1
i (ψi −ψi)
SQe
∼ Fsi,g (4.28)
sendo estes testes estritamente nao distorcidos (seccao 2.9). Por outro lado, nao se
rejeita H0,i(bi) pelo teste de nıvel q, se e so se bi pertencer ao elipsoide de confianca
de nıvel 1− q
(ψi − ψi)TW−1
i (ψi − ψi) ≤ siF1−q,si,gSQe
g(4.29)
pelo que os testes gozam de dualidade (seccao 2.9).
Estes resultados aplicam-se a vectores ηi, i = 1, ...,m, para o que basta considerar
Bi = Igi , i = 1, ...,m.
4.5 Construcao de Modelos
De seguida ira ver-se como se constroi as a.j.c. utilizadas para descrever modelos
com encaixe e cruzamento-encaixe de factores. Esta teoria e desenvolvida em [9] e
[8], onde poderao ser consultados mais detalhes.
4.5.1 Modelos para Encaixe
Suponha-se que num delineamento se tem u factores com a1, ..., au nıveis. Num
delineamento de encaixe, em cada um dos a1 nıveis do primeiro factor estao en-
caixados os a2 nıveis do segundo factor, e assim sucessivamente ate aos au nıveis
66 4. Modelos Lineares Ortogonais
do u-esimo factor. Deste modo havera c(h) =h∏t=1
at combinacoes de nıveis para os
primeiros h factores, de tal forma que o numero total de combinacoes de nıveis sera
c = c(u). Alem do mais, cada combinacao de nıveis dos primeiros h factores encaixa
b(h) = c/c(h) combinacoes de nıveis dos restantes factores. Seja a o vector cujas
componentes sao os numeros a1, ..., au.
Assumindo que existem r replicas para cada combinacao de nıveis de factores, o
modelo para descrever este tipo de delineamento pode ser escrito na forma
y =u∑h=0
Xhαh + e (4.30)
tendo y, n = cr componentes e
Xh =
(u⊗t=1
Xh,t
)⊗ 1r (4.31)
onde
Xh,t =
Iat se t ≤ h
1at se t > h(4.32)
e X0 = 1n. O vector α0 e constituıdo apenas por uma componente, o valor medio
geral µ, enquanto que os restante vectores αh tem c(h) componentes, as quais repre-
sentam os efeitos do h-esimo factor encaixado nos h− 1 factores que o antecedem.
As matrizes
Mh = XhXTh = b(h)
h∑t=0
Qt, h = 0, ..., u (4.33)
constituem uma base para a a.j.c. A(a)*A(r) = (A(a1)*...*A(au)) *A(r), onde *
representa o produto restrito de a.j.c., sendo que as matrizes Q0, ...,Qu constituem
a base principal de A(a)*A(r). Como ja foi referido anteriormente, a a.j.c. A(r) =
1rJr, Jr e usada para descrever a existencia de replicas para cada combinacao de
4.5. Construcao de Modelos 67
nıveis de factores. A a.j.c. A(a) tera base principal da forma
Qh+1(a) =u⊗t=1
Qh,t, h = 0, ..., u (4.34)
em que a0 = 1 e
Qh,t =
Iat se t < h
Jat se t = h
Jatat
se t > h
(4.35)
onde Jat = Iat − 1at
Jat . Fazendo
Ah+1(a) =u⊗t=1
Ah,t, h = 0, ..., u
com
Ah,t =
Iat se t < h
Tat se t = h
1√at
1atT se t > h
onde Tat e a matriz que se obtem, eliminando a 1a linha igual a 1√at
1at de uma
matriz ortogonal estandardizada at × at (seccao 2.1), ter-se-a
Qh(a) = ATh (a)Ah(a), h = 1, ..., u+ 1.
As matrizes A1(a), ...,Au+1(a) sao usadas para descrever grupos de factores encai-
xados. Subsequentemente, o modelo (4.30) com r replicas, pode ser escrito na forma
canonica como
y =u∑h=0
ATh ηh + AT
u+1e∗ (4.36)
onde e∗ = Au+1y = Au+1e e
Ah+1 =
(u⊗t=1
Ah,t
)⊗ 1r
T
√r, h = 0, ..., u.
68 4. Modelos Lineares Ortogonais
4.5.2 Modelos para Cruzamento-Encaixe
Para descrever o cruzamento entre L grupos de factores encaixados cada um com
ul factores, cada factor com al(hl) nıveis, hl = 1, ..., ul e l = 1, ..., L, utilizar-se-a o
produto⊗L
l=1A(al), onde as componentes de al serao al(1), ..., al(ul), l = 1, ..., L.
Pondo Al = A(al), havera uma correspondencia entre as matrizes na base principal
de⊗L
l=1Al e os vectores h no conjunto Γ = h;hl = 0, ..., ul, l = 1, ..., L, cujas
componentes sao os valores hl = 0, ..., ul, l = 1, ..., L.
Seja Ql,1, ...,Ql,ul+1 a base principal de Al, l = 1, ..., L com
Ql,hl+1 =
ul⊗t=1
Ql,t(hl), hl = 0, ..., ul (4.37)
em que
Ql,t(hl) =
Ial(t) se t < hl
Jal(t) se t = hl
Jal(t)al(t)
se t > hl
. (4.38)
Fazendo
Al,hl+1 =
ul⊗t=1
Al,t(hl), hl = 0, ..., ul (4.39)
com
Al,t(hl) =
Ial(t) se t < hl
Tal(t) se t = hl
1√al(t)
1al(t)T
se t > hl
(4.40)
facilmente se verifica que
Ql,hl = ATl,hl
Al,hl , hl = 1, ..., ul + 1, l = 1, ..., L. (4.41)
Entao, a base principal da a.j.c A(Γ) =⊗L
l=1Al, tera matrizes da forma
Q(h) =L⊗l=1
Ql,hl+1, h ∈ Γ (4.42)
4.5. Construcao de Modelos 69
sendo facil verificar que
Q(h) = A(h)TA(h), h ∈ Γ (4.43)
com
A(h) =L⊗l=1
Al,hl+1, h ∈ Γ. (4.44)
O modelo na forma canonica para descrever delineamentos de cruzamento de L
grupos com u1, ..., uL factores encaixados, com r replicas para todas as combinacoes
de nıveis de todos os factores, pode ser escrito na forma
y =∑h∈Γ
A(h)T η(h) + A⊥Te∗ (4.45)
com η(h) = A(h)y e η(h) = A(h)µ, h ∈ Γ vectores de efeitos fixos, sendo µ =∑h∈Γ A(h)Tη(h) e e∗ = A⊥y = A⊥e com
A(h) =L⊗l=1
(ul⊗t=1
Al,t(hl)
)⊗ 1r
T
√r, h ∈ Γ (4.46)
e
A⊥ = Ic ⊗Tr (4.47)
onde Tr e obtida retirando a primeira linha igual a 1√r1r de uma matriz ortogonal
estandardizada r × r.
A unica componente do vector η(0) correspondera ao valor medio geral µ. Para
vectores h 6= 0, caso h tenha uma unica componente nao nula, este correspondera
aos efeitos desse factor, caso contrario correspondera a interaccoes entre os factores
indexados pelas componentes nao nulas.
Este tipo de delineamento sera desenvolvido e concretizado no capıtulo seguinte.
70 4. Modelos Lineares Ortogonais
5. FAMILIAS ESTRUTURADAS DE MODELOS:
CASO EQUILIBRADO
5.1 Generalidades
Uma famılia de modelos diz-se estruturada quando os modelos nela incluıdos cor-
respondem aos tratamentos doutro modelo, designado de modelo base. Os modelos
contidos na famılia designam-se de modelos elementares. Ira agora considerar-se
o caso no qual:
1. O modelo base corresponde a um cruzamento-encaixe completo e equilibrado,
ver [11], e
2. Para os modelos elementares consideram-se duas situacoes:
• regressoes lineares nas mesmas variaveis dependente e controladas;
• modelos log-lineares nos mesmos parametros, ajustados a tabelas de con-
tingencia.
Chama-se tratamento a cada combinacao de nıveis dos factores envolvidos no deli-
neamento base.
As famılias estruturadas de modelos (f.e.m.) correspondem a formalizacao e ge-
neralizacao dos delineamentos regressionais multiplos introduzidos em Mexia(1987).
A abordagem utilizada neste trabalho tem duas fases. Na primeira fase, condensa-
se a informacao dos modelos elementares em estatısticas suficientes. Na segunda fase,
72 5. Famılias Estruturadas de Modelos: Caso Equilibrado
aplicam-se os algoritmos desenvolvidos para o modelo base aos resultados obtidos
na primeira fase.
5.2 Modelo Base
Como foi atras referido, para o modelo base considera-se o cruzamento-encaixe com-
pleto e equilibrado. Nesta situacao, consideram-se todas as combinacoes de nıveis
dos factores que cruzam para as quais existira sempre igual numero de replicas.
Assim, de forma a frisar alguns detalhes, mais uma vez suponha-se que existem
L grupos com u1, ..., uL factores. O primeiro factor of l-esimo grupo tera al(1) nıveis
com l = 1, ..., L. Se ul > 1 ha encaixe para o l-esimo grupo de factores. Nesse caso,
serao encaixados al(2) nıveis do segundo factor desse grupo dentro de cada nıvel
do primeiro factor e assim sucessivamente. Existirao cl(h) =h∏p=1
al(p) combinacoes
de nıveis para os primeiros h factores, h = 1, ..., ul, no l-esimo grupo, cada um
encaixando bl(h) = cl(ul)/cl(h), h = 1, ..., ul combinacoes de nıveis dos restantes
factores do grupo, l = 1, ..., L. Alem disso, por-se-a cl(−1) = 0 e cl(0) = 1 assim
como gl(h) = cl(h)− cl(h− 1), h = 1, ..., ul, l = 1, ..., L. Deste modo, o numero total
de combinacoes de nıveis, ou seja, de tratamentos, sera c =L∏l=1
cl(ul). Se para cada
um dos c tratamentos se tomar r repeticoes, havera um total de n = c.r observacoes
neste delineamento.
Os c tratamentos podem ser representados por vectores j com componentes jl =
1, ..., cl = cl(ul), l = 1, ..., L e podem ser ordenados atraves dos ındices
i(j) = j1 +L∑l=2
(jl − 1)l−1∏h=1
ch (5.1)
com
jl = pl,1 +
ul∑h=2
(pl,h − 1)cl(h), l = 1, ..., L (5.2)
5.2. Modelo Base 73
onde pl,h = 1, ..., al(h), h = 1, ..., ul sao os nıveis dos factores do l-esimo grupo.
Havendo r observacoes por tratamento, as mesmas encontram-se agrupadas no
vector de observacoes y, estando os tratamentos ordenados de acordo com os res-
pectivos ındices.
Os factores que encaixam outro ou outros, nao interagem com os efeitos de fac-
tores do mesmo grupo, logo interaccoes so existem para nıveis conjuntos de factores
pertencendo a diferentes grupos. Seja h o vector com componentes hl = 0, ..., ul, l =
1, ..., L, que representam os ındices de factores pertencentes a diferentes grupos.
Quando hl = 0 nenhum factor do grupo l e seleccionado. Se h tiver apenas uma
componente nao nula hl′ , h indica apenas um factor, estando associado ao efeito
desse factor. Se h tiver mais do que uma componente nao nula, entao correspondera
a uma interaccao entre os factores correspondentes a essas componentes os quais
pertencem a diferentes grupos. A h = 0 estara associado o valor medio geral µ.
Sendo Γ = h;hl = 0, ..., ul, l = 1, ..., L, note-se que #(Γ) =∏L
l=1 (ul + 1).
O modelo linear na forma canonica definido na expressao (4.45) descreve a in-
fluencia dos nıveis dos factores no vector das observacoes para um delineamento de
cruzamento-encaixe. A este modelo esta associada a a.j.c A(Γ), cuja base princi-
pal sera constituıda pelas matrizes Q(h) = A(h)TA(h) com h ∈ Γ (seccao 4.5.2.).
Como foi visto na seccao 4.1, a essa algebra corresponde uma particao ortogonal do
espaco amostral, sendo deste modo a ortogonalidade do modelo assegurada.
Como foi visto na seccao 4.2, quando se admite a normalidade os η(h),h ∈ Γ e
SQe constituem uma estatıstica suficiente e completa, tendo-se η(h) ∼ N(η(h), σ2Ig(h))
com
g(h) = Car(A(h)) =L∏l=1
(cl(hl)− cl(hl − 1)). (5.3)
Por outro lado tem-se
SQ(h) = ‖η(h)‖2 = yTA(h)TA(h)y ∼ σ2χ2g(h),δ(h), h ∈ Γ (5.4)
74 5. Famılias Estruturadas de Modelos: Caso Equilibrado
com
δ(h) =1
σ2µTA(h)TA(h)µ
independente da soma de quadrados para o erro
SQe = ‖A⊥y‖2 = yTA⊥TA⊥y ∼ σ2χ2
g (5.5)
com g = n− c.
Usando o teorema Blackwell-Lehmann-Scheffe, η(h), h ∈ Γ e σ2 = SQeg
sao
UMVUE para os vectores medios η(h), h ∈ Γ e para σ2, respectivamente.
Quando nao existem efeitos ou interaccoes associadas a h, tem-se η(h) = 0,
h ∈ Γ/0.
Assim, para testar as hipoteses relativas aos efeitos fixos
H0(h) : η(h) = 0,h ∈ Γ (5.6)
usam-se os testes F com estatıstica
F(h) =g
g(h)
SQ(h)
SQe
,h ∈ Γ. (5.7)
Quando a hipotese H0(h) se verifica, δ(h) = 0, e F(h) tem distribuicao F central
com g(h) e g graus de liberdade.
5.3 Modelos Elementares
Suponha-se que o modelo base de cruzamento-encaixe tem c tratamentos ordenados
com os ındices i = i(j), i = 1, ..., c. Para cada um deste tratamentos tem-se um
modelo elementar.
5.3. Modelos Elementares 75
5.3.1 Regressoes Multiplas
Neste caso, interessa considerar que os modelos elementares sao regressoes lineares
multiplas, com a mesma variavel dependente e as mesmas k variaveis controladas
yi = Xiβi + εi, i = 1, ..., c. (5.8)
No caso regular, tem-se os mesmos valores para as k variaveis controladas em todas
as regressoes, ou seja, Xi = X, i = 1, ..., c, resultando que o numero de observacoes
por regressao e sempre igual a n. Por outro lado, assume-se tambem a homocedas-
ticidade, tomando-se σ2i = σ2, i = 1, ..., c.
Como ja foi anteriormente referido inicia-se a inferencia condensando a informacao
contida nos modelos elementares. Apenas sera abordado o caso regular, para o qual
se assume que:
• A matriz X e do tipo n × (k + 1), com vectores coluna linearmente indepen-
dentes,
• os vectores dos erros εi, i = 1, ..., c sao normais, independentes, com valores
medios nulos e matrizes de covariancia σ2In.
Assim sendo, vem
yi ∼ N(Xβi, σ
2In), i = 1, ..., c (5.9)
e como tal os estimadores dos mınimos quadrados dos βi sao
βi =(XT X
)−1XTyi ∼ N
(βi, σ
2(XT X)−1), i = 1, ..., c (5.10)
independentes das
SQEi = yTi yi − yTi Xβi, i = 1, ..., c (5.11)
as quais sao produtos por σ2 de qui-quadrados centrais com n − k − 1 graus de
liberdade, pondo-se SQEi ∼ σ2χ2n−k−1, i = 1, ..., c (seccao 2.10).
76 5. Famılias Estruturadas de Modelos: Caso Equilibrado
Os pares(βi, SQEi
), i = 1, ..., c serao estatısticas suficientes, logo incluem toda
a informacao transportada pelos vectores das observacoes dos modelos elementares.
Nos modelos regressionais multiplos, estamos interessados nos coeficientes indi-
viduais das regressoes e nas suas combinacoes lineares. Uma vez que os coeficientes
individuais sao casos particulares das suas combinacoes lineares, ir-se-ao considerar
apenas as segundas.
Assim, dado a um vector com k + 1 componentes, de coeficientes duma com-
binacao linear, pode-se associar ao modelo base um vector y, cujas componentes sao
os yi = aT βi, i = 1, ..., c. Estas componentes serao normais, independentes e com
valores medios µi = aTβi, i = 1, ..., c e variancia σ2v com
v = aT (XT X)−1a.
Consequentemente, o vector y sera tambem normal, com vector medio µ, cujas
componentes sao os valores aTβi, i = 1, ..., c e com
COV(y) = σ2vIc. (5.12)
Alem disso, y sera independente da soma da soma dos quadrados dos erros das c
regressoes
SSQE =c∑i=1
SQEi (5.13)
a qual, de acordo com a reprodutividade do qui-quadrado, sera o produto por σ2
dum qui-quadrado central com g′ = c(n− k − 1) graus de liberdade.
O vector y, com as componentes ordenadas de acordo com os ındices i = i(j),
constituira o vector de observacoes para o modelo base. Aplicando a y o algoritmo
exposto na seccao anterior, para o modelo base de cruzamento-encaixe equilibrado,
pode ser estudada a influencia dos factores do modelo base, nos valores da com-
binacoes lineares dos coeficientes das regressoes. Para isso, apenas se tem de efectuar
no modelo (4.45) as substituicoes seguintes:
5.3. Modelos Elementares 77
• y por y;
• µ por µ;
• SQe por SSQE;
• g por g′
donde η(h) = A(h)y ∼ N(η(h), σ2vIg(h)) logo
SQ(h) = yTA(h)TA(h)y ∼ σ2vχ2g(h),δ(h), h ∈ Γ (5.14)
com
δ(h) =1
σ2vµTA(h)TA(h)µ
e independente SSQE. Assim, obtem-se a estatıstica F
F(h) =g′
g(h)
SQ(h)
vSSQE,h ∈ Γ (5.15)
com g(h) e g′ graus de liberdade, para testar as hipoteses
H0(h) : η(h) = A(h)µ = 0,h ∈ Γ (5.16)
atraves das quais se testa a accao dos factores do modelo base nos valores da com-
binacoes lineares dos coeficientes das regressoes.
Em particular, se apenas interessar comparar individualmente o j-esimo coefici-
ente de todas as regressoes, toma-se para a um vector com todas as componentes
iguais a zero com excepcao da j-esima componente, com 0 ≤ j ≤ k.
Para estudar os vectores estimaveis, toma-seψ(h) = B(h)η(h)
ψ(h) = B(h)η(h)(5.17)
78 5. Famılias Estruturadas de Modelos: Caso Equilibrado
vindo ψ(h) ∼ N(ψ(h), σ2W(h)) com
W(h) = vB(h)B(h)T . (5.18)
Admita-se que, os s(h) vectores linha de B(h) sao linearmente independentes, entao
Car(B(h)) = Car(W(h)) = s(h) e W(h) sera regular, ver [38]. Para testar
hipoteses do tipo
H0(h) : ψ(h) = ψ0(h) (5.19)
com ψ0(h) ∈ R(B(h)), utilizam-se as estatısticas
F =g′
s(h)
(ψ(h)−ψ0(h))TW(h)−1(ψ(h)−ψ0(h))
SSQE(5.20)
com distribuicao F (z|s(h), g′, δ(h)) e
δ(h) =1
σ2(ψ(h)−ψ0(h))TW(h)−1(ψ(h)−ψ0(h)). (5.21)
Quando H0(h) se verifica, δ(h) = 0, pelo que o teste e estritamente nao distorcido
(seccao 2.9).
Por outro lado,
F ′(h) =g′
s(h)
(ψ(h)−ψ(h))TW(h)−1(ψ(h)−ψ(h))
SSQE∼ Fs(h),g′ (5.22)
obtendo-se o elipsoide de confianca de nıvel 1− q
(ψ(h)− ψ(h))TW(h)−1(ψ(h)− ψ(h)) 6 s(h)F1−q,s(h),g′SSQE
g′. (5.23)
Como o teste F de nıvel q nao rejeita H0(h) quando e so quando ψ0(h) pertencer ao
elipsoide de confianca de nıvel 1− q, estes testes gozam de dualidade (seccao 2.9).
Aplicando o teorema de Scheffe, ver [34], ao par (ψ(h), SSQE) vem
Pr
⋂d(h)
(∣∣∣d(h)Tψ(h)− d(h)T ψ(h)∣∣∣ 6√s(h)F1−q,s(h),g′
(d(h)TW(h)d(h)
) SSQE
g′
) = 1−q
(5.24)
5.3. Modelos Elementares 79
para todos os vectores d(h) ∈ Rn, pelo que se tem, ver [16], os intervalos de confianca
simultaneos de nıvel 1−q para parametros ρ = d(h)Tψ(h) dados pelas desigualdades
∣∣∣d(h)Tψ(h)− d(h)T ψ(h)∣∣∣ 6√s(h)F1−q,s(h),g′
(d(h)TW(h)d(h)
) SSQEg′
. (5.25)
Quando
∣∣∣ρ0(h)− d(h)T ψ(h)∣∣∣ >√s(h)F1−q,s(h),g′
(d(h)TW(h)d(h)
) SSQEg′
(5.26)
a desigualdade correspondente a d nao pode ser satisfeita para d(h)Tψ(h) = ρ0(h),
concluı-se que ρ(h) e significativamente diferente de ρ0(h) ao nıvel de significancia
q, ver [16].
Tomando-se para d(h), um vector com todas as componentes nulas, a excepcao
da i-esima e da i′-esima, respectivamente iguais a 1 e -1, obtem-se
ρ(h) = ψi(h)− ψi′(h)
podendo, assim, detectar-se os pares para os quais as componentes de ψ(h) que
diferem significativamente (metodo das comparacoes multiplas de Scheffe), ver [17].
Mais adiante no, capıtulo 6, sera abordado o caso nao equilibrado, no qual as
matrizes X(h) podem diferir de regressao para regressao.
5.3.2 Modelos Log-Lineares
Com o objectivo de mostrar a versatilidade das f.e.m., suponha-se agora que os mo-
delos elementares, em vez de regressoes multiplas, sao modelos log-lineares ajustados
a tabelas de contingencia (seccao 2.11).
Suponha-se, para isso, que existe uma tabela de contingencia por tratamento
com N celulas cada uma. Seja ni,j o numero de contagens da celula j referente a
80 5. Famılias Estruturadas de Modelos: Caso Equilibrado
tabela do tratamento i com j = 1, ..., N, i = 1, ..., c. Entao, ter-se-a
n =N∑j=1
ni,j, i = 1, ..., c,
isto e, a soma das N contagens de cada tabela totaliza sempre o mesmo valor n para
todos os tratamentos e replicas.
Assume-se que os ni,j sao independentes e tem distribuicao de Poisson com
parametros mi,j, j = 1, ..., N , i = 1, ..., c (seccao 2.11).
Seja mi o vector com componentes mi,j, j = 1, ..., N , i = 1, ..., c. Para cada
tratamento do modelo base, os modelos log-lineares sao da forma
log mi = Xθi (5.27)
onde X e a matriz do modelo igual, para todos os modelos e θi, i = 1, ..., c representa
o vector de parametros. θi e composto pelos s parametros que integram o modelo
log-linear ajustado, sendo que o numero e o tipo de parametros e igual para todos
os modelos.
Como foi visto na seccao 2.11, para n grande os estimadores de maxima verosi-
milhanca θi de θi tem distribuicao normal aproximada, sao independentes entre si
e
COV(θi) =(XTD(mi)X
)−1, i = 1, ..., c (5.28)
onde D(mi) representa a matriz diagonal, cujos elementos principais sao as compo-
nentes de mi, i = 1, ..., c.
Por outro lado, ver seccao 2.11, o desvio residual converge em distribuicao para
um qui-quadrado com N − s graus de liberdade, ou seja
G2i = 2
N∑j=1
ni,j log(ni,j/mi,j)d−→ χ2
N−s, i = 1, ..., c (5.29)
5.3. Modelos Elementares 81
sendo este independente de θi. Deste modo, os pares (θi, G2i ), i = 1, ..., c sao as
estatısticas suficientes a ser utilizadas.
Dado a um vector de coeficientes de uma combinacao linear com s componentes,
pode-se associar ao modelo base um vector y, cujas componentes sao os c valo-
res yi = aT θi, i = 1, ..., c. Estas componentes serao assimptoticamente normais,
independentes, com valores medios
µi = aTθi, i = 1, ..., c
e variancia
V (yi) = aT (XTD(mi)X)−1a.
Consequentemente, o vector y sera tambem assimptoticamente normal, com vector
medio µ, cujas componentes sao os valores aTθi e matriz de covariancia igual a uma
matriz diagonal, cujos elementos principais sao os valores V (yi), i = 1, ..., c devido a
independencia entre os yi, i = 1, ..., c. Ponha-se
COV(y) = D [V (y1), ..., V (yc)] (5.30)
ou seja, COV(y) sera uma matriz diagonal cujos elementos principais sao os c
valores V (yi), i = 1, ..., c. Alem do mais, y sera independente da soma dos desvios
residuais dos c modelos log-lineares
SG2 =c∑i=1
G2i (5.31)
a qual, de acordo com a reprodutividade do qui-quadrado, tera distribuicao as-
simptotica qui-quadrado central com g′′ = c(N − s) graus de liberdade.
O vector y com as componentes ordenadas de acordo com os ındices i = i(j),
constituira o vector de observacoes para o modelo base, ao qual se vai aplicar o algo-
ritmo exposto na seccao 5.1, para o modelo base de cruzamento-encaixe equilibrado.
82 5. Famılias Estruturadas de Modelos: Caso Equilibrado
Deste modo, pode ser estudada a influencia dos factores do modelo base, nos valores
das combinacoes lineares dos parametros dos modelos log-lineares.
Tal como quando se tem regressoes lineares, efectuando em (4.45) as substituicoes
• y por y;
• µ por µ;
• SQe por SG2;
• g por g′′
com η(h) = A(h)y e η(h) = A(h)µ, ver seccao 2.9, vem
η(h)d−→ N(η(h),A(h)D [V (y1), ..., V (yc)] A(h)T ).
Seja K(h) = A(h)D [V (y1), ..., V (yc)] A(h)T . Veja-se agora que, dado um vector
v qualquer
vTA(h)D [V (y1), ..., V (yc)] A(h)Tv = (A(h)Tv)TD [V (y1), ..., V (yc)] (A(h)Tv).
Uma vez que D [V (y1), ..., V (yc)] e definida positiva, a expressao anterior e nula, se
e so se A(h)Tv = 0, a qual se verifica se e so se v = 0, visto que os vectores linha
de A(h) sao linearmente independentes, por serem uma base ortonormada (seccao
3.1). Assim, por definicao, para um v 6= 0, vTK(h)v > 0 e portanto K(h) sera
definida positiva, logo existe K(h)−1, a qual tambem e definida positiva.
Devido ao
Proposicao 5.3.1. Teorema
Sendo Xn uma sucessao de variaveis aleatorias reais e g uma funcao continua
definida em R, se Xnd−→ X entao g(Xn)
d−→ g(X) a medida que n→∞.
5.3. Modelos Elementares 83
Demonstracao. Ver [31] e [32].
pode-se escrever
η(h)TK(h)−1η(h)d−→ χ2
g(h),δ(h), h ∈ Γ (5.32)
com
δ(h) = η(h)TK(h)−1η(h)
(seccao 2.9). Sendo esta forma quadratica independente de SG2, obtem-se a es-
tatıstica
F(h) =g′′
g(h)
η(h)TK(h)−1η(h)
SG2,h ∈ Γ (5.33)
para testar as hipoteses
H0(h) : η(h) = A(h)µ = 0,h ∈ Γ (5.34)
as quais equivalem a testar a accao dos factores do modelo base, nos valores da
combinacoes lineares dos parametros dos modelos log-lineares. Se a hipotese nula
for verdadeira, δ(h) = 0 e F(h) tera distribuicao F central com g(h) e g′′ graus de
liberdade.
No que respeita aos vectores estimaveis e as comparacoes multiplas de Scheffe,
aplicam-se os resultados apresentados na parte final da seccao anterior, apenas ha
que substituir nas expressoes (5.17) a (5.26)
W(h) = vB(h)B(h)T (5.35)
por
W(h) = B(h)K(h)B(h)T , (5.36)
SSQE por SG2 e g′ por g′′.
O caso nao equilibrado, no qual se poderiam ter diferentes matrizes X(h) de
modelo log-linear para modelo log-linear, nao e abordado, uma vez que nao faz
84 5. Famılias Estruturadas de Modelos: Caso Equilibrado
sentido comparar tabelas de contingencia com diferente numero de celulas, as quais
teriam de se ajustar modelos log-lineares com diferentes parametros.
6. MODELOS L-ORTOGONAIS PARA EFEITOS FIXOS
6.1 Projeccoes e Estatısticas
Admita-se que y ∼ N(µ, σ2In), com µ ∈ Ω = R(L), vindo
µ = Lλ. (6.1)
Diz-se que o modelo de efeitos fixos y = Lλ+ e e L-ortogonal se:
• os vectores coluna de L forem linearmente independentes;
• se tiver λ =∑m
i=1 Xiαi, constituindo as matrizes Mi = XiXTi , i = 1, ...,m,
uma base para uma a.j.c. completa A.
Seja Q1, ...,Qm a base principal de A, ter-se-a entao a matriz de transicao B =
[bi,j], i, j = 1, ...,m vindo
Mi =m∑j=1
bi,jQj (6.2)
onde Qj = ATj Aj, j = 1, ...,m.
Observe-se, agora, que a matriz de projeccao ortogonal sobre Ω, uma vez que os
vectores coluna de L sao linearmente independentes, e
P = L(LTL)−1LT (6.3)
vindo Pµ = µ e que, com Pc = In −P se tem Pcµ = 0 (seccao 2.4).
Como
86 6. Modelos L-Ortogonais para Efeitos Fixos
• y, e ∈ Rn
• Lλ ∈ Ω
• Rn = Ω Ω⊥
• y = yΩ + yΩ⊥
onde yΩ e yΩ⊥ representam os vectores projeccao ortogonal de y sobre os sub-espacos
Ω e Ω⊥ respectivamente, tem-se que (seccao 2.4)
yΩ = Py = P(Lλ+ e) = Pµ+ Pe = µ+ eΩ
e
yΩ⊥ = Pcy = Pc(Lλ+ e) = Pcµ+ Pce = eΩ⊥
donde
y = µ+ eΩ + eΩ⊥ .
Por P e Pc serem matrizes de projeccao ortogonal, logo simetricas, vem
COV(yΩ; yΩ⊥) = COV(Py; Pcy) = Pσ2InPcT = σ2PPc = 0
donde, no caso de normalidade do modelo, ha independencia entre yΩ e yΩ⊥ , ou
seja, entre as duas partes do modelo.
Tem-se ainda
1
σ2(y−µ)T (y−µ) =
1
σ2(y−µ)T (P+Pc)(y−µ) =
1
σ2(y−µ)TP(y−µ)+
1
σ2yTPcy
(6.4)
ou seja, a expressao do primeiro membro da equacao e dividido em dois termos, o
primeiro do qual vem, devido a P ser uma matriz de projeccao ortogonal,
(y−µ)TP(y−µ) = ‖Py−µ‖2 = ‖L(LTL)−1LTy−µ‖2 = ‖Lλ−Lλ‖2 = (λ−λ)TLTL(λ−λ)
(6.5)
6.2. Inferencia 87
com λ = (LTL)−1LTy, e o segundo termo, tambem devido a Pc ser uma matriz de
projeccao ortogonal, e dado por
yTPcy = yT (In −P)y = yTy − yTPy = yTy − yTLλ = ‖y − µ‖2 = SQe. (6.6)
Ter-se-a, assim, para y a densidade
n(y) =e−
12σ2 (λ−λ)
TLTL(λ−λ)−SQe
2σ2
(2π)n/2 σn(6.7)
e, atendendo ao teorema da factorizacao, ve-se que λ e SQe constituem uma es-
tatıstica suficiente. Como a distribuicao normal pertence a famılia exponencial e
o espaco parametrico contem o produto cartesiano de intervalos nao degenerados,
estas estatısticas serao tambem completas [13].
Ve-se ainda que
λ ∼ N(λ, σ2(LTL)−1)
e independente de
SQe ∼ σ2χ2g (6.8)
onde g = dim(Ω⊥) = n− Car(L) [14].
6.2 Inferencia
Como a a.j.c. A e completa, sendo n = dim(Ω) = Car(L), ter-se-a
In =m∑j=1
Qj =m∑j=1
ATj Aj (6.9)
logo, com ηj = Ajλ, j = 1, ...,m
ηj = Ajλ, j = 1, ...,m(6.10)
88 6. Modelos L-Ortogonais para Efeitos Fixos
ter-se-a
ηj ∼ N(ηj, σ2Aj(L
TL)−1ATj ), j = 1, ...,m
independente de SQe, bem comoλ =
m∑j=1
ATj Ajλ =
m∑j=1
ATj ηj
λ =m∑j=1
ATj Ajλ =
m∑j=1
ATj ηj
. (6.11)
Considerando, agora, os vectores estimaveisψ = Gλ
ψ = Gλ(6.12)
onde G e uma matriz de vectores linha linearmente independentes, tem-se ψ ∼
N(ψ, σ2W) com
W = G(LTL)−1GT
bem como ψ =
m∑j=1
Gjηj
ψ =m∑j=1
Gjηj
(6.13)
com Gj = GATj , j = 1, ...,m.
Utilizando o teorema de Blackwell-Lehmann-Scheffe (seccao 2.7), facilmente se
verifica que os λ, ηj e ψ sao estimadores UMVUE, para os vectores λ, ηj e ψ.
Ora, sendo s = Car(W), obtem-se para ψ o elipsoide de confianca
Pr
((ψ − ψ)TW+(ψ − ψ) 6 sF1−q,s,g
SQe
g
)= 1− q (6.14)
6.2. Inferencia 89
atendendo ao teorema de Scheffe tem-se
Pr
[⋂d
(∣∣∣dTψ − dT ψ∣∣∣ 6√sF1−q,s,gdTWd
SQe
g
)]= 1− q (6.15)
para todos os vectores d ∈ Rn, resultando daqui intervalos de confianca simultaneos,
dados pelas desigualdades∣∣∣dTψ − dT ψ
∣∣∣ 6√sF1−q,s,gdTWdSQeg
.
Por outro lado, para ψ0 ∈ R(G) tem-se
(ψ −ψ0)TW+(ψ −ψ0) ∼ σ2χ2s,δ (6.16)
com
δ =1
σ2(ψ −ψ0)TW+(ψ −ψ0). (6.17)
Assim, como a forma quadratica da expressao (6.16) e independente de SQe, para
testar hipoteses do tipo
H0 : ψ = ψ0 (6.18)
obtem-se testes F com estatısticas
F =g
s
(ψ −ψ0)TW+(ψ −ψ0)
SQe
(6.19)
com distribuicao F (z|s, g, δ). Quando a hipotese H0 se verifica tem-se δ = 0 e vem
F ′ = g
s
(ψ −ψ)TW+(ψ −ψ)
SQe
∼ Fs,g (6.20)
sendo estes testes nao distorcidos (seccao 2.8). Nao se rejeita H0 pelo teste de nıvel
q, se e so se ψ0 pertencer ao elipsoide de confianca de nıvel 1− q
(ψ − ψ)TW+(ψ − ψ) ≤ sF1−q,s,gSQe
g(6.21)
pelo que os testes gozam de dualidade. Se se tiver W+ = W−1, entao pode-se testar
directamente a hipotese H0 : δ = 0 e o teste sera estritamente nao distorcido (seccao
2.9).
90 6. Modelos L-Ortogonais para Efeitos Fixos
Considerem-se agora os vectores estimaveis, tal com na seccao 4.4., da formaψj = Bjηj
ψj = Bjηj
(6.22)
vindo ψj ∼ N(ψj, σ2Wj) com
Wj = BjAj(LTL)−1AT
j BTj . (6.23)
Observe-se que, os ηj e os ψj, j = 1, ...,m sao casos particulares dos vectores
estimaveis ψ, entao para o caso particular destes vectores ψj, j = 1, ...,m, ha que
substituir s por sj = Car(Wj) no teorema de Scheffe, para obter os intervalos de
confianca simultaneos∣∣∣djTψj − dj
T ψj
∣∣∣ 6 √sjF1−q,sj ,gdj
TWjdjSQeg, j = 1, ...,m.
Por outro lado, para um bj ∈ R(Bj) tem-se
(ψj − bj)TWj
+(ψj − bj) ∼ σ2χ2sj ,δj
, j = 1, ...,m (6.24)
independente de SQe, com
δj =1
σ2(ψj − bj)
TWj+(ψj − bj). (6.25)
Igualmente se obtem testes F com estatısticas
Fj =g
sj
(ψj − bj)TWj
+(ψj − bj)
SQe
(6.26)
tendo distribuicao F (z|sj, g, δj), para testar as hipoteses
H0,j : ψj = bj, j = 1, ...,m. (6.27)
Quando a hipotese H0,j se verifica, tem-se δj = 0, j = 1, ...,m e vem
F ′j =g
sj
(ψj −ψj)TWj
+(ψj −ψj)
SQe
∼ Fsj ,g (6.28)
obtendo-se, tal com atras, testes nao distorcidos.
6.3. Um Primeiro Exemplo 91
6.3 Um Primeiro Exemplo
Vai agora abordar-se, neste primeiro exemplo, um modelo para observacoes escalares,
em que o numero de repeticoes varia de tratamento para tratamento.
Seja y. o vector das medias das observacoes por tratamento. Suponha-se que
existem c tratamentos com nl observacoes, l = 1, ..., c. Entao, as componentes de y.
serao da forma
yl =
∑nli=1 ylinl
, l = 1, ..., c
em que yli, i = 1, ..., nl e a i-esima observacao do l-esimo tratamento.
y. sera um estimador de
µ. =
µ1
...
µc
= E (y.) (6.29)
e
COV (y.) =
V (y1) · · · 0
· · · . . . · · ·
0 · · · V (yc)
= σ2D
(1
n1
, ...,1
nc
)(6.30)
uma vez que
V (yl) = V
(1
nl
nl∑i=1
yli
)=
1
n2l
nl∑i=1
V (yli) =nlσ
2
n2l
=σ2
nl, l = 1, ..., c
e que os yli sao normais e independentes entre si. Tem-se, portanto
y. ∼ N
(µ., σ2D
(1
n1
, ...,1
nc
))(6.31)
o qual sera tambem independente de SQe.
92 6. Modelos L-Ortogonais para Efeitos Fixos
E facil verificar que
µ =
µ1
...
µc
=
1n1 · · · 0
.... . .
...
0 · · · 1nc
µ. = D(1n1 , ...,1nc)µ. (6.32)
em que
µl =
µl...
µl
, l = 1, ..., c
tem nl, l = 1, ..., c componentes.
Por outro lado, tambem facilmente se verifica quey. = D(
1
n1
1Tn1, ...,
1
nc1Tnc)y
µ. = D(1
n1
1Tn1, ...,
1
nc1Tnc)µ
. (6.33)
Sejam Xi, i = 1, ...,m matrizes tais que
Xi = D(1n1 , ...,1nc)Xi.
considerando (6.32) e a 1a expressao de (4.2) vem
D(1n1 , ...,1nc)µ. = µ =m∑i=1
Xiαi = D(1n1 , ...,1nc)m∑i=1
Xiαi
donde
µ. =m∑i=1
Xiαi. (6.34)
correspondendo os vectores αi, i = 1, ...,m aos efeitos e interaccoes de factores fixos.
No que se refere ao modelo (6.1), fazendo λ = µ. em (6.32), vem
L = D(1n1 , ...,1nc) (6.35)
6.3. Um Primeiro Exemplo 93
logo LTL = D(n1, ..., nc)
(LTL)−1 = D
(1
n1
, ...,1
nc
) (6.36)
vindo, devido a (6.5) e (6.33)
λ = (LTL)−1LTy = D
(1
n1
1Tn1, ...,
1
nc1Tnc
)y = y. (6.37)
independente de
SQe = yTy − yTD(1n1 , ...,1nc)y. ∼ χ2g (6.38)
com g = Car(In −D(1n1 , ...,1nc)) = n− c.
Substituindo em (6.11) vem y. =
m∑j=1
ATj ηj
µ. =m∑j=1
ATj ηj
com ηj = Ajy. e ηj = Ajµ., j = 1, ...,m com
ηj ∼ N(ηj, σ2AjD
(1
n1
, ...,1
nc
)ATj ), j = 1, ...,m
independente de SQe.
No que se segue, tem-se ψ = Gµ. =
m∑j=1
Gjηj
ψ = Gy. =m∑j=1
Gjηj
(6.39)
com Gj = GATj , em que
ψ ∼ N(ψ, σ2W) (6.40)
94 6. Modelos L-Ortogonais para Efeitos Fixos
onde
W = GD
(1
n1
, ...,1
nc
)GT .
Com ψj = Bjηj
ψj = Bjηj
(6.41)
vem ψj ∼ N(ψj, σ2Wj), onde
Wj = BjAjD
(1
n1
, ...,1
nc
)ATj BT
j . (6.42)
A partir daqui, a parte restante relativa a inferencia, processa-se tal como foi
apresentada na seccao anterior.
6.4 Modelos Regressionais Multiplos: Caso nao Equilibrado
A teoria desenvolvida nesta seccao permite abordar agora o caso nao equilibrado
das f.e.m., quando os modelos elementares sao regressoes multiplas, ou seja, o caso
em que as matrizes do modelo das regressoes podem diferir de tratamento para tra-
tamento. Assim, podem-se ter regressoes do mesmo tipo mas com diferente numero
de observacoes.
6.4.1 Estrutura
Supondo que os tratamentos do modelo base foram ordenados pelos ındices l = i(j) =
1, ..., c, referidos na seccao 5.3, para cada um dos c tratamentos do delineamento
base, existe uma regressao multipla nas mesmas k variaveis controladas
yl = Xlβl + εl, l = 1, ..., c (6.43)
6.4. Modelos Regressionais Multiplos: Caso nao Equilibrado 95
com
yl =
yl1...
ylnl
, l = 1, ..., c
os vectores das observacoes, e matrizes de modelo
Xl =
1 x
(l)11 · · · x
(l)1k
1 x(l)21 . . . x
(l)2k
......
1 x(l)nl1· · · x
(l)nlk
, l = 1, ..., c
sendo estas do tipo nl × (k + 1), l = 1, ...c, com vectores coluna linearmente inde-
pendentes e vectores dos coeficientes e de erro aleatorio
βl =
βl0...
βlk
e εl =
εl1...
εlnl
, l = 1, ..., c
respectivamente.
Alem disso, assume-se que o numero de observacoes para a l-esima regressao nl
e sempre maior ou igual ao numero de variaveis controladas k, l = 1, ..., c.
No caso standard, admite-se que Car(Xl) = k + 1, l = 1, ..., c e que
COV(εl) = σ2Inl
ou seja, exige-se que se verifique a homocedasticidade.
Assim sendo, obtem-se estimadores dos vectores dos coeficientes de cada re-
gressao da forma
βl =(XTl Xl
)−1XTl yl, l = 1, ..., c (6.44)
96 6. Modelos L-Ortogonais para Efeitos Fixos
os quais sao normais, comE(βl
)= β, l = 1, ..., c
COV(βl
)= σ2
(XTl Xl
)−1, l = 1, ..., c
(6.45)
independentes entre si e independentes das somas dos quadrados dos erros para cada
regressao, dadas por
SQEl = ylTyl − yl
T Xlβl, l = 1, ..., c (6.46)
as quais tem distribuicao produto de σ2 por um χ2nl−k−1.
Passando ao caso que interessa, dado que
µl = Xlβl, l = 1, ..., c (6.47)
e facil verificar que
µ =
µ1
...
µc
= D(X1, ..., Xc)[βT1 ...β
Tc ]T . (6.48)
Em (6.48), fazendo λ = [βT1 , ...,βTc ]T , vem
L = D(X1, ..., Xc) (6.49)
logo
LTL = D(XT1 X1, ..., X
Tc Xc). (6.50)
Com
y =
y1
...
yc
(6.51)
6.4. Modelos Regressionais Multiplos: Caso nao Equilibrado 97
devido a (6.44) vem
λ = (LTL)−1LTy = D((XT
1 X1)−1XT1 , ..., (X
Tc Xc)
−1XTc
)y =
(XT
1 X1)−1XT1 y1
...
(XTc Xc)
−1XTc yc
(6.52)
ou seja
λ = [βT
1 ...βT
c ]T . (6.53)
λ sera, pois, um estimador normal centrado, facilmente se vendo que
COV(λ) = σ2D((XT
1 X1)−1, ..., (XTc Xc)
−1)
(6.54)
independente da soma da soma dos quadrados dos erros das c regressoes
SSQE =c∑l=1
SQEl ∼ σ2χ2g′ (6.55)
com g′ =∑c
l=1 (nl − k − 1).
6.4.2 Inferencia
Tal como na seccao 6.2, com ηj = Aj[βT1 ...β
Tc ]T , j = 1, ...,m tem-se
ηj = Aj[βT
1 ...βT
c ]T ∼ N(ηj, σ2Wj), j = 1, ...,m (6.56)
onde
Wj = AjD((XT
1 X1)−1, ..., (XTc Xc)
−1)
ATj
e independente de SSQE.
No que respeita a vectores estimaveis, devido a (6.11), tem-se igualmenteψ = Gλ =
m∑j=1
Gjηj
ψ = Gλ =m∑j=1
Gjηj
(6.57)
98 6. Modelos L-Ortogonais para Efeitos Fixos
com Gj = GATj sendo
ψ ∼ N(ψ, σ2W) (6.58)
onde
W = GD((XT
1 X1)−1, ..., (XTc Xc)
−1)GT . (6.59)
tambem independente de SSQE.
Como ja foi referido no capıtulo 5, no que respeita as famılias estruturadas de
modelos, e em particular, aos modelos regressionais multiplos, esta-se interessado
em combinacoes lineares dos coeficientes das regressoes. Assim, para se obter os
vectores y e µ, cujas componentes sao os valores yl = aT βl e µl = aTβl, com
l = 1, ..., c correspondentes a combinacoes lineares dos coeficientes das c regressoes,
basta fazer em (6.57)
G = [Ic ⊗ aT ]
obtendo-se, deste modoψ = Gλ = [Ic ⊗ aT ][βT1 ...βTc ]T = µ
ψ = Gλ = [Ic ⊗ aT ][βT
1 ...βT
c ]T = y(6.60)
passando-se a ter
W = [Ic ⊗ aT ]D((XT
1 X1)−1, ..., (XTc Xc)
−1)
[Ic ⊗ aT ]T . (6.61)
Com o objectivo concluir acerca da influencia dos factores do modelo base nos
valores das combinacoes lineares nos coeficientes das regressoes, basta substituir em
(6.56) λ por µ, λ por y, obtendo-se
ηj = Ajy ∼ N(Ajµ, σ2Wj), j = 1, ...,m (6.62)
independente de SSQE, onde
Wj = Aj[Ic ⊗ aT ]D((XT
1 X1)−1, ..., (XTc Xc)
−1)
(Aj[Ic ⊗ aT ])T .
6.4. Modelos Regressionais Multiplos: Caso nao Equilibrado 99
No sentido de obter um tratamento mais geral, suponha-se agora vectores es-
timaveis do tipo ψj = Bjηj
ψj = Bjηj
(6.63)
com j = 1, ...,m, entao vem ψj ∼ N(ψj, σ2W∗
j ) independente de SSQE com
W∗j = BjWjB
Tj . (6.64)
Pretende-se testar hipoteses do tipo
Hj,0 : ψj = ψj,0, j = 1, ...,m (6.65)
com ψj,0 ∈ R(Bj), para as quais se obtem as estatısticas
Fj =g′
sj
(ψj −ψj,0)TWj∗+(ψj −ψj,0)
SSQE(6.66)
com distribuicao F (z|sj, g′, δj), sendo sj = Car(W∗j ) e
δj =1
σ2(ψj −ψj,0)TWj
∗+(ψj −ψj,0). (6.67)
Quando a hipotese Hj,0 se verifica, tem-se δj = 0 e vem
F ′j =g′
sj
(ψj −ψj)TWj
∗+(ψj −ψj)
SSQE∼ Fsj ,g′ (6.68)
sendo estes testes nao distorcidos (seccao 2.9). Nao se rejeita Hj,0, pelo teste de
nıvel q, se e so se, ψj,0 pertencer ao elipsoide de confianca de nıvel 1− q
(ψj − ψj)TW∗+(ψj − ψj) 6 sjF1−q,sj ,g′
SSQE
g′(6.69)
pelo que, os testes gozam de dualidade (seccao 2.9). Se se tiver Wj∗+ = W∗
j−1,
entao pode-se testar directamente a hipotese Hj,0 : δj = 0, j = 1, ...,m e o teste sera
estritamente nao distorcido (seccao 2.9).
100 6. Modelos L-Ortogonais para Efeitos Fixos
Aplicando o teorema de Scheffe ao par (ψj, SSQE) vem
Pr
[⋂d
(∣∣∣dTψj − dT ψj
∣∣∣ 6√sjF1−q,sj ,g′dTW∗
jdSSQE
g′
)]= 1− q (6.70)
para todos os vectores d ∈ Rn, onde os intervalos de confianca simultaneos de nıvel
1 − q, para parametros ρj = dTψj, j = 1, ...,m, sao dados pelas desigualdades, ver
[16], ∣∣∣dTψj − dT ψj
∣∣∣ 6√sjF1−q,sj ,g′dTW∗
jdSSQE
g′. (6.71)
Quando ∣∣∣ρj,0 − dT ψj
∣∣∣ >√sjF1−q,sj ,g′(dTW∗
jd) SSQE
g′(6.72)
a desigualdade correspondente a d nao pode ser satisfeita para dTψj = ρj,0, podendo
entao concluı-se que ρj e significativamente diferente de ρj,0, ao nıvel de significancia
q.
Tomando-se para d, um vector com todas as componentes nulas a excepcao da
i-esima e da i′-esima, respectivamente iguais a 1 e -1, obtem-se
ρj = ψi − ψi′
podendo assim detectar-se os pares para os quais as componentes de ψj, j = 1, ...,m
diferem significativamente.
7. ANALISE DE TRANSICOES ENTRE CLASSES DE SECA
UTILIZANDO FAMILIAS ESTRUTURADAS DE MODELOS
LOG-LINEARES
7.1 Introducao
Neste capıtulo ira ser aplicada a teoria das f.e.m. a um caso, em que os modelos
elementares sao modelos log-lineares ajustados a tabelas de contingencia. Para o
modelo base, considera-se o modelo mais simples de um “one way” com 3 tratamen-
tos.
Este estudo surge na sequencia dos trabalhos anteriores, desenvolvidos no sentido
de investigar a influencia das alteracoes climaticas na ocorrencia de secas no Alentejo
[24] e [22]. Nos referidos artigos, os quais se anexam a esta dissertacao (Apendice
C), foi aplicada uma abordagem diferente, como se podera confirmar atraves da
respectiva leitura.
Na presente abordagem, ajustaram-se modelos log-lineares a tabelas de con-
tingencia representando contagens de numero de transicoes entre classes de seca
durante um determinado perıodo de tempo, cada uma calculada a partir de uma
serie temporal. Como resultado, pretende-se inferir a respeito de diferencas signifi-
cativas entre diferentes perıodos da mesma serie temporal.
102 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
7.2 Dados
Os dados a utilizar no presente trabalho sao os mesmos ja analisados por outro
metodo em [24] e correspondem a series temporais de valores mensais de ındices
de seca “Standardized Precipitation Index” (SPI). Os dados utilizados no referido
estudo, correspondem ao perıodo Setembro 1932 - Setembro 1999, para 6 estacoes
pluviometricas na regiao do Alentejo: Portalegre, Elvas, Evora, Beja, Barrancos e
Almodovar.
Com o objectivo de comparar probabilidades de transicao entre classes de secas,
as series temporais, todas com um total de 67 anos, foram divididas nos 3 perıodos
equivalentes seguintes:
• 1o perıodo: de 1932/33 a 1954/55 com 23 anos;
• 2o perıodo: de 1955/56 a 1976/77 com 22 anos;
• 3o perıodo: de 1977/78 a 1998/99 com 22 anos.
Esta divisao, em 3 perıodos equivalentes, foi uma primeira aproximacao, no sentido
de tentar detectar uma tendencia ou um ciclo no comportamento das secas. Para
Tab. 7.1: Classificacao das classes de seca segundo o SPI
codigo classe de seca calor SPI
1 Nao seca SPI ≥ 0
2 Quase normal -1 < SPI < 0
3 Moderada -1.5 < SPI ≤ -1
4 Severa/Extrema SPI ≤ -1.5
cada uma das referidas estacoes e para os 3 perıodos temporais, foram calculadas
7.3. Ajustamento de Modelos Log-lineares com Duas Dimensoes 103
as classes de seca mensais, baseadas nas 4 classes da Tabela 7.1. Seguidamente,
com vista a obtencao das frequencias observadas de tabelas de contingencia bi-
dimensionais, calcularam-se as transicoes mensais entre todas as classes de seca de
um mes para o mes seguinte.
7.3 Ajustamento de Modelos Log-lineares com Duas Dimensoes
Tab. 7.2: Tabelas de contingencia com duas dimensoes: frequencias observadas para Por-
talegre, Elvas, Evora, Beja, Barrancos e Almodovar
1o PERIODO 2o PERIODO 3o PERIODO
Classe seca mes t Classe seca mes t+1 Classe seca mes t+1 Classe seca mes t+1
Portalegre 1 2 3 4 1 2 3 4 1 2 3 4
1 99 16 0 0 134 11 1 0 113 12 2 0
2 16 78 8 3 12 83 5 1 13 65 8 0
3 0 9 8 6 1 6 9 0 0 7 22 7
4 0 2 7 24 0 0 1 0 0 2 5 7
Elvas 1 2 3 4 1 2 3 4 1 2 3 4
1 107 10 0 0 140 13 0 0 97 8 0 1
2 11 85 10 2 12 85 5 0 9 75 9 1
3 0 13 27 4 0 5 4 0 0 9 23 7
4 0 0 6 1 0 0 0 0 0 1 8 15
Evora 1 2 3 4 1 2 3 4 1 2 3 4
1 137 14 1 0 129 9 0 0 101 10 0 0
2 16 47 10 1 9 81 7 1 9 68 4 2
3 0 10 20 6 0 7 14 3 0 5 15 10
4 0 2 5 7 0 1 3 0 0 0 11 28
Beja 1 2 3 4 1 2 3 4 1 2 3 4
1 106 12 0 0 136 13 0 0 109 12 2 0
2 13 81 9 0 12 82 8 0 13 65 5 1
3 0 9 22 5 0 7 4 1 0 7 13 5
4 0 1 4 14 1 0 0 0 0 0 6 25
Barrancos 1 2 3 4 1 2 3 4 1 2 3 4
1 117 16 0 0 121 12 0 0 109 16 0 0
2 15 83 8 2 12 70 9 2 15 54 3 2
3 1 7 4 5 1 8 20 2 0 3 20 10
4 0 3 4 11 0 2 2 3 0 1 10 20
Almodovar 1 2 3 4 1 2 3 4 1 2 3 4
1 112 13 0 0 134 8 1 0 111 12 0 0
2 14 87 5 2 9 79 8 0 11 72 9 0
3 0 6 3 3 0 8 11 3 0 7 9 6
4 0 2 4 25 0 1 2 0 0 1 4 21
104 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
Obtiveram-se tabelas de contingencia com duas dimensoes (Tabela 7.2) para cada
estacao e, dentro de cada estacao, para o 1o perıodo, 2o perıodo e 3o perıodo. Nestas
tabelas, as categorias A e B correspondem, respectivamente, a classe de seca no mes
t e a classe de seca no mes t+ 1.
As frequencias observadas nhj, representam o numero de transicoes entre a classe
de seca h no mes t e a classe de seca j no mes t + 1, h, j = 1, 2, 3, 4. Diversos
tipos de modelos para tabelas de contingencia foram testados para se ajustarem as
frequencias observadas (seccao 2.11.1). Contudo, o modelo que melhor se ajustou,
em geral, a todas as diferentes tabelas foi o modelo de quasi-associacao
log mhj = λ+ λAh + λBj + β × h× j + δhI(h = j). (7.1)
Para avaliar o ajustamento dos modelos, utilizou-se o teste do qui-quadrado
referido no final da seccao 2.11.1. Neste teste, para que o modelo seja considerado
bem ajustado, o respectivo desvio residual (G2), dado pela expressao (2.50), nao
podera exceder o quantil duma variavel qui-quadrado, para a probabilidade 0.05
e N − s = 16 − 12 = 4 graus de liberdade (χ24:0.05 = 9.4877). No seguimento,
com o objectivo de reduzir o numero de parametros do modelo ajustado aplicou-
se o metodo de “backward elimination” (seccao 2.11.1) [21]. Contudo, todos os
parametros se revelaram significativos em todos os modelos e, portanto, os modelos
permaneceram completos.
Os valores obtidos para os estimadores dos parametros do modelo log-linear de
quasi-associacao e respectivos desvios residuais para as 6 estacoes, apresentam-se na
Tabela A.1 do Apendice A.
Note-se que, os parametros λA1 e λB1 nao aparecem, por serem considerados como
ordenada na origem, sendo portanto nulos.
7.4. Analise 105
7.4 Analise
Como resultado deste estudo, pretendeu-se saber se existem diferencas significativas
entre os 3 perıodos em que se dividiram as series temporais. Tendo em vista esse
objectivo, considerou-se para modelo base, o modelo mais simples - o one-way - onde
os 3 perıodos representam os 3 tratamentos de um unico factor. Para cada um dos
3 perıodos (tratamentos) de cada estacao, existe um modelo log-linear (7.1), o qual
representado na forma matricial vem
log mi = Xθi, i = 1, 2, 3 (7.2)
onde
mi =[mi
11 mi12 mi
13 mi14 mi
21 mi22 mi
23 mi24 mi
31 mi32 mi
33 mi34 mi
41 mi42 mi
43 mi44
]Te o vector das frequencias esperadas relativo ao perıodo i com 16 componentes, e
X =
1 0 0 0 0 0 0 1 1 0 0 0
1 0 0 0 1 0 0 2 0 0 0 0
1 0 0 0 0 1 0 3 0 0 0 0
1 0 0 0 0 0 1 4 0 0 0 0
1 1 0 0 0 0 0 2 0 0 0 0
1 1 0 0 1 0 0 4 0 1 0 0
1 1 0 0 0 1 0 6 0 0 0 0
1 1 0 0 0 0 1 8 0 0 0 0
1 0 1 0 0 0 0 3 0 0 0 0
1 0 1 0 1 0 0 6 0 0 0 0
1 0 1 0 0 1 0 9 0 0 1 0
1 0 1 0 0 0 1 12 0 0 0 0
1 0 0 1 0 0 0 4 0 0 0 0
1 0 0 1 1 0 0 8 0 0 0 0
1 0 0 1 0 1 0 12 0 0 0 0
1 0 0 1 0 0 1 16 0 0 0 1
e a matriz do modelo do tipo 16× 12 e
θi =[λ λA2 λA3 λA4 λB2 λB3 λB4 β δ1 δ2 δ3 δ4
]To vector dos parametros relativo ao perıodo i com 12 componentes.
106 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
Tab. 7.3: Frequencias observadas e esperadas - Almodovar1o PERIODO 2o PERIODO 3o PERIODO
Observado Esperado Observado Esperado Observado Esperado
m11 112 112.00 134 134.00 111 111.00
m12 13 12.60 8 8.49 12 11.49
m13 0 0.37 1 0.50 0 0.50
m14 0 0.03 0 0.02 0 0.01
m21 14 14.43 9 8.53 11 11.52
m22 87 87.00 79 79.00 72 72.00
m23 5 4.94 8 8.33 9 8.30
m24 2 1.64 1 1.14 1 1.18
m31 1 0.52 0 0.46 1 0.47
m32 6 6.14 8 7.70 7 7.72
m33 3 3.00 11 11.00 9 9.00
m34 3 3.33 3 2.84 6 5.81
m41 0 0.05 0 0.01 0 0.01
m42 2 2.26 1 0.81 1 0.79
m43 4 3.69 2 2.17 4 4.20
m44 25 25.00 1 1.00 21 21.00
Considere-se agora o caso da estacao de Almodovar. Nas outras estacoes proceder-
se-a de igual forma. Na tabela 7.3 colocam-se, lado a lado, as frequencias observadas
e esperadas para os 3 perıodos.
Dado que o numero de observacoes utilizado para calcular as tabelas de con-
tingencia e grande (n = 263), os vectores estimadores da maxima verosimilhanca θ
para o 1o, 2o e 3o perıodo (Tabela 7.3) sao assimptoticamente normais, centrados
com matrizes de covariancia
COV(θ1
)=
0.64 -0.30 0.46 0.73 -0.29 0.46 0.74 -0.15 -0.49 0.54 -0.22 0.27
-0.30 0.57 0.69 1.11 0.49 0.64 1.07 -0.13 0.43 -0.22 0.17 0.25
0.46 0.69 2.65 4.00 0.62 2.51 3.92 -0.60 0.14 0.63 -0.23 1.19
0.73 1.11 4.00 6.62 1.05 3.95 6.45 -0.96 0.23 0.95 -0.04 1.55
-0.29 0.49 0.62 1.05 0.55 0.71 1.15 -0.14 0.42 -0.22 0.16 0.25
0.46 0.64 2.51 3.95 0.71 2.79 4.17 -0.61 0.15 0.63 -0.25 1.23
0.74 1.07 3.92 6.45 1.15 4.17 6.89 -0.98 0.24 0.95 -0.04 1.55
-0.15 -0.13 -0.60 -0.96 -0.14 -0.61 -0.98 0.15 0.00 -0.17 0.03 -0.27
-0.49 0.43 0.14 0.23 0.42 0.15 0.24 0.00 0.50 -0.37 0.19 0.00
0.54 -0.22 0.63 0.95 -0.22 0.63 0.95 -0.17 -0.37 0.60 -0.25 0.32
-0.22 0.17 -0.23 -0.04 0.16 -0.25 -0.04 0.03 0.19 -0.25 0.73 -0.24
0.27 0.25 1.19 1.55 0.25 1.23 1.55 -0.27 0.00 0.32 -0.24 1.02
,
7.4. Analise 107
COV(θ2
)=
0.70 -0.39 0.31 0.41 -0.39 0.31 0.41 -0.11 -0.58 0.54 -0.30 0.28
-0.39 0.88 1.16 2.10 0.77 1.04 1.96 -0.24 0.64 -0.27 0.39 0.25
0.31 1.16 3.43 5.54 1.05 3.18 5.31 -0.77 0.47 0.58 0.06 1.24
0.41 2.10 5.54 9.79 1.98 5.29 9.21 -1.31 0.90 0.75 0.53 1.51
-0.39 0.77 1.05 1.98 0.88 1.14 2.06 -0.24 0.64 -0.28 0.39 0.25
0.31 1.04 3.18 5.29 1.14 3.35 5.42 -0.77 0.46 0.58 0.05 1.23
0.41 1.96 5.31 9.21 2.06 5.42 9.54 -1.30 0.89 0.76 0.52 1.58
-0.11 -0.24 -0.77 -1.31 -0.24 -0.77 -1.30 0.19 -0.08 -0.15 -0.03 -0.28
-0.58 0.64 0.47 0.90 0.64 0.46 0.89 -0.08 0.67 -0.39 0.34 0.00
0.54 -0.27 0.58 0.75 -0.28 0.58 0.76 -0.15 -0.39 0.63 -0.34 0.36
-0.30 0.39 0.06 0.53 0.39 0.05 0.52 -0.03 0.34 -0.34 0.59 -0.20
0.28 0.25 1.24 1.51 0.25 1.23 1.58 -0.28 0.00 0.36 -0.20 2.16
e
COV(θ3
)=
0.66 -0.33 0.41 0.55 -0.33 0.41 0.56 -0.13 -0.52 0.54 -0.28 0.35
-0.33 0.75 1.00 1.85 0.67 0.89 1.75 -0.21 0.54 -0.25 0.33 0.08
0.41 1.00 3.20 5.24 0.91 2.98 5.04 -0.73 0.32 0.61 -0.01 1.01
0.55 1.85 5.24 9.31 1.77 5.01 8.89 -1.25 0.69 0.81 0.42 1.19
-0.33 0.67 0.91 1.77 0.75 0.97 1.83 -0.21 0.54 -0.25 0.33 0.08
0.41 0.89 2.98 5.01 0.97 3.13 5.14 -0.72 0.31 0.61 -0.02 1.00
0.56 1.75 5.04 8.89 1.83 5.14 9.12 -1.24 0.68 0.82 0.41 1.24
-0.13 -0.21 -0.73 -1.25 -0.21 -0.72 -1.24 0.18 -0.05 -0.16 -0.01 -0.23
-0.52 0.54 0.32 0.69 0.54 0.31 0.68 -0.05 0.58 -0.38 0.30 -0.12
0.54 -0.25 0.61 0.81 -0.25 0.61 0.82 -0.16 -0.38 0.61 -0.31 0.41
-0.28 0.33 -0.01 0.42 0.33 -0.02 0.41 -0.01 0.30 -0.31 0.56 -0.30
0.35 0.08 1.01 1.19 0.08 1.00 1.24 -0.23 -0.12 0.41 -0.30 0.92
respectivamente, dadas pela expressao (5.28).
Considere-se, agora, o vector a de coeficientes de combinacoes lineares. Se
a = [ 1 0 0 0 0 0 0 1 1 0 0 0 ]T
ou seja, se a for igual a 1a linha da matriz X, obtem-se aT θi = λ+ β+ δ1 = logm11.
Se a for igual a 2a linha da matriz X obtem-se aT θi = λ + λB2 + 2β = logm12 e
assim sucessivamente, se obtem os logaritmos de todas as frequencias esperadas mhj,
h, j = 1, 2, 3, 4 para os 3 perıodos. Portanto, o vector a neste estudo, sera um vector
que ira coincidindo com os vectores linha da matriz X, os quais sao coeficientes de
combinacoes lineares dos parametros do modelo log-linear. Desta forma, obtem-se
as frequencias esperadas para cada uma das transicoes entre as 4 classes de seca,
e faz-se a comparacao dos 3 perıodos de cada estacao, atraves da comparacao da
mesma frequencia esperada relativa aos 3 perıodos.
108 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
Tomando por exemplo
a = [ 1 0 0 1 0 0 1 16 0 0 0 1 ]T
ou seja, igual a ultima linha de X, vira
y = [logm144 logm2
44 logm344]T = [3.222 − 0.003 3.045]T
o qual e assimptoticamente normal com matriz de covariancia
COV (y) =
V (logm1
44) 0 0
0 V (logm244) 0
0 0 V (logm344)
=
0.040 0 0
0 1.000 0
0 0 0.048
cujos elementos principais sao dados por
V (logmi44) = aT COV
(θi
)a
para i = 1, 2, 3.
Uma vez que, nesta aplicacao, o modelo base so tem um factor (perıodo) com 3
nıveis, nao ha necessidade de aplicar a teoria dos modelos de cruzamento-encaixe.
Basta, para efeito do modelo base, considerar uma matriz ortogonal estandardizada
do tipo 3× 3
P3 =
1√3
1√3
1√3
− 1√2
0 1√2
1√6− 2√
61√6
retirar-lhe a 1a linha e obter
A =
− 1√2
0 1√2
1√6− 2√
61√6
vindo o vector de efeitos fixos
η = Ay =[
-0.125 2.561]T
7.4. Analise 109
com matriz de covariancia
K = ACOV (y) AT =
0.044 0.002
0.002 0.681
.Somando os desvios residuais dos 3 modelos log-lineares, obtem-se SG2 = 4.753 e,
por fim, a estatıstica
F =g′′
g
ηTK−1η
SG2= 12.665
com distribuicao F central com 2 e 12 graus de liberdade, a qual se utiliza para
testar a hipotese nula
H0 : η = 0
ou seja − 1√2
0 1√2
1√6− 2√
61√6
µ1
µ2
µ3
=
0
0
ou seja −µ1 + µ3
µ1 − 2µ2 + µ3
=
0
0
o que e o mesmo que testar µ1 = µ2 = µ3.
Sendo o quantil de uma F , com 2 e 12 graus de liberdade, para um nıvel de 5%
igual a 3.885, conclui-se que existem diferencas significativas entre os 3 perıodos no
que diz respeito a transicao da classe de seca 4 para ela propria.
Com vista a descobrir entre que perıodos existem diferencas significativas, de
seguida ira aplicar-se o metodo das comparacoes multiplas de Scheffe. Interessa
comparar o 1o com o 2o perıodo, 1o com o 3o perıodo e 2o com o 3o perıodo. Para
tal considera-se no teorema de Scheffe (expressao (5.26))
• uma matriz A = I3;
110 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
• uma matriz B = I3;
• um vector d que devera ser igual a
1. d = [1 − 1 0]T para comparar o 1o com o 2o perıodo;
2. d = [1 0 − 1]T para comparar o 1o com o 3o perıodo;
3. d = [0 1 − 1]T para comparar o 2o com o 3o perıodo, e
• ρ0 = 0,
obtendo-se, para o primeiro membro de (5.26)
| 0− dT y |
e para o segundo membro√2F0.05,2,12(dTCOV(y)d)
SG2
12.
Na tabela 7.4 apresentam-se os valores obtidos para o 1o e 2o membro de cada
uma das comparacoes de perıodos, duas a duas. Estes resultados sao indicativos
da existencia, com 95% de confianca, de diferencas significativas entre o 1o e o 2o
perıodo e entre o 2o e o 3o na m44, ou seja nas transicoes da classe de seca 4 para
ela propria. O numero destas transicoes e indicativo da existencia e permanencia
de seca severa/extrema num determinado local, durante um determinado perıodo.
Sendo m44 no 1o, 2o e 3o perıodo igual a 25, 1, 21 respectivamente (Tabela 7.3),
conclui-se que, no que diz respeito a seca severa/extrema na estacao de Almodovar,
o 1o e o 3o perıodo sao semelhantes, sendo caracterizados pela existencia de mais
secas severas/extremas, comparativamente com o perıodo do meio, no qual quase
nao existem secas de classe 4.
Para todas as outras transicoes entre classes de seca, foram realizados o teste F
e as comparacoes multiplas de Scheffe, tendo-se verificado tambem a existencia de
7.5. Resultados e Conclusoes 111
Tab. 7.4: Resultado das comparacoes multiplas de Scheffe para Almodovar
perıodos 1o membro sinal 2o membro conclusao
1o e 2o 3.225 > 1.789 ha diferencas significativas
1o e 3o 0.177 < 0.519 nao ha diferencas significativas
2o e 3o 3.048 > 1.796 ha diferencas significativas
diferencas significativas entre o 1o e o 2o perıodo para a m33 (numero de transicoes
entre a classe de seca 3 e ela propria). Da interpretacao deste resultado pode-se
concluir que, em termos de secas moderadas na estacao de Almodovar, o 2o perıodo
e significativamente superior ao 1o.
7.5 Resultados e Conclusoes
Na tabela 7.5 apresenta-se os valores da estatıstica F obtidos para as 6 estacoes. A
negrito encontram-se os valores de F que superaram o quantil de uma distribuicao
F com 2 e 12 graus de liberdade e nıvel 0.05, ou seja, os casos em que existem
diferencas significativas entre os 3 perıodos.
Nas tabelas A.2 e A.3 do Apendice A, apresentam-se os resultados da aplicacao
do metodo das comparacoes multiplas de Scheffe aos casos onde se detectaram di-
ferencas significativas entre os 3 perıodos no teste de hipoteses anterior. A negrito,
na 1a coluna, estao os casos em que se considera haver, com 95% de confianca,
diferencas significativas entre dois dos perıodos. Nalguns casos, o 1o membro da
desigualdade (5.26) nao supera o 2o membro. No entanto, como o teste F consi-
dera que existem diferencas para esses casos e o metodo das comparacoes multiplas
de Scheffe se sabe ser muito conservador, considerou-se que havia, efectivamente,
diferencas significativas entre os correspondentes 2 perıodos.
112 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
Tab. 7.5: Valores da estatıstica F para Portalegre, Elvas, Evora, Beja, Barrancos e Al-
modovar
F0.05,2,12 = 3.885 Portalegre Elvas Evora Beja Barrancos Almodovar
m11 3.023 4.310 6.758 1.742 0.719 3.563
m12 0.647 0.537 1.485 0.003 1.301 1.072
m13 0.204 0.051 0.013 0.181 0.001 0.070
m14 0.000 0.198 0.176 0.901 0.002 0.166
m21 0.360 0.337 3.390 0.004 0.471 1.929
m22 1.192 0.399 10.375 0.901 6.749 1.787
m23 0.497 1.200 2.330 0.175 3.335 1.465
m24 1.220 0.244 0.216 0.345 0.306 0.219
m31 0.257 0.110 0.034 0.103 0.000 0.012
m32 0.322 1.427 3.086 0.327 3.405 0.314
m33 4.932 6.253 1.478 3.925 10.740 5.027
m34 2.233 2.131 5.383 1.335 7.591 1.712
m41 0.008 0.145 0.060 0.446 0.003 0.775
m42 1.162 0.160 0.246 0.031 0.531 1.966
m43 2.282 2.215 5.361 1.610 6.464 0.945
m44 9.127 6.329 23.352 4.529 11.557 12.665
O principal objectivo da realizacao deste estudo foi inferir sobre a evolucao das
secas de gravidade alta, na regiao do Alentejo, durante o perıodo de Set.1932 -
Set.1999. Trata-se de tentar perceber se, de facto, existe uma tendencia crescente
de agravamento da frequencia e severidade das secas, que podera ser atribuıda a
alteracoes climaticas. Ou se, em vez disso, podera existir um perıodo de retorno de
secas, o qual estaria relacionado com uma variabilidade natural de longo termo.
Os resultados obtidos, atraves da aplicacao das f.e.m., revelaram a existencia de
diferencas significativas, essencialmente ao nıvel das transicoes da classe de seca 4
para ela propria (m44) e da classe de seca 3 para ela propria (m33), e tambem nal-
guns casos, ao nıvel das transicoes entre a classe 4 e 3 e vice-versa (m43 e m34). Nas
transicoes de 1 para 1 e 2 para 2, tambem foram encontradas algumas diferencas
significativas. Contudo, para inferir a respeito de seca grave interessam principal-
mente as transicoes que envolvem a classe de seca 4 e tambem a 3, sendo esta ultima
menos importante.
7.5. Resultados e Conclusoes 113
Relativamente a m44, para Barrancos e Almodovar, as diferencas significativas
foram entre o 1o e o 2o e o 2o e o 3o perıodos, sendo o 1o e o 3o perıodos semelhan-
tes, ambos com maior frequencia de secas severas/extremas. Este comportamento
e mais consistente com a hipotese de existencia de uma periodicidade relacionada
com variabilidade natural de longo termo. Nas restantes localidades, este compor-
tamento nao foi tao evidente. Em Portalegre, o 1o perıodo difere significativamente
dos outros dois, no sentido em que teve mais secas severas/extremas. Em Elvas,
Evora e Beja, o 3o perıodo difere do 1o e 2o, por ter mais secas severas/extremas.
Duma maneira geral, o 2o perıodo e caracterizado por quase nao ter registado secas
severas/extremas.
No que diz respeito a secas moderadas (m33), em Evora nao ha diferencas signi-
ficativas. Nos outros locais, para Elvas e Beja, nao existem diferencas entre o 1o e o
3o perıodo, ambos com mais secas moderadas do que o 2o. Barrancos e Almodovar
caracterizam-se por terem diferencas entre o 1o perıodo e os outros dois, ambos com
mais secas moderadas.
No que diz respeito as transicoesm43 em34, as diferencas significativas sao sempre
entre o 2o e o 3o perıodo, tendo o 3o mais secas que o 2o.
Salvo algumas excepcoes, pode-se dizer que os resultados da presente aborda-
gem nao contradizem os resultados obtidos em Moreira et al.(2006), os quais foram
obtidos atraves duma outra abordagem, utilizando racios de frequencias espera-
das (odds) e correspondentes intervalos de confianca assimptoticos. Nesse estudo
foi revelado que, duma maneira geral, o 1o e o 3o perıodos eram semelhantes em
termos de probabilidades de transicao entre as classes de seca mais altas, tendo-
se registado, precisamente nesses perıodos, as maiores ocorrencias de secas seve-
ras/extremas. Consequentemente, concluia-se que, nos dados analisados, nao se en-
controu evidencia de existir uma tendencia de aumento da frequencia e severidade
114 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares
de secas no Alentejo. A mesma conclusao pode ser tirada do presente estudo.
8. ANALISE DE DIFERENCAS SIGNIFICATIVAS AO NIVEL
DAS OCORRENCIAS DE SECA NO SUL DE PORTUGAL
8.1 Introducao
Neste capıtulo, aplica-se de novo a teoria das f.e.m., a um caso em que os modelos
elementares sao log-lineares, mas desta vez com um objectivo diferente.
Nesta segunda aplicacao a hidrologia, dividiu-se o Alentejo em 4 zonas de acordo
com 2 factores (latitude e longitude), cada factor com 2 nıveis (norte e sul, oeste e
leste) e para cada zona escolheram-se 10 estacoes que nao apresentavam diferencas
significativas entre elas, as quais serao consideradas como replicas num modelo de
cruzamento de 2 factores (Tabela 8.1). Teve-se como objectivo, encontrar diferencas
significativas, ao nıvel das transicoes entre classes de seca, entre o norte e o sul e o
oeste e o leste do Alentejo.
8.2 Dados
Os dados a utilizar no presente trabalho correspondem igualmente a series temporais
de valores mensais de indices de seca “Standardized Precipitation Index (SPI)”, para
o perıodo Setembro 1932 - Setembro 1999 (67 anos), para as 40 estacoes na regiao
do Alentejo referidas na Tabela 8.1.
Neste estudo, o objectivo e comparar probabilidades de transicao entre classes de
secas entre estacoes e nao entre perıodos da mesma estacao. Para tal, calcularam-se
116 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
para cada estacao, tabelas de contingencia do mesmo tipo das do estudo anterior,
com duas categorias correspondentes a classe de seca no mes t e a classe de seca no
mes t+ 1, contemplando o perıodo total de 67 anos (Tabelas B.1 e B.2 do Apendice
B).
A estas tabelas, ajustaram-se os modelos log-lineares de quasi-associacao (ex-
pressao (7.1)) e os valores obtidos, para os estimadores dos parametros do modelo
e respectivos desvios residuais para as 40 estacoes, apresentam-se na Tabela B.3 do
Apendice B. Note-se que, o numero de observacoes n utilizado para calcular todas
as tabelas de contingencia, foi de 803 contagens.
Tab. 8.1: Definicao das zonas 1, 2, 3 e 4Zona 1: Latitude > 38.13 e Longitude > 8.05 Zona 2: Latitude > 38.13 e Longitude ≤ 8.05
Longitude Latitude Longitude Latitude
Chouto 8.21 39.17 Nisa 7.38 39.31
Lamarosa 8.28 39.04 Castelo de Vide 7.27 39.25
Lavre 8.21 38.47 Portalegre 7.25 39.17
Canha 8.37 38.46 Arronches 7.18 39.07
Reguengos 8.53 38.42 Avis 7.54 39.04
Montemor-o-Novo 8.13 38.39 Pavia 8.01 38.54
Aguas de Moura 8.41 38.35 Arraiolos 8.00 38.43
B. Pego do Altar 8.24 38.25 Vila Vicosa 7.25 38.47
Comporta 8.47 38.23 Evora 7.54 38.34
Torrao 8.13 38.17 Viana do Alentejo 8.00 38.19
Zona 3: Latitude ≤ 38.13 e Longitude > 8.05 Zona 4: Latitude ≥ 38.13 e Longitude ≤ 8.05
Longitude Latitude Longitude Latitude
Grandola 8.33 38.11 Amareleja (D.G.R.N.) 7.14 38.13
Alvalade 8.24 37.57 Cuba 7.53 38.10
Cercal do Alentejo 8.40 37.48 Barrancos 6.58 38.08
Reliquias 8.29 37.42 Beja 7.52 38.01
Aldeia de Palheiros 8.15 37.36 Serpa 7.36 37.57
Saboia 8.30 37.29 Trindade 7.54 37.53
S. Marcos da Serra 8.23 37.22 Algodor 7.48 37.45
Aljezur 8.50 37.19 Martim Longo 7.77 37.44
Monchique 8.33 37.19 Almodovar 8.04 37.31
S. Bartol. Messines 8.18 37.15 S.B.Alportel 7.90 37.17
8.3. Analise da Homogeneidade 117
8.3 Analise da Homogeneidade
Tendo em vista o objectivo referido na introducao deste capıtulo, considerou-se para
modelo base o modelo “two-way” com interaccao (cruzamento de 2 factores), em que
o 1o factor e a latitude com os nıveis
1. norte: latitude > 38.13;
2. sul: latitude ≤ 38.13;
e o 2o factor e a longitude com os nıveis
1. oeste: longitude > 8.05;
2. leste: longitude ≤ 8.05.
Desta forma, foram definidas 4 zonas, cada uma contendo 10 estacoes, as quais irao
ser consideradas como replicas nos 4 tratamentos do modelo base (Tabela 8.1). Antes
de passar efectivamente a construcao do modelo “two-way”, em primeiro lugar foi
necessario saber se cada uma das 4 zonas definidas eram homogeneas, ou seja, se as
estacoes dentro se cada zona, nao apresentavam diferencas significativas entre elas
ao nıvel das transicoes entre classes de seca. Para tal, realizou-se um delineamento
“one-way” dentro de cada zona, considerando as 10 estacoes como tratamentos de
um unico factor estacao.
Para cada estacao dentro de cada zona (Tabela 8.1) existe ajustado um modelo
log-linear
log mi = Xθi,i = 1, ..., 10 (8.1)
com
mi =[mi
11 mi12 mi
13 mi14 mi
21 mi22 mi
23 mi24 mi
31 mi32 mi
33 mi34 mi
41 mi42 mi
43 mi44
]T,
118 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
X =
1 0 0 0 0 0 0 1 1 0 0 0
1 0 0 0 1 0 0 2 0 0 0 0
1 0 0 0 0 1 0 3 0 0 0 0
1 0 0 0 0 0 1 4 0 0 0 0
1 1 0 0 0 0 0 2 0 0 0 0
1 1 0 0 1 0 0 4 0 1 0 0
1 1 0 0 0 1 0 6 0 0 0 0
1 1 0 0 0 0 1 8 0 0 0 0
1 0 1 0 0 0 0 3 0 0 0 0
1 0 1 0 1 0 0 6 0 0 0 0
1 0 1 0 0 1 0 9 0 0 1 0
1 0 1 0 0 0 1 12 0 0 0 0
1 0 0 1 0 0 0 4 0 0 0 0
1 0 0 1 1 0 0 8 0 0 0 0
1 0 0 1 0 1 0 12 0 0 0 0
1 0 0 1 0 0 1 16 0 0 0 1
e
θi =[λ λA2 λA3 λA4 λB2 λB3 λB4 β δ1 δ2 δ3 δ4
]Ttal como no capıtulo anterior.
De seguida, considera-se um vector a de coeficientes de combinacoes lineares,
que vao coincidindo com os vectores linha da matriz X, os quais sao coeficientes de
combinacoes lineares dos parametros do modelo log-linear, de forma a obter cada
uma das frequencias esperadas, para as transicoes entre classes de seca.
Por exemplo, considerando que se esta a comparar a frequencia m44 em todas as
estacoes da zona 1, vem
y = [logm144 logm2
44 ... logm1044]T
com matriz de covariancia
COV (y) =
V (logm1
44) ... 0
... ... ...
0 ... V (logm1044)
em que
V (logmi44) = aT COV
(θi
)a
para i = 1, ..., 10.
8.4. Modelo Base “Two-Way” 119
Analogamente ao que se fez na aplicacao anterior, utilizando agora uma matriz
A, resultante de eliminar a 1a linha de uma matriz ortogonal estandardizada P10
do tipo 10× 10, testa-se a hipotese nula
H0 : η = Aµ = 0
o que e o mesmo que testar µ1 = ... = µ10.
Com K = ACOV (y) AT , a matriz de covariancia de η = Ay e SG2, a soma
dos desvios residuais dos 10 modelos log-lineares obtem-se a estatıstica
F =g′′
g
ηTK−1η
SG2
com distribuicao F central com g = 9 e g′′ = 40 graus de liberdade.
No que diz respeito a transicao da classe de seca 4 para a classe de seca 4, os
resultados obtidos sao os seguintes
F F0.05,9,40
Zona 1 0.664 < 2.124
Zona 2 1.019 < 2.124
Zona 3 0.594 < 2.124
Zona 4 0.954 < 2.124
donde se conclui que nao existem diferencas significativas entre as 10 estacoes de cada
zona. No que diz respeito as outras transicoes entre classes de seca, as conclusoes
sao similares.
8.4 Modelo Base “Two-Way”
Na construcao do modelo base “two-way” ira aplicar-se a teoria dos modelos de
cruzamento-encaixe apresentada na seccao 5.2. Assim sendo, considere-se que se
120 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
tem 2 grupos de factores com 1 factor cada, L = 2, u1 = 1 e u2 = 1. O factor do
1o grupo tem a1(1) = 2 nıveis, e o factor do 2o grupo tem a2(1) = 2 nıveis. Deste
modo, tem-se c = 4 tratamentos, cada um com r = 10 replicas, resultando que o
numero total de observacoes sera n = 40.
Nesta situacao, o vector h sera igual a cada um dos vectores seguintes:
• h0 = [0 0]T indicando a media geral;
• h1 = [1 0]T indicando o efeito principal do 1o factor (latitude);
• h2 = [0 1]T indicando o efeito principal do 2o factor (longitude);
• h3 = [1 1]T indicando a interaccao entre o 1o factor e o 2o factor,
vindo Γ = h0,h1,h2,h3. Entao, o modelo base na forma canonica, vem
y = A(h0)T η(h0) + A(h1)T η(h1) + A(h2)T η(h2) + A(h3)T η(h3) + e
com
A(h0) = A1,1(0)⊗A2,1(0)⊗ 110T
√10
=12T
√2⊗ 12T
√2⊗ 110T
√10
=140T
√40,
A(h1) = A1,1(1)⊗A2,1(0)⊗ 110T
√10
= T2 ⊗12T
√2⊗ 110T
√10
onde T2 = [ 1√2− 1√
2] e obtida retirando a 1a linha a matriz ortogonal estandardizada
P2 =
1√2
1√2
1√2− 1√
2
,vindo
A(h1) =1√40
[1 ...1︸︷︷︸10
1 ...1︸︷︷︸10
−1 ...− 1︸ ︷︷ ︸10
−1 ...− 1︸ ︷︷ ︸10
],
8.5. Resultados e Conclusoes 121
A(h2) = A1,1(0)⊗A2,1(1)⊗110T
√10
=12T
√2⊗T2⊗
110T
√10
=1√40
[1 ...1︸︷︷︸10
−1 ...− 1︸ ︷︷ ︸10
1 ...1︸︷︷︸10
−1 ...− 1︸ ︷︷ ︸10
],
e
A(h3) = A1,1(1)⊗A2,1(1)⊗110T
√10
= T2⊗T2⊗110T
√10
=1√40
[1 ...1︸︷︷︸10
−1 ...− 1︸ ︷︷ ︸10
−1 ...− 1︸ ︷︷ ︸10
1 ...1︸︷︷︸10
].
Seja yh,j,k a k-esima observacao do nıvel h do 1o factor e nıvel j do 2o factor,
com k = 1, ..., 10 e h, j = 1, 2. Ordenem-se, agora, estas observacoes do modelo base
pelos ındices i, da seguinte forma:
i → (h, j, k)
1 → (1,1,1)
... → ... zona 1
10 → (1,1,10)
11 → (1,2,1)
... → ... zona 2
20 → (1,2,10)
21 → (2,1,1)
... → ... zona 3
30 → (2,1,10)
31 → (2,2,1)
... → ... zona 4
40 → (2,2,10)
8.5 Resultados e Conclusoes
Havendo para cada i = 1, ..., 40, um modelo log-linear ajustado, entao para se obter
o vector y considere-se
a = [ 1 0 0 1 0 0 1 16 0 0 0 1 ]T
obtendo-se
yi = aT θi = logmi44, i = 1, ..., 40
logo
y = [logm144 ... logm40
44]T .
122 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
As componentes de y apresentam-se na Tabela B.4 do Apendice B, assim como os
valores principais da matriz COV(y) = D[V (y1), ..., V (y40)].
Efectuando os calculos, os vectores estimadores dos efeitos fixos reduzem-se aos
valores
η(h0) = A(h0)y = 23.757
η(h1) = A(h1)y = −0.042
η(h2) = A(h2)y = 0.639
η(h3) = A(h3)y = 0.069
com variancia
K = K(h0) = K(h1) = K(h2) = K(h3) = A(h0)COV(y)A(h0)T = 0.024.
vindo
η(h0)TK−1η(h0) = 23802.951
η(h1)TK−1η(h1) = 0.076
η(h2)TK−1η(h2) = 17.234
η(h3)TK−1η(h3) = 0.199
g = g(h0) = g(h1) = g(h2) = g(h3) = 1.
A soma dos desvios residuais dos 40 modelos log-lineares totaliza SG2 = 174.012,
com g′′ = (16− 12)× 4× 10 = 160, obtendo-se, for fim, as estatısticas F para cada
vector h
F(h0) =g′′
g
η(h0)TK−1η(h0)
SG2= 21886.318
F(h1) =g′′
g
η(h2)TK−1η(h1)
SG2= 0.070
F(h2) =g′′
g
η(h1)TK−1η(h2)
SG2= 15.846
F(h3) =g′′
g
η(h3)TK−1η(h3)
SG2= 0.183
8.5. Resultados e Conclusoes 123
todas com distribuicao F central com 1 e 160 graus de liberdade. As hipoteses que
interessam testar sao as seguintes:
• H0(h1) : η(h1) = 0 relativa ao efeito da latitude;
• H0(h2) : η(h2) = 0 relativa ao efeito da longitude;
• H0(h3) : η(h3) = 0 relativa a interaccao latitude-longitude,
o que se traduz em testar
• µ1 + ...+ µ10 + µ11 + ...+ µ20 = µ21 + ...+ µ30 + µ31 + ...+ µ40;
• µ1 + ...+ µ10 + µ21 + ...+ µ30 = µ11 + ...+ µ20 + µ31 + ...+ µ40;
• µ1 + ...+ µ10 + µ31 + ...+ µ40 = µ11 + ...+ µ20 + µ21 + ...+ µ30,
respectivamente, ou seja
• zona 1 + zona 2 = zona 3 + zona 4;
• zona 1 + zona 3 = zona 2 + zona 4;
• zona 1 + zona 4 = zona 2 + zona 3.
Sendo o quantil de uma F , com 1 e 160 graus de liberdade, para um nıvel de
5%, igual a 3.9, o unico caso em que F supera o valor 3.9, corresponde a hipotese
H0(h2) : η(h2) = 0, relativa ao efeito da longitude. Daı, se conclui que existem
diferencas significativas entre os 2 nıveis do factor longitude, no que diz respeito ao
numero de transicoes entre a classe de seca 4 para ela propria, ou seja, na persistencia
da classe de seca severa/extrema.
Os valores da estatıstica F(h) com h = h1,h2,h3 para todas as transicoes entre
classes de seca, apresentam-se na Tabela 8.2. A negrito, encontram-se os valores
124 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
Tab. 8.2: Valores das estatısticas F(h) para as diferentes frequencias esperadas do numero
de transicoes entre classes de seca
F0.05;1;160 = 3.9 m11 m12 m13 m14
Longitude 2.506 2.074 0.940 1.910
Latitude 0.047 0.015 0.352 0.155
Interaccao 1.016 3.173 0.036 0.749
m21 m22 m23 m24
Longitude 2.249 11.199 1.294 0.758
Latitude 0.005 1.416 0.526 1.964
Interaccao 3.303 0.094 0.211 1.220
m31 m32 m33 m34
Longitude 0.923 1.435 12.590 1.249
Latitude 0.419 0.741 2.932 0.046
Interaccao 0.082 0.027 0.257 0.404
m41 m42 m43 m44
Longitude 1.640 0.377 0.547 15.846
Latitude 0.125 1.725 0.037 0.070
Interaccao 0.984 1.906 0.135 0.183
em que F(h) supera o quantil F0.05;1;160 = 3.9. Os resultados obtidos na Tabela
8.2 apontam apenas para a existencia de diferencas significativas ao nıvel do factor
longitude, ou seja, entre o oeste e o leste no que diz respeito as transicoes m22, m33 e
m44. No que respeita ao factor latitude, nao foram detectadas diferencas significati-
vas entre o norte e o sul, nem interaccoes entre ambos os factores. Conjugando estes
resultados com os valores das frequencias observadas para cada uma das transicoes
entre classes de seca (Tabelas B.1 e B.2 - Apendice B), pode-se concluir com 95%
de confianca que:
1. A persistencia da classe de seca 4 (severa/extrema) e significativamente maior
no oeste que no leste do Alentejo;
2. A persistencia da classe de seca 3 (moderada) e significativamente maior no
leste que no oeste do Alentejo;
3. A persistencia da classe de seca 2 (ligeira) e significativamente maior no leste
8.5. Resultados e Conclusoes 125
que no oeste do Alentejo.
126 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal
9. MODELACAO REGRESSIONAL DA REMOCAO
ELECTRODIALITICA DE METAIS PESADOS DE RESIDUOS
DE MADEIRA
9.1 Introducao
No estudo apresentado neste capıtulo foi aplicada a teoria das f.e.m. desta vez ao
caso em que os modelos elementares sao regressoes polinomiais do 3o e do 4o grau
cujas variaveis controladas sao o tempo, em dias, e as suas potencias. Para o modelo
base considerou-se mais uma vez o modelo “one way”, visto que os dados disponıveis
nao permitiram a realizacao de uma analise com dois ou mais factores.
Este estudo surgiu na sequencia de um trabalho anterior que teve como objectivo
saber qual dos tratamentos aplicados era mais eficiente na remocao conjunta de
diferentes metais pesados de resıduos de madeira [25]. Como resultado do presente
estudo foi produzido o artigo Moreira et al.(2005b) o qual e incluıdo no Apendice C
desta dissertacao.
9.2 Experiencias e Dados
Os dados utilizados resultaram da realizacao de experiencias laboratoriais de remocao
electrodialıtica dos metais pesados cobre, cromio e arsenio (adiante designados pe-
los seus sımbolos quımicos Cu, Cr e As respectivamente) de resıduos de madeira
128 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
tratada com CCA - Chomated Copper Arsenate, um preservante de madeiras muito
utilizado. O metodo utilizado nas experiencias combina o movimento electrocinetico
de ioes com o princıpio da electrodialise.
O metodo consistiu em aplicar varios nıveis de corrente electrica durante um
determinado perıodo, a uma matriz constituıda por estilha, proveniente de diversos
postes de madeira tratada, a qual foi impregnada numa solucao de um agente adju-
vante cujo proposito foi o de facilitar a mobilidade do contaminantes quando sujeitos
ao campo electrico. Todas as experiencias foram realizadas numa celula laboratorial
electrodialıtica desenvolvida especialmente para a aplicacao do metodo referido. A
celula electrodialıtica e divida em tres compartimentos: um compartimento central
onde a estilha e colocada e dois compartimentos dos electrodos (catodo ou electrodo
negativo + catolito) e (anodo ou electrodo positivo + anolito) [25]. Os comparti-
mentos dos electrodos e o compartimento central estao separados por membranas
de troca ionica, as quais apenas permitem a passagem de ioes no sentido do com-
partimento central para os compartimentos dos electrodos.
Foram realizadas 12 experiencias correspondentes a diferentes tratamentos que
decorreram durante 14 dias e uma mais que durou 28 dias (Tabela 9.1). Seis solucoes
de agente adjuvante foram utilizadas: agua, 2.5% acido oxalico, mistura de 2.5%
acido oxalico com 5% acido formico, 5% acido formico, 2.5% EDTA e 1.25% NaCl.
A corrente inicial aplicada a celula electrodialıtica tambem variou: 0, 20, 40, 60, 80
e 120 mA.
Antes do inıcio das experiencias, foi medida a concentracao de Cu, Cr e As em
diversas amostras de estilha e calculada a media e desvio padrao das concentracoes
para cada um dos tres metais pesados. Durante cada experiencia, amostras das
solucoes nos dois electrolitos (catolito e anolito) foram periodicamente recolhidas e
analisadas para determinacao das concentracoes de Cu, Cr e As. No fim de cada
9.2. Experiencias e Dados 129
Tab. 9.1: Tratamentos (condicoes experimentais)Tratamentos Agente Adjuvante Corrente Inicial (mA) Duracao (dias)
1 agua 0 14
2 agua 11.6 14
3 2.5% acido oxalico 0 14
4 2.5% acido oxalico 40 14
5 2.5% acido oxalico 60 14
6 2.5% acido oxalico 80 14
7 2.5% acido oxalico 120 14
8 5% acido formico:2.5% acido oxalico 0 14
9 5% acido formico:2.5% acido oxalico 40 14
10 5% acido formico 40 14
11 2.5% EDTA 40 14
12 1.25% NaCl 40 14
13 2.5% acido oxalico 20 28
experiencia foi medida a quantidade de cada dos metais depositados nas membranas
de troca ionica e no electrodo negativo ou catodo. Por fim foi medida tambem a
concentracao de Cu, Cr e As na estilha, apos o final das experiencias. Deste modo,
tres diferentes tipos de dados experimentais estavam disponıveis para analise:
1. Concentracao de Cu, Cr e As no catolito e anolito ao longo do tempo de
duracao das experiencias (mg/L);
2. Eficiencia de remocao (%) calculada com base na concentracao inicial e final
de Cu, Cr e As na estilha;
3. Quantidades de Cu, Cr e As depositadas no final das experiencias nas mem-
branas de troca ionica e no catodo (mg).
Numa primeira fase do estudo, efectuou-se uma analise preliminar centrada nas
eficiencias de remocao conjuntas dos tres metais pesados, a qual pode ser consul-
tada na seccao 3.1 do artigo Moreira et al.(2005b) apresentado no Apendice C. Esta
primeira analise levou a seleccao dum grupo com os tratamentos 4, 5, 7 e 9, conside-
rados os mais eficientes, para passarem a fase seguinte de analise das concentracoes
130 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
de Cu, Cr e As no catolito e anolito ao longo do tempo das experiencias. No final
da segunda fase, o melhor tratamento resultante foi comparado com o tratamento
13, o qual tem o dobro da duracao (28 dias) e portanto, em termos de eficiencia de
remocao no final nao e comparavel com as outras experiencias. Os dados que inte-
ressam para a aplicacao dos modelos regressionais multiplos sao os da concentracao
de Cu, Cr e As no catolito e anolito (soma dos dois) ao longo do tempo e e sobre
eles que neste capıtulo sera centrada a atencao.
9.3 Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr
e As nos Electrolitos
Dispondo-se de dados de concentracao dos tres metais ao longo do tempo, estes
podem ser descritos por um modelo regressional, em que a variavel resposta y, re-
presentando as concentracoes dos metais, depende de uma unica variavel controlada
t que representa o tempo em dias. O modelo regressional descreve o processo de
remocao dos tres metais para os electrolitos, ao longo dos 14 dias das experiencias.
Contudo, para alguns dos tratamentos, o numero de observacoes nao corresponde a
14, ou porque foram efectuadas mais que uma observacao por dia (tratamento 9) ou
porque no caso dos tratamentos 5 e 7 a recolha da ultima observacao correu mal.
Para efeitos do tratamento 13, considerou-se apenas as 14 primeiras observacoes
correspondentes aos primeiros 14 dias de experiencia deixando os 14 restantes fora
da modelacao. Portanto, o numero de observacoes difere de tratamento para trata-
mento tendo-se n4 = n13 = 14, n5 = n7 = 13 e n9 = 20. Esta-se pois perante um
caso nao equilibrado, para o qual as matrizes X dos modelos regressionais diferem
de tratamento para tratamento.
No seguimento da primeira analise efectuada e com o objectivo de detectar qual
9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 131
dos tratamentos revela os melhores resultados na remocao dos tres metais, esta
fase do estudo foi enquadrada no caso nao equilibrado das famılias estruturadas de
modelos de regressao multipla (seccao 6.4), com o proposito de refinar a comparacao
entre os melhores tratamentos.
Apos uma analise inicial, chegou-se a conclusao que o modelo regressional que
melhor descrevia a relacao entre as concentracoes dos metais e o tempo era um
modelo polinomial do 3o ou 4o grau. Assim, utilizando o metodo dos mınimos
quadrados e testes de significancia para os coeficientes da regressao (seccao 2.10),
ajustou-se para o Cu e para o Cr, um polinomio do 4o grau do tipo
yl = αl,1t+ αl,2t2 + αl,3t
3 + αl,4t4, l = 4, 5, 7, 9, 13 (9.1)
onde t representa o tempo em dias, l o numero do tratamento e αl,j, j = 1, 2, 3, 4
os coeficientes da regressao, enquanto que para o As ajustou-se um polinomio de 3o
grau
yl = αl,1t+ αl,2t2 + αl,3t
3, l = 4, 5, 7, 9, 13. (9.2)
A inexistencia de termo independente em todos os polinomios ajustados deve-se ao
facto de no momento t = 0 (inıcio das experiencias), a quantidade de metais pesados
removida ser nula.
Representando o modelo polinomial para o Cu e o Cr na forma matricial, vem
yl = Xlαl + εl, l = 4, 5, 7, 9, 13
onde o vector dos coeficientes vem
αl = [αl,1 αl,2 αl,3 αl,4]T ,
132 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
a matriz do modelo e
Xl =
1 1 1 1
2 4 8 16
3 9 27 81
4 16 64 256
5 25 125 625
6 36 216 1296
7 49 343 2401
8 64 512 4096
9 81 729 6561
10 100 1000 10000
11 121 1331 14641
12 144 1728 20736
13 169 2197 28561
14 196 2744 38416
para os tratamentos 4 e 13. Para os tratamentos 5 e 7 a ultima linha de Xl cor-
respondente a observacao 14 nao e considerada, e para o tratamento 9 a matriz do
modelo e
X9 =
0.5 0.3 0.1 0.1
0.6 0.3 0.2 0.1
0.7 0.5 0.3 0.2
0.8 0.6 0.5 0.3
1.5 2.2 3.2 4.7
2.5 6.1 15.0 36.9
3.4 11.5 38.8 131.4
3.7 13.5 49.7 182.8
4.4 19.5 86.2 380.6
4.7 22.3 105.1 495.8
5.4 29.0 156.6 843.8
6.4 40.9 261.1 1669.0
7.4 54.7 404.2 2988.5
8.0 64.0 512.0 4096.0
9.4 88.7 835.0 7863.0
10.4 108.7 1133.7 11820.9
11.4 130.4 1488.9 17001.0
12.4 154.2 1914.3 23769.5
13.4 180.2 2419.6 32483.1
14.4 208.1 3002.9 43322.6
.
Ora, como foi referido na seccao 2.10, nas regressoes polinomiais pode existir
dependencia linear entre as linhas da matriz Xl do modelo. No entanto, para os
modelos em questao, estas matrizes nao apresentam dependencia linear entre a suas
linhas, estando-se portanto, a partida, numa situacao de nao multicolinariedade.
Por outro lado, assume-se a homocedasticidade dos modelos, dado que as matrizes
de covariancia de εl, l = 4, 5, 7, 9, 13 nao sao conhecidas.
9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 133
Os αl,j estimados com j = 1, 2, 3, 4, l = 4, 5, 7, 9, 13, os valores de R2 e as somas
de quadrados dos erros para o Cu, Cr e As apresentam-se na tabela 9.2.
Tab. 9.2: Estimadores dos coeficientes das regressoes para o Cobre, Cromio e ArsenioTratamento
4 5 7 9 13
Cobre α4 -0.001 0.000 -0.001 0.001 0.000
α3 0.036 0.013 0.030 -0.023 -0.003
α2 -0.393 -0.167 -0.296 0.240 0.005
α1 2.079 1.326 1.230 0.090 0.341
R2 0.760 0.960 0.900 0.970 0.990
SQE 2.843 0.779 0.396 3.860 0.018
Cromio α4 -0.001 -0.002 -0.002 0.000 -0.002
α3 0.041 0.057 0.061 0.021 0.088
α2 -0.596 -0.698 -0.668 -0.371 -1.232
α1 3.364 3.514 2.968 2.089 6.916
R2 0.970 0.990 0.810 0.860 0.970
SQE 0.294 0.089 0.574 5.744 1.460
Arsenio α3 0.033 0.016 0.045 0.007 0.014
α2 -1.047 -0.619 -1.111 -0.478 -1.187
α1 10.950 8.009 8.702 7.518 12.233
R2 0.910 0.940 0.900 0.900 0.740
SQE 70.619 62.812 16.166 257.269 252.066
9.3.1 Analise Regressional
Uma vez obtido o modelo regressional definitivo para os tratamentos 4, 5, 7, 9 e
13 de cada metal, o passo seguinte foi o da aplicacao do caso nao equilibrado dos
modelos regressionais multiplos descrito na seccao 6.4. Como ja foi anteriormente
referido para o modelo base considerou-se um “one-way” com 4 tratamentos, e apos
a seleccao do melhor tratamento desse grupo, este foi comparado com o tratamento
13.
O proposito desta analise foi o de comparar coeficientes da mesma variavel con-
trolada, ou seja da mesma potencia de t entre tratamentos. Para tal tomou-se
1. aT = [1 0 0 0] para comparar o coeficiente de t para os 4 tratamentos;
2. aT = [0 1 0 0] para comparar o coeficiente de t2 para os 4 tratamentos;
134 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
3. aT = [0 0 1 0] para comparar o coeficiente de t3 para os 4 tratamentos;
4. aT = [0 0 0 1] para comparar o coeficiente de t4 para os 4 tratamentos.
Considerando-se agora
λ = [αT4 αT5 αT7 αT9 ]T
com matriz de covariancia igual ao produto de σ2 pela matriz diagonal por blocos
D((XT
4 X4)−1, (XT5 X5)−1, (XT
7 X7)−1, (XT9 X9)−1)
)=
0.405 -0.148 0.016 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
-0.148 0.058 -0.007 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.016 -0.007 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
-0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.505 -0.198 0.024 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 -0.198 0.083 -0.010 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.024 -0.010 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.505 -0.198 0.024 -0.001 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.198 0.083 -0.010 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.024 -0.010 0.001 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.002 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
e por outro lado considerando-se para o modelo base uma matriz
A =
[12 − 1
212 − 1
212
12 − 1
2 − 12
− 12
12
12 − 1
2
]
resultante de eliminar a 1a linha de uma matriz ortogonal estandardizada P4, vem
ψ = A[I4 ⊗ aT ]λ com matriz de covariancia σ2W∗ onde
W∗ = A[I4 ⊗ aT ]D((XT
4 X4)−1, (XT5 X5)−1, (XT
7 X7)−1, (XT9 X9)−1)
)[I4 ⊗ aT ]TAT .
Para o exemplo do Cu, obtem-se
1. ψ =[
0,947 1,042 0,194
]e W∗ =
[0,354 -0,151 -0,101
-0,151 0,354 -0,101
-0,101 -0,101 0,354
]se aT = [1 0 0 0]
9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 135
2. ψ =[
-0,381 -0,252 -0,155
]e W∗ =
[0,056 -0,027 -0,014
-0,027 0,056 -0,014
-0,014 -0,014 0,056
]se aT = [0 1 0 0]
3. ψ =[
0,038 0,021 0,015
]e W∗ =
[0,00088 -0,00044 -0,00018
-0,00044 0,00088 -0,00018
-0,00018 -0,00018 0,00088
]se aT = [0 0 1 0]
4. ψ =[
-0,0012 -0,0006 -0,0004
]e W∗ =
[0,0000013 -0,0000007 -0,0000002
-0,0000007 0,0000013 -0,0000002
-0,0000002 -0,0000002 0,0000013
]se aT =
[0 0 0 1]
para testar as hipoteses relativas ao Cu
H0 : ψ = 0
as quais se traduzem em testar
1. H10 : α4,1 = α5,1 = α7,1 = α9,1
2. H20 : α4,2 = α5,2 = α7,2 = α9,2
3. H30 : α4,3 = α5,3 = α7,3 = α9,3
4. H40 : α4,4 = α5,4 = α7,4 = α9,4.
Agora, somem-se as SQE para as 4 regressoes obtendo-se SSQE = 2.843 + 0.779 +
0.396 + 3.860 = 7.877 com g′ = 10 + 9 + 9 + 16 = 44 graus de liberdade e calcule-se
SQe = ψTW∗−1ψ.
Os resultados obtidos para o Cu, para as 4 hipoteses testadas, apresentam-se na
tabela 9.3 e indicam a rejeicao das 4 hipoteses, para um nıvel de significancia de
5%, ou seja, indicam a existencia de diferencas significativas para os coeficientes de
t, t2, t3 e t4 entre os tratamentos 4, 5, 7 e 9.
136 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
Tab. 9.3: Resultados dos testes F para o Cu
SQt g.l. F F0,05;3;44
H10 15.342 3 29.213 2.816
H20 11.568 3 22.027
H30 6.300 3 11.997
H40 3.791 3 7.219
SSQE 7.877 44
De seguida, com vista a detectar entre que pares de tratamentos existiam as
diferencas significativas, aplicou-se o metodo das comparacoes multiplas de Scheffe.
Assim sendo, tomou-se ρ0 = 0 e calcularam-se ambos os membros da desigualdade
(6.72), verificando-se se esta era satisfeita para todas as combinacoes possıveis de
pares de tratamentos. Deste modo, fazendo aT = [1 0 0 0], [0 1 0 0], [0 0 1 0] e
[0 0 0 1] para testar os coeficientes de t, t2, t3 e t4 respectivamente, verificou-se a
desigualdade para:
1. ρ = α4,j − α5,j fazendo dT = [1 − 1 0 0]
2. ρ = α4,j − α7,j fazendo dT = [1 0 − 1 0]
3. ρ = α4,j − α9,j fazendo dT = [1 0 0 − 1]
4. ρ = α5,j − α7,j fazendo dT = [0 1 − 1 0]
5. ρ = α5,j − α9,j fazendo dT = [0 1 0 − 1]
6. ρ = α7,j − α9,j fazendo dT = [0 0 1 − 1]
com j = 1, 2, 3, 4. Os resultados do metodo de Scheffe, ao nıvel de significancia
de 5%, para todos os casos anteriores sao apresentados na Tabela 9.4 e permitiram
9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 137
Tab. 9.4: Resultados do metodo de Scheffe para o CuTratamentos 1omembro 2omembro Resultado
Coeficiente de t
1 4 e 5 0.75310 1.28177 nao ha diferencas significativas
2 4 e 7 0.84847 1.28177 nao ha diferencas significativas
3 4 e 9 1.98894 0.85568 ha diferencas significativas
4 5 e 7 0.09537 1.34997 nao ha diferencas significativas
5 5 e 9 1.23584 0.95482 ha diferencas significativas
6 7 e 9 1.14047 0.95482 ha diferencas significativas
Coeficiente de t2
1 4 e 5 0.22593 0.50361 nao ha diferencas significativas
2 4 e 7 0.09646 0.50361 nao ha diferencas significativas
3 4 e 9 0.63271 0.32749 ha diferencas significativas
4 5 e 7 0.12947 0.54715 nao ha diferencas significativas
5 5 e 9 0.40679 0.39115 ha diferencas significativas
6 7 e 9 0.53625 0.39115 ha diferencas significativas
Coeficiente de t3
1 4 e 5 0.02271 0.06178 nao ha diferencas significativas
2 4 e 7 0.00554 0.06178 nao ha diferencas significativas
3 4 e 9 0.05876 0.03949 ha diferencas significativas
4 5 e 7 0.01717 0.06906 nao ha diferencas significativas
5 5 e 9 0.03605 0.05012 nao ha diferencas significativas
6 7 e 9 0.05323 0.05012 ha diferencas significativas
Coeficiente de t4
1 4 e 5 0.00083 0.00238 nao ha diferencas significativas
2 4 e 7 0.00024 0.00238 nao ha diferencas significativas
3 4 e 9 0.00182 0.00148 ha diferencas significativas
4 5 e 7 0.00058 0.00273 nao ha diferencas significativas
5 5 e 9 0.00100 0.00200 nao ha diferencas significativas
6 7 e 9 0.00158 0.00200 nao ha diferencas significativas
saber entre que tratamentos existiam diferencas significativas para os coeficientes
da mesma potencia de t, t2, t3 e t4. Na referida Tabela apresentam-se os valores
assumidos pelo 1o membro e 2o membro da desigualdade (6.72) para cada uma das
6 comparacoes de tratamentos 2 a 2.
Os resultados do metodo de Scheffe para o Cu, permitiram duma maneira geral,
detectar a existencia de diferencas significativas entre o tratamento 9 e os restantes.
Essas diferencas diminuem a medida que se compara coeficientes de uma potencia
de t superior.
Para o Cr, hipoteses semelhantes as do Cu foram testadas e os resultados dos
testes F , para um nıvel de 5%, sao apresentados na tabela 9.5, indicando a existencia
138 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
Tab. 9.5: Resultados dos testes F para o Cr
SQt g.l. F F0,05;3;44
H10 3.811 3 8.341 2.816
H20 1.328 3 2.906
H30 1.241 3 2.716
H40 1.228 3 2.688
SSQE 6.701 44
de diferencas significativas apenas entre os coeficientes de t e t2. Em termos de
comparacoes multiplas de Scheffe basta comparar 2 a 2 os coeficientes de t e t2. Os
resultados da aplicacao do metodo de Scheffe para o Cr sao apresentados na Tabela
9.6 e indicam a existencia de diferencas significativas nos coeficientes de t entre o
tratamento 9 e o 4 e o 9 e o 5.
Tab. 9.6: Resultados do metodo de Scheffe para o CrTratamentos 1omembro 2omembro Resultado
Coeficiente de t
1 4 e 5 0.15034 1.19669 nao ha diferencas significativas
2 4 e 7 0.39549 1.19669 nao ha diferencas significativas
3 4 e 9 1.27483 1.02039 ha diferencas significativas
4 5 e 7 0.54583 1.26036 nao ha diferencas significativas
5 5 e 9 1.42517 1.09437 ha diferencas significativas
6 7 e 9 0.87935 1.09437 nao ha diferencas significativas
Coeficiente de t2
1 4 e 5 0.10135 0.47018 nao ha diferencas significativas
2 4 e 7 0.07185 0.47018 nao ha diferencas significativas
3 4 e 9 0.22529 0.38547 nao ha diferencas significativas
4 5 e 7 0.02950 0.51083 nao ha diferencas significativas
5 5 e 9 0.32664 0.43413 nao ha diferencas significativas
6 7 e 9 0.29714 0.43413 nao ha diferencas significativas
Para o As, dado que se ajustou um polinomio do 3o grau, so se tem coeficientes
de t, t2 e t3, vindo αl = [αl,1 αl,2 αl,3], l = 4, 5, 7, 9, 13 logo as matrizes Xl do
modelo polinomial so incluem as 3 primeiras colunas, vindo entao λ com matriz de
9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 139
covariancia igual ao produto de σ2 pela matriz
D((XT
4 X4)−1, (XT5 X5)−1, (XT
7 X7)−1, (XT9 X9)−1)
)=
0.09999 -0.02078 0.00101 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
-0.02078 0.00460 -0.00023 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.00101 -0.00023 0.00001 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.12421 -0.02774 0.00145 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 -0.02774 0.00661 -0.00036 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.00145 -0.00036 0.00002 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.12421 -0.02774 0.00145 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.02774 0.00661 -0.00036 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00145 -0.00036 0.00002 0.00000 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.06530 -0.01373 0.00066
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.01373 0.00312 -0.00016
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00066 -0.00016 0.00001
.
Considerando para o modelo base a mesma matriz A =
[12 − 1
212 − 1
212
12 − 1
2 − 12
− 12
12
12 − 1
2
]obtem-
se
1. ψ =[
2,063 1,370 -0,879
]e W∗ =
[0,1034 -0,0208 -0,0087
-0,0208 0,1034 -0,0087
-0,0087 -0,0087 0,1034
]se aT = [1 0 0]
2. ψ =[
-0,531 -0,038 -0,102
]e W∗ =
[0,0052 -0,0014 -0,0004
-0,0014 0,0052 -0,0004
-0,0004 -0,0004 0,0052
]se aT = [0 1 0]
3. ψ =[
0,027 -0,001 0,011
]e W∗ =
[0,000015 -0,000005 -0,000001
-0,000005 0,000015 -0,000001
-0,000001 -0,000001 0,000015
]se aT = [0 0 1]
e testam-se as hipoteses relativas ao As
1. H10 : α4,1 = α5,1 = α7,1 = α9,1
2. H20 : α4,2 = α5,2 = α7,2 = α9,2
3. H30 : α4,3 = α5,3 = α7,3 = α9,3.
Os resultados dos testes F , para um nıvel de 5%, apresentam-se na tabela 9.7 e
indicam a existencia de diferencas significativas apenas entre os coeficientes de t. Os
resultados da aplicacao do metodo de Scheffe para o As (Tabela 9.8) nao indicam a
140 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
Tab. 9.7: Resultados dos testes F para o As
SQt g.l. F F0,05;3;48
H10 75.855 3 2.983 2.798
H20 65.075 3 2.559
H30 63.357 3 2.492
SSQE 257.269 48
Tab. 9.8: Resultados do metodo de Scheffe para o AsTratamentos 1omembro 2omembro Resultado
Coeficiente de t
1 4 e 5 2.94127 4.41590 nao ha diferencas significativas
2 4 e 7 2.24865 4.41590 nao ha diferencas significativas
3 4 e 9 3.43238 3.79159 nao ha diferencas significativas
4 5 e 7 0.69262 4.64833 nao ha diferencas significativas
5 5 e 9 0.49111 4.05992 nao ha diferencas significativas
6 7 e 9 1.18374 4.05992 nao ha diferencas significativas
existencia de diferencas significativas entre os coeficientes de t. Esta situacao deve-se
ao facto do metodo de Scheffe ser muito conservador, isto e, o metodo de Scheffe tem
mais tendencia para nao rejeitar a hipotese nula do que outros testes. Decidiu-se,
entao, aplicar um metodo de comparacoes multiplas menos conservador, como o de
Bonferroni [20]. Os resultados da aplicacao deste metodo apresentam-se na Tabela
9.9 e indicam a existencia de diferencas significativas apenas entre os tratamentos 4
e 9.
Tab. 9.9: Resultados do metodo de Boferroni para o AsTratamentos 1omembro 2omembro Resultado
Coeficiente de t
1 4 e 5 2.94127 3.94298 nao ha diferencas significativas
2 4 e 7 2.24865 3.94298 nao ha diferencas significativas
3 4 e 9 3.43238 3.38553 ha diferencas significativas
4 5 e 7 0.69262 4.15052 nao ha diferencas significativas
5 5 e 9 0.49111 3.62512 nao ha diferencas significativas
6 7 e 9 1.18374 3.62512 nao ha diferencas significativas
9.4. Interpretacao dos Resultados e Conclusoes 141
9.4 Interpretacao dos Resultados e Conclusoes
Em primeiro lugar, note-se que o coeficiente de grau mais baixo α1 tem uma im-
portancia especial, uma vez que e relevante na determinacao da velocidade inicial
de mobilizacao dos metais para os electrolitos. Atraves desta analise, pretendeu-se
saber qual o tratamento mais eficiente a remover os 3 metais, no tempo mais curto
possıvel, logo o coeficiente α1 tem, portanto, um papel central na escolha que foi
efectuada. Remete-se a interpretacao dos resultados da analise para as seccoes 3.2.1,
3.2.2, 3.2.3 e 3.3. do artigo “Regressional modeling of electrodialytic removal of Cu,
Cr and As from CCA treated timber waste: Application to wood chips”(Apendice
C). Nessas seccoes e explicado, em pormenor para os 3 metais em separado, o ra-
ciocınio que levou as conclusoes deste estudo, as quais indicam que o agente adju-
vante mais eficiente e o acido oxalico a 2,5% e a melhor corrente inicial a ser aplicada
estara situada entre os 20 e os 40 mA.
142 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira
10. CONCLUSOES E TRABALHO FUTURO
Neste trabalho foi desenvolvida a teoria das famılias estruturadas de modelos (f.e.m),
a qual representa uma generalizacao e extensao dos delineamentos regressionais
multiplos introduzidos por [19]. Os modelos constituintes das f.e.m, isto e, os mo-
delos elementares para alem de poderem ser regressoes lineares multiplas podem
agora ser modelos log-lineares. Estes ultimos, nao sendo normais, atraves das suas
propriedades assimptoticas puderam ser enquadrados nesta teoria, a qual e baseada
na suposicao de normalidade dos modelos. As f.e.m. mostraram assim ser uma
ferramenta flexıvel que pode ser utilizada mesmo quando os modelos elementares
nao sao regressoes lineares multiplas.
Por outro lado, o enquadramento desta teoria na teoria dos modelos ortogonais
associados a uma algebra de Jordan comutativa, permitiu que para o modelo base
fosse considerado um modelo de cruzamento-encaixe de dois ou mais factores de
efeitos fixos. Sendo portanto, um modelo base bastante mais geral do que os que
ate ao momento tem sido considerados.
Continuam, no entanto, a existir diversas restricoes quanto ao modelo base e aos
modelos elementares. O modelo base deve ser um modelo completo e equilibrado e
para os modelos elementares considera-se o caso regular, ou seja, admite-se a homo-
cedasticidade e independencia entre os modelos individuais e no caso das regressoes,
as matrizes do modelo terao de ser todas iguais e ter vectores coluna linearmente
independentes (multicolinariedade).
144 10. Conclusoes e Trabalho Futuro
Com vista a ultrapassar a restricao das matrizes do modelo terem de ser todas
iguais, desenvolveu-se um outro tipo de modelos, designados de L-ortogonais. Estes
modelos permitem o estudo do caso nao equilibrado relativo as f.e.m. constituıdas
por regressoes multiplas, o que equivale a dizer que ja podem ser consideradas re-
gressoes com diferentes observacoes, mas do mesmo tipo.
Em termos de futuro trabalho a desenvolver nesta area ainda muito ha a fazer,
nomeadamente tentativas no sentido de ultrapassar algumas das restricoes como
a homocedasticidade entre os modelos elementares e a multicolinariedade nas re-
gressoes.
Os modelos L-ortogonais, podem ser utilizados em estudos de biometria em que
se comparam taxas de crescimento de seres vivos para varios conjuntos de condicoes
que correspondem aos tratamentos do modelo base.
Nas aplicacoes apresentadas, pos-se em pratica a teoria desenvolvida a duas areas
distintas: a hidrologia e a remediacao ambiental.
Na primeira das aplicacoes, o caso mais basico das f.e.m. foi utilizado. Neste,
os modelos elementares sao modelos log-lineares ajustados a tabelas de contingencia
representando contagens de transicoes mensais entre classes de seca no Alentejo
relativas a tres perıodos temporais distintos e para o modelo base considerou-se um
factor com tres tratamentos. Esta analise permitiu concluir acerca de diferencas
significativas entre os tres perıodos (tratamentos). Os resultados obtidos atraves da
analise utilizando as f.e.m, permitiram obter conclusoes similares a outras obtidas
utilizando o metodo apresentado em Moreira et al. (2006), dando assim credibilidade
a utilizacao das f.e.m..
Na segunda aplicacao, os modelos elementares tambem sao loglineares ajustados
a tabelas de contingencia representando contagens de transicoes mensais entre classes
de seca relativas a longo perıodo de tempo no Alentejo. Contudo, para o modelo base
145
considerou-se o cruzamento de dois factores com interaccao (latitude e longitude),
cada um com dois nıveis (norte e sul, oeste e leste). Esta analise permitiu concluir
acerca de diferencas significativas entre os nıveis dos dois factores envolvidos. Os
resultados obtidos sao indicativos de diferencas significativas entre oeste e leste ao
nıvel das diferentes classes de seca. Este estudo, revela bastante interesse na area da
hidrologia, uma vez que pode ser utilizado como metodo alternativo a outros para
detectar zonas homogeneas em termos ocorrencia de eventos de seca (severidade e
frequencia).
Na ultima aplicacao, o caso nao equilibrado das f.e.m. e utilizado para analisar os
dados resultantes de experiencias de remocao electrodialıtica de metais pesados. Os
modelos elementares neste caso sao regressoes polinomiais do 3o e 4o grau ajustados
a evolucao temporal das concentracoes dos metais pesados nos electrolitos. Para o
modelo base apenas foi possıvel considerar um factor com quatro tratamentos cor-
respondentes a diferentes condicoes experimentais. Na recolha dos dados para cada
um dos tratamentos, diferente numero de observacoes estavam disponıveis. Utili-
zando a teoria desenvolvida no capitulo 6 desta dissertacao, foi possıvel considerar
todas as observacoes recolhidas, pois os polinomios poderam ser ajustados com dife-
rentes matrizes de modelo e analisados conjuntamente. Esta e uma situacao muito
comum na recolha de dados para analise estatıstica, que fica assim resolvida gracas
aos modelos L-ortogonais.
146 10. Conclusoes e Trabalho Futuro
BIBLIOGRAFIA
[1] Agresti A. (1990) Categorical Data Analysis. J. Wiley & Sons. New York.
[2] Covas R. (2007) Orthogonal mixed models and commutative Jordan algebras.
Dissertacao de Doutoramento em Matematica Especialidade Estatıstica. Facul-
dade de Ciencias e Tecnologia, Universidade Nova de Lisboa.
[3] Cruz S.M. (2001) Delineamentos regressionais multiplos aplicados a quadrados
latinos. Tese de Licenciatura em Matematica Aplicada. Universidade da Evora.
[4] Domingues L.F. (1997) Delineamentos regressionais multiplos de base 2. Dis-
sertacao de Mestrado em Estatıstica e Optimizacao. Universidade Nova de Lis-
boa.
[5] Ferreira S. (2006) Inferencia para modelos ortogonais com segregacao. Dis-
sertacao de Doutoramento em Matematica Estatıstica. Universidade da Beira
Interior.
[6] Ferreira D. (1996) Delineamentos regressionais multiplos com planos completos
como delineamentos base. Tese de Licenciatura em Matematica Probabilidades
e Estatıstica. Universidade de Evora.
[7] Fonseca M. (2007) Estimation and hypothesis testing in mixed linear mo-
dels. Dissertacao de Doutoramento em Matematica, Estatıstica. Faculdade de
Ciencias e Tecnologia, Universidade Nova de Lisboa.
148 Bibliografia
[8] Fonseca M., Mexia J.T., Zmyslony R. (2007) Jordan algebras, generating pivot
variables and ortogonal normal models. Journal of Interdisciplinary Mathema-
tics, 2(10): 305-326.
[9] Fonseca M., Mexia J.T., Zmyslony R. (2006) Binary operations on Jordan alge-
bras and orthogonal normal models. Linear Algebra and its Applications, 417:
75-86.
[10] Fonseca M., Mexia J.T., Zmyslony R. (2003) Estimators and tests for variance
components in cross nested orthogonal models. Discussiones Mathematicae -
Probability and Statistics, 23: 173-201.
[11] Khuri A.I., Mathew T., Sinha B.K. (1998) Statistical Tests for Mixed Linear
Models. John Willey & Sons. New York.
[12] Lehmann E.L., Casella G. (1998) Theory of Point Estimation, Springer Texts
in Statistics. New York.
[13] Lehmann E.L.(1997) Testing Statistical Hypotheses. Reprint of the 2nd ed.
publ. by Wiley 1986. Springer. New York
[14] Mexia, J.T. (1995) Introducao a Inferencia Estatıstica Linear. Centro de Estu-
dos de Matematica Aplicada. Edicoes Universitarias Lusofonas. Lisboa.
[15] Mexia, J.T. (1990) Best linear unbiased estimates, duality of F tests and
Scheffe’s multiple comparison method in the presence of controlled Heteroce-
dasticity. Comp. Stat. & Data Analysis, 10(3): 271-281.
[16] Mexia, J.T. (1989) Simultaneous Confidence Intervals: Generalization of the
Scheffe Theorem. Trabalhos de Investigacao No2. Departamento de Matematica,
Faculdade de Ciencias e Tecnologia, Universidade Nova de Lisboa.
Bibliografia 149
[17] Mexia, J.T. (1988a) Estimable Functions, Duality of F Tests and Scheffe’s Mul-
tiple Comparison Method. Trabalhos de Investigacao No1. Departamento de
Matematica, Faculdade de Ciencias e Tecnologia, Universidade Nova de Lis-
boa.
[18] Mexia, J.T. (1988b) Standardized Orthogonal Matrices and Decomposition of
the Sum of Squares for Treatments. Trabalhos de Investigacao No2. Departa-
mento de Matematica, Faculdade de Ciencias e Tecnologia, Universidade Nova
de Lisboa.
[19] Mexia, J.T. (1987) Multi-Treatment Regression Designs. Trabalhos de Inves-
tigacao No1. Departamento de Matematica, Faculdade de Ciencias e Tecnologia,
Universidade Nova de Lisboa.
[20] Montgomery D.C. (1997) Design and Analysis of Experiments - 5th edition.
John Willey & Sons. New York.
[21] Moreira E.E., Coelho C.A., Paulo A.A., Pereira L.S., Mexia J.T. (2008) SPI-
based drought category prediction using loglinear models. J Hydrology, 354:
116-130.
[22] Moreira E.E., Paulo A.A., Pereira L.S. (2007a) Is drought occurrence and seve-
rity increasing due to climate change? Analyzing drought class transitions with
loglinear models. Methods and tools for drought analysis and management.
Water Science and Technology Library. Springer, 67-81.
[23] Moreira E.E., Mexia J. T. (2007b) Multiple regression models with cross nes-
ted orthogonal base model. Proceedings of the 56th Session of the ISI 2007 -
International Statistical Institute, Lisboa.
150 Bibliografia
[24] Moreira E.E., Paulo A.A., Pereira L.S., Mexia J.T. (2006) Analysis of SPI
drought class transitions using loglinear models. J Hydrology, 331: 349-359.
[25] Moreira E.E., Ribeiro A.B., Mateus E.P., Mexia J.T., Ottosen L.M. (2005a)
Regressional modeling of electrodialytic removal of Cu, Cr and As from CCA
timber waste: application to sawdust. Wood Science and Technology, 39(4):
291-309.
[26] Moreira E.E., Ribeiro A.B., Mateus E.P., Mexia J.T., Ottosen L.M. (2005b)
Regressional modeling of electrodialytic removal of Cu, Cr and As from CCA
timber waste: application to wood chips. Biometrical letters, 42(1): 11-25.
[27] Moreira E.E. (2004) Tratamento regressional da remocao electrodialıtica de me-
tais pesados de resıduos de madeira. Dissertacao de Mestrado em Estatıstica e
Optimizacao. Faculdade de Ciencias e Tecnologia, Universidade Nova de Lisboa.
[28] Nelder J.A. (1974) Loglinear models for contingency tables: a generalization of
classical least squares. Appl. Statistics, 23: 323-329.
[29] Oliveira S. (2005) Delineamentos regressionais com base factorial prima. Tese
de Mestrado em Estatıstica e Optimizacao. Universidade Nova de Lisboa. Fa-
culdade de Ciencias e Tecnologia.
[30] Pollock, D.S.G. (1975) The Algebra of Econometrics. John Willey & Sons. New
York.
[31] Rao, C.R. (1973) Linear Statistical Inference and Its Applications. 2nd edn.
John Willey & Sons. New York.
[32] Rohatgi, V.K. (1976) An Introduction to Probability Theory and Mathematical
Statistics. John Willey & Sons. New York.
Bibliografia 151
[33] Saraiva S. (1996) Delineamentos regressionais associados a quadrados latinos
e blocos casualizados. Tese de Licenciatura em Engenharia Biofısica. Universi-
dade da Evora.
[34] Scheffe, H. (1959) The Analysis of Variance. John Willey & Sons. New York.
[35] Schott, J.R. (1996) Matrix Analysis for Statistics. Wiley Series in Probability
and Statistics. New York.
[36] Seber, G.A.F. (1980) The Linear Hypoteses: A General Theory - 2nd ed. Char-
les Griffing and Co. Londres.
[37] Seely J. (1971) Quadratic subspaces and completeness. Ann. Math. Stat., 42(2):
710-721.
[38] Silvey, S.D. (1975) Statistical Inference. Chapman & Hall. New York.
152 Bibliografia
APENDICE
A. TABELAS ANEXAS AO CAPITULO 7
156 A. Tabelas Anexas ao Capitulo 7
Tab. A.1: Valores para os estimadores dos parametros dos modelos de quasi-associacao
ajustados as tabelas de contingencia e respectivos desvios residuais das 6
estacoes.
Portalegre Elvas Evora
1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo
λ 1.361 1.554 1.933 1.217 1.723 0.876 0.775 0.834 0.832
λA2 -1.633 -0.810 -2.375 -1.507 -1.060 -1.484 -1.685 -1.424 -2.811
λA3 -6.740 -4.170 -6.460 -5.200 -4.580 -5.490 -6.710 -5.780 -7.580
λA4 -10.980 -8.400 -11.440 -10.360 -8.120 -9.870 -11.790 -10.450 -12.040
λB2 -1.575 -0.890 -2.308 -1.588 -0.980 -1.491 -1.749 -1.325 -2.617
λB3 -6.590 -4.240 -6.290 -5.350 -4.520 -5.400 -6.770 -5.560 -7.250
λB4 -10.860 -8.470 -11.290 -10.500 -8.050 -9.800 -11.860 -10.260 -11.720
β 1.508 0.867 1.467 1.341 0.911 1.366 0.395 0.427 0.386
δ1 1.727 2.480 1.327 2.115 2.308 2.332 2.080 2.644 1.323
δ2 0.172 1.087 1.056 0.957 1.112 0.951 -0.310 0.861 1.348
δ3 0.472 1.240 0.708 0.553 0.561 0.851 0.963 0.924 0.895
δ4 -0.468 1.430 -0.724 -1.820 -0.130 -0.361 -1.018 -1.840 -1.228
G2 1.775 3.012 6.023 3.629 0.302 8.310 1.979 1.351 1.794
Beja Barrancos Almodovar
1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo
λ 1.437 1.077 2.372 1.309 0.652 2.661 1.414 0.597 1.237
λA2 -2.540 0.440 -3.210 -1.335 -0.330 -3.561 -1.430 -1.004 -1.994
λA3 -7.580 -2.600 -7.480 -6.210 -4.710 -8.900 -6.090 -5.200 -6.800
λA4 -14.110 -5.840 -13.330 -10.110 -8.390 -13.330 -9.780 -10.000 -12.280
λB2 -2.540 0.500 -3.140 -1.332 -0.410 -3.561 -1.566 -1.009 -1.997
λB3 -7.580 -2.400 -7.290 -6.310 -4.790 -8.930 -6.440 -5.120 -6.730
λB4 -14.110 -5.060 -13.150 -10.180 -8.460 -13.260 -10.230 -9.660 -11.890
β 1.813 0.485 1.664 1.383 1.102 1.821 1.343 1.275 1.601
δ1 1.413 3.350 0.655 2.070 3.042 0.210 1.962 3.026 1.872
δ2 0.779 0.455 1.496 0.244 -0.070 1.167 0.677 0.685 0.628
δ3 0.497 0.940 -0.004 0.140 1.924 1.777 0.133 0.646 0.085
δ4 0.410 2.060 0.713 -0.753 -0.330 -2.212 0.330 -1.340 0.362
G2 2.942 8.432 4.591 1.906 1.555 1.867 1.435 1.544 1.774
157
Tab. A.2: Resultado das comparacoes multiplas de Scheffe para Portalegre, Elvas, EvoraPeriodos 1o membro sinal 2o membro conclusao
Portalegre
m33
1 e 2 0.112 < 1.286 nao ha diferencas significativas entre os periodos
1 e 3 1.019 < 1.092 nao ha diferencas significativas entre os periodos
2 e 3 0.907 < 1.047 nao ha diferencas significativas entre os periodos
m44
1 e 2 3.195 > 2.700 ha diferencas significativas entre os periodos
1 e 3 1.230 > 1.137 ha diferencas significativas entre os periodos
2 e 3 1.965 < 2.828 nao ha diferencas significativas entre os periodos
Elvas
m11
1 e 2 0.269 < 0.362 nao ha diferencas significativas entre os periodos
1 e 3 0.099 < 0.395 nao ha diferencas significativas entre os periodos
2 e 3 0.368 < 0.372 nao ha diferencas significativas entre os periodos
m33
1 e 2 1.906 > 1.508 ha diferencas significativas entre os periodos
1 e 3 0.158 < 0.799 nao ha diferencas significativas entre os periodos
2 e 3 1.748 > 1.525 ha diferencas significativas entre os periodos
m44
1 e 2 0.006 < 3.982 nao ha diferencas significativas entre os periodos
1 e 3 2.708 < 2.908 nao ha diferencas significativas entre os periodos
2 e 3 2.702 < 2.908 nao ha diferencas significativas entre os periodos
Evora
m11
1 e 2 0.060 < 0.223 nao ha diferencas significativas entre os periodos
1 e 3 0.304 > 0.239 ha diferencas significativas entre os periodos
2 e 3 0.244 > 0.242 ha diferencas significativas entre os periodos
m22
1 e 2 0.545 > 0.334 ha diferencas significativas entre os periodos
1 e 3 0.369 > 0.346 ha diferencas significativas entre os periodos
2 e 3 0.176 < 0.300 nao ha diferencas significativas entre os periodos
m34
1 e 2 0.613 < 1.240 nao ha diferencas significativas entre os periodos
1 e 3 0.647 < 0.921 nao ha diferencas significativas entre os periodos
2 e 3 1.260 > 1.138 ha diferencas significativas entre os periodos
m43
1 e 2 0.593 < 1.229 nao ha diferencas significativas entre os periodos
1 e 3 0.647 < 0.918 nao ha diferencas significativas entre os periodos
2 e 3 1.240 > 1.124 ha diferencas significativas entre os periodos
m44
1 e 2 1.941 < 1.947 nao ha diferencas significativas entre os periodos
1 e 3 1.393 > 0.770 ha diferencas significativas entre os periodos
2 e 3 3.334 > 1.854 ha diferencas significativas entre os periodos
158 A. Tabelas Anexas ao Capitulo 7
Tab. A.3: Resultado das comparacoes multiplas de Scheffe para Beja, Barrancos e Al-
modovarPeriodos 1o membro sinal 2o membro conclusao
Beja
m33
1 e 2 1.709 < 1.748 nao ha diferencas significativas entre os periodos
1 e 3 0.517 < 1.125 nao ha diferencas significativas entre os periodos
2 e 3 1.192 < 1.838 nao ha diferencas significativas entre os periodos
m44
1 e 2 2.638 < 3.328 nao ha diferencas significativas entre os periodos
1 e 3 0.594 < 1.073 nao ha diferencas significativas entre os periodos
2 e 3 3.232 < 3.279 nao ha diferencas significativas entre os periodos
Barrancos
m22
1 e 2 0.168 < 0.301 nao ha diferencas significativas entre os periodos
1 e 3 0.428 > 0.325 ha diferencas significativas entre os periodos
2 e 3 0.260 < 0.336 nao ha diferencas significativas entre os periodos
m33
1 e 2 1.618 > 1.017 ha diferencas significativas entre os periodos
1 e 3 1.621 > 1.017 ha diferencas significativas entre os periodos
2 e 3 0.003 < 0.587 nao ha diferencas significativas entre os periodos
m34
1 e 2 0.809 < 1.404 nao ha diferencas significativas entre os periodos
1 e 3 0.838 < 0.978 nao ha diferencas significativas entre os periodos
2 e 3 1.647 > 1.283 ha diferencas significativas entre os periodos
m43
1 e 2 0.789 < 1.412 nao ha diferencas significativas entre os periodos
1 e 3 0.768 < 1.002 nao ha diferencas significativas entre os periodos
2 e 3 1.557 > 1.294 ha diferencas significativas entre os periodos
m44
1 e 2 1.290 > 1.210 ha diferencas significativas entre os periodos
1 e 3 0.601 < 0.697 nao ha diferencas significativas entre os periodos
2 e 3 1.891 > 1.150 ha diferencas significativas entre os periodos
Almodovar
m33
1 e 2 1.294 > 1.143 ha diferencas significativas entre os periodos
1 e 3 1.097 < 1.170 nao ha diferencas significativas entre os periodos
2 e 3 0.197 < 0.789 nao ha diferencas significativas entre os periodos
m44
1 e 2 3.225 > 1.789 ha diferencas significativas entre os periodos
1 e 3 0.177 < 0.519 nao ha diferencas significativas entre os periodos
2 e 3 3.048 > 1.796 ha diferencas significativas entre os periodos
B. TABELAS ANEXAS AO CAPITULO 8
160 B. Tabelas Anexas ao Capitulo 8
Tab. B.1: Tabelas de contingencia para zona 1 e 2Classe seca mes t Classe seca mes t+1 Classe seca mes t Classe seca mes t+1
Chouto 1 2 3 4 Nisa 1 2 3 4
1 377 37 2 0 1 368 31 2 0
2 38 183 24 1 2 33 200 24 2
3 0 22 44 14 3 0 26 61 9
4 1 4 11 45 4 0 3 8 36
Lamarosa 1 2 3 4 Castelo de Vide 1 2 3 4
1 378 46 2 0 1 383 25 0 0
2 46 169 19 3 2 22 188 35 0
3 2 18 35 10 3 3 29 59 13
4 0 3 10 62 4 0 3 10 33
Lavre 1 2 3 4 Portalegre 1 2 3 4
1 364 39 3 0 1 346 39 3 0
2 42 187 24 2 2 41 226 21 4
3 0 26 48 11 3 1 22 39 13
4 0 3 10 44 4 0 4 13 31
Canha 1 2 3 4 Arronches 1 2 3 4
1 369 34 3 0 1 381 34 2 0
2 36 185 25 2 2 36 180 16 4
3 1 21 50 16 3 0 16 61 10
4 0 7 10 44 4 0 5 9 49
Reguengos 1 2 3 4 Avis 1 2 3 4
1 370 32 3 0 1 377 27 2 0
2 34 199 20 1 2 29 199 20 1
3 0 20 46 16 3 0 20 65 12
4 1 2 14 45 4 0 2 11 38
Montemor-o-Novo 1 2 3 4 Pavia 1 2 3 4
1 375 38 1 0 1 340 36 0 0
2 38 185 20 3 2 35 237 23 1
3 1 20 37 16 3 1 20 39 14
4 0 3 15 51 4 0 3 13 41
Aguas de Moura 1 2 3 4 Arraiolos 1 2 3 4
1 391 31 4 0 1 375 37 1 1
2 35 187 17 4 2 38 208 22 1
3 0 19 33 11 3 1 21 38 8
4 0 6 9 56 4 0 2 7 43
B. Pego do Altar 1 2 3 4 Vila Vicosa 1 2 3 4
1 349 49 1 0 1 363 28 1 0
2 50 212 15 2 2 28 229 21 1
3 0 13 33 16 3 1 20 47 12
4 0 5 12 46 4 0 2 11 39
Comporta 1 2 3 4 Evora 1 2 3 4
1 361 42 0 0 1 367 33 1 0
2 39 222 18 3 2 34 196 21 4
3 3 15 35 10 3 0 22 49 19
4 0 3 9 43 4 0 3 19 35
Torrao 1 2 3 4 Viana do Alentejo 1 2 3 4
1 365 40 0 0 1 364 35 2 0
2 37 187 33 1 2 35 196 30 2
3 3 26 37 15 3 2 30 38 15
4 0 5 11 43 4 0 2 15 37
161
Tab. B.2: Tabelas de contingencia para zona 3 e 4Classe seca mes t Classe seca mes t+1 Classe seca mes t Classe seca mes t+1
Grandola 1 2 3 4 Amareleja (D.G.R.N.) 1 2 3 4
1 366 39 0 0 1 348 36 1 0
2 35 195 25 3 2 36 214 23 4
3 4 20 41 11 3 1 22 56 9
4 0 4 9 51 4 0 4 9 40
Alvalade 1 2 3 4 Cuba 1 2 3 4
1 382 37 2 0 1 381 38 0 0
2 38 183 20 1 2 36 179 22 1
3 0 16 43 17 3 1 18 53 14
4 1 5 12 46 4 0 4 11 45
Cercal do Alentejo 1 2 3 4 Barrancos 1 2 3 4
1 381 36 2 0 1 347 44 0 0
2 37 175 27 2 2 42 207 20 6
3 1 26 38 17 3 2 18 44 17
4 0 4 14 43 4 0 6 16 34
Reliquias 1 2 3 4 Beja 1 2 3 4
1 374 40 1 0 1 351 37 2 0
2 39 187 21 3 2 38 228 22 1
3 1 20 26 15 3 0 23 39 11
4 1 2 15 58 4 1 1 10 39
Aldeia de Palheiros 1 2 3 4 Serpa 1 2 3 4
1 365 36 0 0 1 378 36 0 0
2 34 207 20 4 2 32 199 22 3
3 1 19 39 14 3 2 19 45 13
4 1 3 13 47 4 1 3 12 38
Saboia 1 2 3 4 Trindade 1 2 3 4
1 382 31 0 0 1 366 42 0 0
2 29 226 13 2 2 39 198 21 2
3 2 8 29 13 3 3 14 46 11
4 0 4 10 54 4 0 5 8 48
S. Marcos da Serra 1 2 3 4 Algodor 1 2 3 4
1 363 33 0 0 1 353 33 0 0
2 32 203 27 2 2 32 231 25 3
3 1 25 44 13 3 1 21 37 9
4 0 3 12 45 4 0 5 7 46
Aljezur 1 2 3 4 Martim Longo 1 2 3 4
1 371 38 1 1 1 353 35 1 1
2 40 215 16 1 2 35 216 24 3
3 0 13 32 15 3 1 23 48 12
4 0 5 11 44 4 1 3 12 35
Monchique 1 2 3 4 Almodovar 1 2 3 4
1 388 38 2 0 1 357 33 1 0
2 40 167 26 2 2 34 238 22 2
3 0 26 34 13 3 0 21 23 12
4 0 3 12 52 4 0 4 10 46
S. Bartol. Messines 1 2 3 4 Sao Bras de Alportel 1 2 3 4
1 378 31 0 0 1 353 34 0 0
2 29 201 23 3 2 32 222 22 4
3 1 20 51 14 3 2 19 53 15
4 1 3 12 36 4 0 4 15 28
162 B. Tabelas Anexas ao Capitulo 8
Tab. B.3: Estimadores dos parametros dos modelos de quasi-associacao ajustados as ta-
belas de contingencia e respectivos desvios residuais das 40 estacoes.
Chouto Lamarosa Lavre Canha Reguengos Mont-o-Novo Ag.Moura B.P.Altar Comporta Torrao
λ 2.487 3.028 2.452 2.385 2.829 2.383 2.407 2.536 2.759 2.228
λA2 -1.887 -2.144 -1.933 -1.508 -2.446 -2.294 -1.336 -2.655 -2.075 -1.746
λA3 -6.581 -6.823 -6.850 -5.788 -6.744 -7.740 -5.455 -9.300 -6.920 -6.600
λA4 -11.610 -11.620 -12.350 -10.160 -12.110 -13.220 -9.210 -14.740 -11.720 -12.070
λB2 -1.890 -2.146 -1.933 -1.509 -2.501 -2.294 -1.336 -2.654 -2.074 -1.746
λB3 -6.517 -6.780 -6.850 -5.763 -6.836 -7.740 -5.455 -9.310 -6.940 -6.600
λB4 -11.500 -11.590 -12.350 -10.080 -12.200 -13.170 -9.210 -14.690 -11.650 -12.070
β 1.511 1.473 1.591 1.340 1.568 1.775 1.214 2.010 1.509 1.584
δ1 1.935 1.434 1.854 2.186 1.516 1.770 2.348 1.309 1.621 2.087
δ2 0.456 0.499 0.280 0.493 1.139 0.327 0.642 0.088 0.758 0.158
δ3 0.797 0.870 0.791 1.021 0.469 0.735 1.075 1.474 1.078 0.329
δ4 0.256 0.729 0.569 0.202 0.202 -0.449 0.618 -1.437 0.225 0.327
G2 8.378 0.294 4.719 6.149 5.891 0.105 7.128 3.477 4.789 8.761
Nisa Cast.Vide Portalegre Arronches Avis Pavia Arraiolos V.Vicosa Evora Via.Alen.
λ 1.795 1.690 2.675 2.167 2.119 1.856 2.516 2.094 1.697 2.467
λA2 -1.482 -1.742 -1.826 -1.546 -2.384 -2.415 -1.819 -2.359 -2.139 -2.186
λA3 -6.530 -6.140 -6.318 -6.680 -7.550 -8.760 -6.440 -7.510 -8.370 -6.700
λA4 -12.000 -12.500 -10.870 -10.890 -13.750 -15.230 -11.710 -13.730 -14.160 -12.700
λB2 -1.481 -1.745 -1.827 -1.548 -2.385 -2.415 -1.820 -2.359 -2.140 -2.186
λB3 -6.570 -6.090 -6.282 -6.630 -7.510 -8.750 -6.410 -7.510 -8.330 -6.700
λB4 -12.030 -12.300 -10.840 -10.860 -13.710 -15.290 -11.580 -13.730 -14.090 -12.700
β 1.576 1.605 1.421 1.468 1.799 2.064 1.462 1.799 1.977 1.637
δ1 2.536 2.653 1.751 2.308 2.014 1.909 1.949 2.002 2.231 1.793
δ2 0.162 0.612 0.716 0.248 0.747 0.185 0.613 0.863 -0.048 0.634
δ4 1.232 0.165 0.804 2.036 0.929 0.746 0.808 0.580 1.104 -0.160
δ5 0.604 0.923 -0.261 -0.008 0.198 -0.637 1.143 0.250 -1.523 0.354
G2 3.2390 5.503 1.450 3.219 3.254 2.684 6.057 0.4557 1.576 0.102
Grandola Alvalade Cerc.Alen. Reliquias Ald.Palhe. Saboia S.M.Serra Aljezur Monchique SBMessi.
λ 2.487 2.729 2.322 2.734 2.244 2.589 1.447 2.724 2.151 1.975
λA2 -1.576 -2.148 -1.976 -2.241 -1.785 -2.415 -1.836 -2.299 -2.023 -1.619
λA3 -5.890 -6.898 -6.820 -7.054 -6.780 -7.530 -7.960 -7.560 -7.490 -6.450
λA4 -10.520 -11.580 -12.290 -12.100 -11.440 -12.070 -14.180 -12.240 -13.380 -11.280
λB2 -1.575 -2.154 -1.976 -2.242 -1.784 -2.416 -1.836 -2.303 -2.024 -1.620
λB3 -5.899 -6.785 -6.830 -7.015 -6.790 -7.480 -7.960 -7.430 -7.460 -6.420
λB4 -10.450 -11.380 -12.240 -12.070 -11.390 -11.960 -14.180 -11.960 -13.350 -11.190
β 1.350 1.521 1.626 1.590 1.546 1.614 1.935 1.618 1.768 1.520
δ1 2.065 1.695 1.995 1.600 2.110 1.742 2.512 1.574 2.042 2.440
δ2 0.537 0.697 0.292 0.620 0.475 1.206 -0.203 0.775 -0.058 0.486
δ3 0.866 1.023 0.328 0.283 1.082 1.256 0.848 1.161 0.417 1.136
δ4 0.821 -0.281 -0.038 0.049 -0.296 -0.401 -0.244 -0.631 0.240 -0.246
G2 6.937 8.811 1.447 5.186 6.828 5.276 1.748 7.671 3.113 7.387
Amareleja Cuba Barrancos Beja Serpa Trindade Algodor M.Longo Almodovar SBAlpor.
λA2 1.904 1.879 2.357 2.677 2.414 2.643 1.248 2.474 1.567 2.053
λA2 -1.293 -2.242 -1.84 -2.349 -1.777 -1.861 -1.044 -1.457 -1.747 -1.809
λA2 -6.430 -8.550 -7.300 -7.100 -6.277 -6.700 -6.920 -5.507 -7.830 -7.000
λA2 -11.140 -14.590 -11.730 -13.020 -10.870 -11.250 -11.950 -9.720 -13.490 -11.90
λA2 -1.294 -2.216 -1.839 -2.397 -1.748 -1.863 -1.045 -1.459 -1.747 -1.810
λA2 -6.400 -8.520 -7.310 -7.220 -6.251 -6.650 -6.880 -5.473 -7.830 -6.960
λA2 -11.120 -14.570 -11.700 -13.130 -10.850 -11.220 -11.920 -9.700 -13.490 -11.870
β 1.487 1.980 1.622 1.658 1.435 1.460 1.639 1.265 1.846 1.627
δ1 2.461 2.083 1.87 1.526 2.086 1.799 2.980 2.127 2.465 2.187
δ2 0.102 -0.155 0.167 0.866 0.663 0.528 -0.273 0.755 0.016 0.461
δ3 1.572 1.340 1.433 0.386 1.003 1.398 1.415 0.989 0.609 1.241
δ4 0.258 -0.596 -1.353 0.611 -0.023 0.335 0.225 0.252 -0.287 -0.983
G2 0.1604 4.150 3.172 6.758 7.636 7.731 2.553 7.587 2.330 3.183
163
Tab. B.4: Valores para yi e V (yi)i yi V (yi)
1 3.809 0.022
2 4.115 0.016
3 3.777 0.023
4 3.787 0.023
5 3.809 0.022
6 3.944 0.020
7 4.029 0.018
8 3.829 0.022
9 3.758 0.023
10 3.759 0.023
11 3.585 0.028
12 3.493 0.030
13 3.44 0.032
14 3.897 0.020
15 3.641 0.026
16 3.723 0.024
17 3.761 0.023
18 3.668 0.026
19 3.556 0.029
20 3.613 0.027
21 3.938 0.020
22 3.824 0.022
23 3.77 0.023
24 4.053 0.017
25 3.854 0.021
26 3.982 0.019
27 3.803 0.022
28 3.781 0.023
29 3.949 0.019
30 3.579 0.028
31 3.694 0.025
32 3.803 0.022
33 3.526 0.029
34 3.666 0.026
35 3.631 0.026
36 3.868 0.021
37 3.827 0.022
38 3.546 0.029
39 3.836 0.022
40 3.332 0.036
164 B. Tabelas Anexas ao Capitulo 8
C. ARTIGOS PUBLICADOS