fam ilias estruturadas de modelos com modelo …n! matriz nula de ordem n i n! matriz identidade de...

ELSA ESTEVAO FACHADAS NUNES MOREIRA

FAMILIAS ESTRUTURADAS DE MODELOS

COM MODELO BASE ORTOGONAL

Teoria e Aplicacoes

Dissertacao apresentada para obtencao do Grau de Doutor em Matematica com

especializacao em Estatıstica pela Universidade Nova de Lisboa, Faculdade de

Ciencias e Tecnologia.

Lisboa

2008

AGRADECIMENTOS E DEDICATORIAS

Sendo este o espaco reservado para referir as pessoas que realmente me ajudaram

e apoiaram neste trabalho, comeco pelo meu orientador, o Professor Doutor Joao

Tiago Mexia. Foi com ele que tudo isto comecou. Foi ele que me trouxe para o

mundo da investigacao, primeiro com o mestrado e agora com o doutoramento e

os projectos em que estive e continuo envolvida, dando inıcio a uma nova fase da

minha vida profissional onde me sinto melhor que nunca. Apesar do grande numero

de doutoramentos orientados pelo Prof. Mexia durante todo o perıodo em que se

processou o meu doutoramento, ele esteve quase sempre disponıvel para responder

as minhas duvidas, para me orientar no caminho a seguir e para em pouco tempo

dar um retorno sobre o material que lhe ia entregando. Mais do que O Professor, o

Prof. Mexia e um grande amigo com a ajuda do qual sei que posso contar noutras

situacoes.

A segunda pessoa que quero referir, e sem duvida, o meu colega do Centro de Ma-

tematica e Aplicacoes (CMA) e grande amigo Miguel Fonseca, sempre disposto para

discutir comigo as multiplas questoes que iam surgindo ao longo de todo processo.

Quero agradecer tambem a todos os outros meus colegas que diariamente ou

com alguma frequencia se encontram na sala do CMA, e que contribuem para o

bom ambiente de trabalho que aı se vive, o qual proporcionou a realizacao do meu

doutoramento.

Um grande agradecimento ao Professor Doutor Luıs Santos Pereira, meu co-

iv

orientador na area da hidrologia e coordenador do projecto de PTDC/AGR-AAM/

71649/2006 -“Gestao do risco em secas: Identificacao, monitorizacao, caracterizacao,

predicao e mitigacao”do qual sou bolseira de investigacao. Gracas a ele tive finan-

ciamento durante o ultimo ano de doutoramento e tive tambem a oportunidade de

estar inserida neste projecto e de ter publicado nas melhores revistas internacionais

da area da hidrologia. Obrigado por acreditar em mim.

Alem disso gostava tambem de agradecer a Professora Doutora Alexandra Ri-

beiro minha co-orientadora e coordenadora do projecto de investigacao POCTI/

32927/AGR/2000 - “Removal of Cu, Cr, As and creosote from impregnated wood

waste aiming its recycling”, no qual tiveram origem os dados que serviram de base

ao trabalho de aplicacao apresentado no capitulo 9 desta dissertacao.

Por fim dedico esta dissertacao a minha famılia: aos meus pais, porque a eles

devo grande parte do que sou, ao meu marido Joao Paulo que sempre me incentivou

a seguir em frente e a procurar uma actividade profissional em que me sentisse

realizada e ao meu pequenino Daniel, a luz que ilumina a minha vida e que da

sentido a tudo isto.

RESUMO

As famılias estruturadas de modelos (f.e.m.) sao constituıdas por modelos elementa-

res que correspondem aos tratamentos do modelo base, o qual pode ser ortogonal de

efeitos fixos com cruzamento-encaixe de factores. Por sua vez, os modelos elemen-

tares podem ser regressoes lineares multiplas nas mesmas variaveis, considerando

homocedasticidade entre as regressoes ou entao modelos log-lineares ajustados a

tabelas de contingencia. No tratamento das f.e.m., numa primeira fase, condensa-

se a informacao contida nos vectores de observacoes correspondentes aos modelos

elementares nas respectivas estatısticas suficientes e na segunda fase aplicam-se os

algoritmos desenvolvidos para o modelo base aos resultados obtidos na primeira fase.

Dado um modelo ortogonal λ =∑m

i=1 Xiαi associado a uma algebra de Jor-

dan comutativa, diz-se que y = Lλ + e e um modelo L-ortogonal se os vecto-

res coluna de L forem linearmente independentes. No caso nao equilibrado das

f.e.m. com regressoes multiplas, L sera uma matriz diagonal por blocos da forma

L = D(X1, ..., Xc), onde Xj sao as matrizes das regressoes individuais as quais di-

ferem de tratamento para tratamento. Desta forma, ultrapassa-se a restricao usual

requerendo que todas as regressoes tenham a mesma matriz de modelo.

Tres aplicacoes a dados reais sao apresentadas. Nas duas primeiras, aplicam-se

as f.e.m. com modelos log-lineares a hidrologia, atraves da analise de transicoes

entre classes de seca. Na terceira, analisam-se dados de experiencias de remocao

electrodialıtica de metais pesados utilizando o caso nao equilibrado das f.e.m..

ABSTRACT

Structuralized family of models (s.f.m.) are constituted by unit models correspon-

ding to the treatments of the base model, which can be orthogonal of fixed effects

with cross-nesting. On its side, the unit models can be multiple linear regressions

on the same variables, considering homoscedasticity between regressions or then,

log-linear models fitted to contingency tables. Following the treatment of s.f.m., in

a first step, information inside the observation vectors correspondent to unit models

is condensate in sufficient statistics and in second step, the algorithms developed for

the base model are applied to the results obtained in the first fase.

Given a orthogonal model λ =∑m

i=1 Xiαi associated to a commutative Jordan

algebra, it is said that y = Lλ+e is a L-orthogonal model if the column vectors the

matrix L are linearly independent. In the no-balanced case of the s.f.m. with multi-

ple regressions, L will be a diagonal by blocks matrix of the form L = D(X1, ..., Xc),

where Xj are the model matrices of the individuais regressions which can differ from

treatment to treatment. In this way, the usual restriction requiring all regressions

to have the same model matrix is overcame.

Three applications to real data are presented. In the two first applications,

s.f.m. with loglinear unit models are applied to hydrology, through the analysis of

transitions between drought classes. In the third one, data originated in experiments

of electrodialytic removal of heavy metals are analyzed using the non-balanced case

of s.f.m..

SIMBOLOGIA E NOTACOES

v → vector (letra minuscula a negrito)

0 → vector nulo

1 → vector de 1’s

Y → vector aleatorio (letra maiuscula a negrito)

A → matriz (letra maiuscula a negrito)

On → matriz nula de ordem n

In → matriz identidade de ordem n

Jn → matriz de 1’s de ordem n

AT → matriz transposta de A

A−1 → matriz inversa de A

A+ → matriz inversa generalizada de Moore-Penrose de A

⊗ → produto de Kronecker entre matrizes

Car(A) → caracterıstica da matriz A

Det(A) → determinante da matriz A

R(A) → Espaco imagem da matriz A

N(A) → Espaco nulidade da matriz A

dim(V) → Dimensao do sub-espaco V

x

V⊥/W → Complemento ortogonal do sub-espaco V relativamente a W

vV → projeccao ortogonal de v sobre o sub-espaco V

Q(V) → Matriz de projeccao ortogonal sobre o sub-espaco V

→ Soma directa ortogonal de sub-espacos

E(X) → Valor esperado da variavel aleatoria X

V (X) → Variancia da variavel aleatoria X

COV (X;Y ) → Covariancia entre a variavel aleatoria X e Y

E(Y) → Vector medio do vector aleatorio Y

COV(Y) → Matriz de covariancia do vector aleatorio Y

COV(X; Y) → Matriz de covariancia cruzada dos vectores aleatorios X e Y

D(d1, ..., dn) → Matriz diagonal com elementos principais d1, ..., dn

Pr() → Probabilidade

UMVUE → Uniforme minimal variance unbiased estimator

BLUE → Best linear unbiased estimator

a.j.c → Algebras de Jordan comutativas

f.e.m → Famılias estruturadas de modelos

CONTEUDO

1. Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2. Definicoes e Resultados Preliminares . . . . . . . . . . . . . . . . . . . . . 7

2.1 Matrizes Ortogonais Estandardizadas, Diagonalizadoras Ortogonais

e Matrizes Uniformizadoras . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Sub-Espacos e Algegras . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3 Matrizes Inversas Generalizadas de Moore-Penrose . . . . . . . . . . . 10

2.4 Matrizes de Projeccao Ortogonal . . . . . . . . . . . . . . . . . . . . 11

2.5 Produto de Kronecker entre Matrizes . . . . . . . . . . . . . . . . . . 12

2.6 Vector Medio, Matriz de Covariancia e Matriz de Covariancia Cruzada 14

2.7 Estatısticas Suficientes, Completas e Estimadores UMVUE . . . . . . 16

2.8 Testes de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.9 Vectores Normais e Testes F . . . . . . . . . . . . . . . . . . . . . . . 23

2.10 Modelos de Regressao Multipla . . . . . . . . . . . . . . . . . . . . . 26

2.10.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.10.2 Estimacao dos Coeficientes da Regressao . . . . . . . . . . . . 29

2.10.3 Testes de Hipoteses para Modelos de Regressao Multipla . . . 34

2.11 Modelos Log-Lineares e Tabelas de Contingencia . . . . . . . . . . . . 38

2.11.1 Modelos Log-lineares com 2 dimensoes . . . . . . . . . . . . . 41

xii Conteudo

3. Algebras de Jordan Comutativas . . . . . . . . . . . . . . . . . . . . . . . 43

3.1 Primeiros Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.2 Geracao de Algebras de Jordan Comutativas . . . . . . . . . . . . . . 48

3.3 Operacoes Binarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4. Modelos Lineares Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.1 Modelos Associados a uma Algebra de Jordan Comutativa . . . . . . 55

4.2 Estimadores UMVUE . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3 Inferencia para o Modelo de Efeitos Fixos . . . . . . . . . . . . . . . 61

4.4 Vectores Estimaveis e Testes F para os Efeitos Fixos . . . . . . . . . 64

4.5 Construcao de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.5.1 Modelos para Encaixe . . . . . . . . . . . . . . . . . . . . . . 65

4.5.2 Modelos para Cruzamento-Encaixe . . . . . . . . . . . . . . . 68

5. Famılias Estruturadas de Modelos:

Caso Equilibrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.2 Modelo Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.3 Modelos Elementares . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5.3.1 Regressoes Multiplas . . . . . . . . . . . . . . . . . . . . . . . 75

5.3.2 Modelos Log-Lineares . . . . . . . . . . . . . . . . . . . . . . . 79

6. Modelos L-Ortogonais para Efeitos Fixos . . . . . . . . . . . . . . . . . . . 85

6.1 Projeccoes e Estatısticas . . . . . . . . . . . . . . . . . . . . . . . . . 85

6.2 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6.3 Um Primeiro Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.4 Modelos Regressionais Multiplos: Caso nao Equilibrado . . . . . . . . 94

Conteudo xiii

6.4.1 Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6.4.2 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas

de Modelos Log-lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

7.3 Ajustamento de Modelos Log-lineares com Duas Dimensoes . . . . . . 103

7.4 Analise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

7.5 Resultados e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . 111

8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul

de Portugal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

8.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

8.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

8.3 Analise da Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . 117

8.4 Modelo Base “Two-Way” . . . . . . . . . . . . . . . . . . . . . . . . . 119

8.5 Resultados e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . 121

9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de

Resıduos de Madeira . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

9.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

9.2 Experiencias e Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

9.3 Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As

nos Electrolitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

9.3.1 Analise Regressional . . . . . . . . . . . . . . . . . . . . . . . 133

9.4 Interpretacao dos Resultados e Conclusoes . . . . . . . . . . . . . . . 141

xiv Conteudo

10. Conclusoes e Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . 143

Apendice 153

A. Tabelas Anexas ao Capitulo 7 . . . . . . . . . . . . . . . . . . . . . . . . . 155

B. Tabelas Anexas ao Capitulo 8 . . . . . . . . . . . . . . . . . . . . . . . . . 159

C. Artigos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

LISTA DE TABELAS

2.1 Tabela de contingencia com 2 dimensoes . . . . . . . . . . . . . . . . 41

7.1 Classificacao das classes de seca segundo o SPI . . . . . . . . . . . . . 102

7.2 Tabelas de contingencia com duas dimensoes: frequencias observadas

para Portalegre, Elvas, Evora, Beja, Barrancos e Almodovar . . . . . 103

7.3 Frequencias observadas e esperadas - Almodovar . . . . . . . . . . . . 106

7.4 Resultado das comparacoes multiplas de Scheffe para Almodovar . . . 111

7.5 Valores da estatıstica F para Portalegre, Elvas, Evora, Beja, Barran-

cos e Almodovar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.1 Definicao das zonas 1, 2, 3 e 4 . . . . . . . . . . . . . . . . . . . . . . 116

8.2 Valores das estatısticas F(h) para as diferentes frequencias esperadas

do numero de transicoes entre classes de seca . . . . . . . . . . . . . . 124

9.1 Tratamentos (condicoes experimentais) . . . . . . . . . . . . . . . . . 129

9.2 Estimadores dos coeficientes das regressoes para o Cobre, Cromio e

Arsenio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

9.3 Resultados dos testes F para o Cu . . . . . . . . . . . . . . . . . . . 136

9.4 Resultados do metodo de Scheffe para o Cu . . . . . . . . . . . . . . 137

9.5 Resultados dos testes F para o Cr . . . . . . . . . . . . . . . . . . . . 138

9.6 Resultados do metodo de Scheffe para o Cr . . . . . . . . . . . . . . . 138

9.7 Resultados dos testes F para o As . . . . . . . . . . . . . . . . . . . . 140

xvi Lista de Tabelas

9.8 Resultados do metodo de Scheffe para o As . . . . . . . . . . . . . . . 140

9.9 Resultados do metodo de Boferroni para o As . . . . . . . . . . . . . 140

A.1 Valores para os estimadores dos parametros dos modelos de quasi-

associacao ajustados as tabelas de contingencia e respectivos desvios

residuais das 6 estacoes. . . . . . . . . . . . . . . . . . . . . . . . . . 156

A.2 Resultado das comparacoes multiplas de Scheffe para Portalegre, El-

vas, Evora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

A.3 Resultado das comparacoes multiplas de Scheffe para Beja, Barrancos

e Almodovar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

B.1 Tabelas de contingencia para zona 1 e 2 . . . . . . . . . . . . . . . . . 160

B.2 Tabelas de contingencia para zona 3 e 4 . . . . . . . . . . . . . . . . . 161

B.3 Estimadores dos parametros dos modelos de quasi-associacao ajusta-

dos as tabelas de contingencia e respectivos desvios residuais das 40

estacoes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

B.4 Valores para yi e V (yi) . . . . . . . . . . . . . . . . . . . . . . . . . . 163

1. INTRODUCAO

As combinacoes de nıveis dos factores que intervem num modelo correspondem aos

tratamentos. Uma famılia de modelos e estruturada quando os respectivos modelos

correspondem aos tratamentos doutro modelo. Diz-se que este ultimo e o modelo

base para o destingir dos modelos constituintes da famılia estruturada, modelos esses

designados de modelos elementares.

No que diz respeito a teoria desenvolvida nesta dissertacao ira considerar-se o

caso em que:

1. O modelo base e de efeitos fixos com cruzamento-encaixe completo e equili-

brado de 2 ou mais factores e esta associado a uma algebra de Jordan comu-

tativa A, e

2. Os modelos elementares podem corresponder a regressoes lineares nas mesmas

variaveis ou a modelos log-lineares ajustados a tabelas de contingencia.

As famılias estruturadas de modelos correspondem a uma formalizacao dos modelos

regressionais multiplos introduzidos em Mexia (1987). Desde entao, alguns desen-

volvimentos particulares e aplicacoes tem sido efectuados, nomeadamente na tese de

Moreira (2004) onde foram contempladas as situacoes de multicolinariedade e hete-

rocedasticidade dos modelos de regressao multipla para um modelo base de efeitos

fixos com 1 factor e correspondente aplicacao a remocao electrodialıtica de metais

pesados. Nas teses de Saraiva (1996), Cruz (2001) e Ferreira (1996) com a aplicacao

2 1. Introducao

dos delineamentos regressionais multiplos quando o delineamento base e de quadra-

dos latinos, blocos casualizados e planos completos, respectivamente. Tambem foi

extendida a teoria delineamentos regressionais ao caso em que o modelo base e um

plano factorial de base 2 em Domingues (1997) e factorial de base prima em Oliveira

(2005).

No tratamento de famılias estruturadas de modelos tendera a seguir-se uma es-

trategia que agora ira procurar por-se em evidencia. Assim, numa primeira fase,

comecar-se-a por condensar a informacao contida nos vectores de observacoes cor-

respondentes aos modelos elementares nas respectivas estatısticas suficientes e numa

segunda fase aplicar-se-ao os algoritmos desenvolvidos para o modelo base aos re-

sultados obtidos na primeira fase.

Em primeiro lugar, admite-se que os modelos elementares sao indexados por

i = 1, ..., c, tem vectores de observacao yi e vectores de parametros relevantes φi,

com c o numero de tratamentos do modelo base.

Concretize-se para o caso dos modelos regressionais multiplos. Neste caso, φi

sera composto pelo vector dos coeficientes da regressao βi e pela variancia σ2i . Muitas

vezes admite-se a homocedasticidade, i.e., σ2i = σ2, i = 1, ..., c, ou seja a variancia

do erro nao varia de modelo elementar para modelo elementar. Quando se tem

yi ∼ N(Xiβi, σ

2Ini)

onde Xi e a matriz do modelo regressional do tipo ni × k, as estatısticas suficientes

serao

βi =(XTi Xi

)+XTi yi, i = 1, ..., c

e

SQEi = yTi yi − yTi Xiβi, i = 1, ..., c

com A+ a inversa de Moore-Penrose de A. Contudo, o caso que sera analisado e o

3

caso regular, para o qual se admite Xi = X, i = 1, ..., c e supoe-se que X e do tipo

n× (k + 1) com vectores coluna linearmente independentes. Tem-se entao,

βi =(XT X

)−1XTyi ∼ N

(βi, σ

2(XT X)−1)

independente de

SQEi = yTi yi − yTi Xβi ∼ σ2χ2n−k−1.

Os pares(βi, SQEi

), i = 1, ..., c conterao toda a informacao transportada pelos

vectores das observacoes.

Nos modelos regressionais multiplos esta-se interessado em coeficientes individu-

ais da regressao, ou nas suas combinacoes lineares. Sendo a o vector dos coeficientes

duma combinacao linear, faz-se

yi = aT βi

e

SSQE =c∑i=1

SQEi ∼ σ2χ2g′

com g′ = c(n−k−1). Alem disso vem E(yi) = aTβi = µi e V (yi) = σ2aT (XT X)−1a.

Ordenem-se os tratamentos do modelo base mediante os ındices i = i(j) = 1, ..., c.

Seja y o vector cujas componentes sao os valores yi reordenados pelos ındices i. Este

vector sera normal e ira constituir para o modelo base, o vector de observacoes para

o qual vem

E(yi) = µ

com µ o vector cujas componentes sao as combinacoes lineares µi, com ındices

i = 1, ..., c, dos βi. Aplicando o algoritmo correspondente ao modelo base a y pode-

se estudar a influencia dos factores do modelo base nos valores das combinacoes

lineares dos coeficientes das regressoes.

4 1. Introducao

No que diz respeito a estrutura da dissertacao que segue, comeca-se por apresen-

tar resultados preliminares de forma a ter-se uma dissertacao auto-suficiente. Estes

resultados serao de natureza algebrica e de natureza estatıstica. Os resultados de

natureza algebrica referir-se-ao principalmente as algebras de Jordan comutativas e

operacoes binarias sobre algebras de Jordan. Estas algebras sao espacos vectoriais

constituıdos por matrizes simetricas que comutam e que contem os quadrados das

respectivas matrizes simetricas. As mesmas sao utilizadas para estudar modelos

normais ortogonais [5], [7] e [2].

Os resultados mais importantes de natureza estatıstica referir-se-ao a estatısticas

suficientes e completas, estimadores UMVUE, testes de hipoteses, vectores normais

e ao tratamento das regressoes lineares e modelos log-lineares.

Segue-se o tratamento de modelos ortogonais associados a algebras de Jordan

comutativas, comecando pelo caso usual

y =w∑j=1

Xjαj + e

com os αj, j = 1, ...,m vectores fixos, os αj, j = m + 1, ..., w e e vectores normais

independentes com valores medios nulos e matrizes de covariancia σ2j Icj , j = m +

1, ..., w e σ2In respectivamente. Como adiante sera visto, admitida a normalidade do

modelo, consegue-se obter estatısticas suficientes e completas que permitem obter

estimadores UMVUE podendo-se, em seguida, estudar-se a inferencia para os para

modelos de efeitos fixos. No seguimento constroem-se os modelos para o cruzamento-

encaixe de factores.

Com vista a conjugar a teoria dos modelos regressionais multiplos com os mo-

delos ortogonais associados a algebras de Jordan comutativas, deparou-se com a

necessidade de desenvolver outro tipo de modelos, designados de L-ortogonais, os

quais ja saem um pouco fora da ortogonalidade. Estes modelos permitem o estudo

5

do caso nao equilibrado, relativo aos modelos regressionais multiplos, com modelo

base de efeitos fixos, caso esse em que as matrizes Xj poderao nao ser iguais para

todos os tratamentos.

Para por em evidencia a versatilidade e potencia das tecnicas desenvolvidas

apresentam-se aplicacoes a duas situacoes bem distintas:

• Analise de transicoes entre classes de seca na hidrologia, e

• Experiencias de remocao electrodialıtica de metais pesados na remediacao am-

biental.

Na primeira e segunda aplicacoes os modelos elementares sao log-lineares e na ter-

ceira sao regressoes polinomiais.

6 1. Introducao

2. DEFINICOES E RESULTADOS PRELIMINARES

2.1 Matrizes Ortogonais Estandardizadas, Diagonalizadoras

Ortogonais e Matrizes Uniformizadoras

Dado um numero inteiro s considerem-se as matrizes ortogonais

Ps =

1√s1sT

...

Ts

em que Ts e uma sub-matriz de Ps constituıda pelas linhas de Ps menos a primeira.

As linhas de Ts sao vectores de contrastes mutuamente ortogonais de norma um.

Vectores de contrastes sao vectores cujas componentes sao os coeficientes duma

combinacao linear sendo a soma das componentes desse vector nula. As matrizes Ps

assim definidas sao chamadas ortogonais estandardizadas. Estas matrizes sao

muito utilizadas para analisar a accao de factores com nıveis quantitativos [18].

Sendo A uma matriz simetrica de ordem k, existem matrizes ortogonais P de

ordem k tais que

PAPT = D(r1, r2, ..., rk)

com D(r1, r2, ..., rk) uma matriz diagonal, cujos elementos da primeira diagonal (ele-

mentos principais) r1, r2, ..., rk sao os valores proprios da matriz A. Enquanto P e

a matriz diagonalizadora ortogonal de A, os seus vectores linha x1,x2, ...,xk

8 2. Definicoes e Resultados Preliminares

serao vectores proprios ortonormados de A associados aos valores proprios com o

mesmo ındice [35].

Se A for definida positiva ter-se-a rj > 0, j = 1, ..., k, estando definida a matriz

G0 = D(r−1/21 , r

−1/22 , ..., r

−1/2k )P

que e solucao da equacao matricial

MAMT = Ik.

As solucoes desta equacao serao as matrizes uniformizadoras de A, representando-

se a respectiva familia por U(A). Em particular G0 sera a uniformizadora directa

de A.

Mostra-se que, ver [14],

• G ∈ U(A)⇐⇒ A−1 = GTG

• se G ∈ U(A) com M regular tem-se GM−1 ∈ U(MAMT );

• se G ∈ U(A), G′ ∈ U(A) se e so se G′G−1 for uma matriz ortogonal.

Assim, G ∈ U(A) se e so se G = PG0, com P ortogonal.

Tendo as matrizes simetricas que comutam especial interesse nesta dissertacao,

apresenta-se o seguinte resultado

Proposicao 2.1.1. Sejam A1, ...,Am matrizes k × k simetricas. Entao existe uma

matriz ortogonal P tal que para cada i, PTAiP = Di e uma matriz diagonal cu-

jos elementos principais sao os valores proprios de Ai se e so se AiAj = AjAi

para todos os pares (i, j), i, j = 1, ...,m, isto e, se e so se as matrizes A1, ...,Am

comutarem.

Demonstracao. Ver [35].

2.2. Sub-Espacos e Algegras 9

2.2 Sub-Espacos e Algegras

Sendo V um sub-espaco vectorial proprio do espacoW ⊆ Rn, o conjunto dos vectores

de W ortogonais a todos os vectores de V constituem um sub-espaco denominado

complemento ortogonal de V relativamente a W . Sendo V⊥/W o complemento

ortogonal de V relativamente a W , todo o vector de W sera a soma dum vector de

V com um vector de V⊥/W , sendo W a soma directa ortogonal de V com V⊥/W ,

visto essa decomposicao ser unica. QuandoW = Rk por-se-a V⊥/W = V⊥, tendo-se

(V⊥)⊥ = V .

Recorde-se que um sub-espaco W ⊆ Rn e a soma directa dos sub-espacos V1

e V2 se todo o vector v ∈ W tiver uma decomposicao unica v = v1 + v2 com

vj ∈ Vj, j = 1, 2. Se todo o vector de V1 for ortogonal a todo o vector de V2, entao

V1 e V2 serao sub-espacos ortogonais cuja soma directa ortogonal sera W . vj sera a

projeccao ortogonal de v sobre Vj, j = 1, 2.

Segundo Seber(1980), dada a matriz A do tipo n×k, o seu sub-espaco imagem

sera

R(A) = v : v = Au

enquanto que o seu sub-espaco nulidade sera

N(A) = u : Au = 0

tendo-se

R(AT ) = N(A)⊥.

Recorde-se agora tambem a definicao de algebra. Uma algebra A e um espaco

linear equipado com uma operacao binaria ∗, usualmente chamada de produto, para

o qual as propriedades seguintes se verificam para todos os α ∈ R e a,b, c ∈ A:

• a ∗ (b + c) = a ∗ b + a ∗ c;


• (a + b) ∗ c = a ∗ c + b ∗ c;

• α(a ∗ b) = (αa) ∗ b = a ∗ (αb).

Alem do mais, uma algebra A e associativa se e so se, para todos os a,b, c ∈ A,

(a ∗ b) ∗ c = a ∗ (b ∗ c)

e e comutativa se e so se, para todos os a,b ∈ A,

a ∗ b = b ∗ a.

Sublinhe-se que as propriedades associativa e comutativa nao sao necessarias para

que um espaco linear seja uma algebra.

2.3 Matrizes Inversas Generalizadas de Moore-Penrose

Qualquer que seja a matriz A existe uma e uma so matriz A+ tal que, ver [30],

1)AA+A = A

2)A+AA+= A+

3)(AA+

)T= AA+

4)(A+A

)T= A+A

.

A matriz A+ denomina-se a inversa de Moore-Penrose de A. Se A for regular

A+=A−1. Por outro lado, sendo A simetrica k × k com Car(A) = l < k, pode-se

sempre ordenar os vectores linha de uma matriz P diagonalizadora ortogonal de A

de forma a ter-se

PAPT = D(r1, r2, ..., rl, 0, ..., 0)

com r1, r2, ..., rl os valores proprios nao nulos de A, tendo-se

A = PTD(r1, r2, ..., rl, 0, ..., 0)P

2.4. Matrizes de Projeccao Ortogonal 11

e

A+ = PTD(r−11 , ..., r−1

l , 0, ..., 0)P.

2.4 Matrizes de Projeccao Ortogonal

DadoW um espaco vectorial soma directa ortogonal dos sub-espacos V1 e V2, definiu-

se atras a projeccao ortogonal vVj de v ∈ W sobre Vj, j = 1, 2. Ter-se-a ainda

vVj = Q(Vj)v, j = 1, 2

com Q(Vj) a matriz de projeccao ortogonal sobre Vj, j = 1, 2. Verifica-se

facilmente que

Q(V⊥) = In −Q(V)

vindo

vV⊥ = v − vV = (I−Q(V))v.

Recorde-se ainda que Q e matriz de projeccao ortogonal se e so se for

idempotente e simetrica.

De seguida irao ser recordados alguns resultados bem conhecidos sobre matrizes

de projeccao ortogonal [14].

Proposicao 2.4.1. Dada a matriz X do tipo n× k e tomando-se

Ω = R(X)

ℵ = R(XT )

as matrizes de projeccao ortogonal sobre Ω e ℵ serao

Q(Ω) = X(XTX)+XT

Q(ℵ) = (XTX)+(XTX).


Proposicao 2.4.2. Para v ∈ Ω tem-seQ(Ω)v = v

Q(Ω⊥)v = 0.

Proposicao 2.4.3. Dado um vector v, o vector u ∈ Ω que minimiza ‖v − u‖2 e

vΩ.

Proposicao 2.4.4. Fazendo v = (XTX)+XTz com z um vector arbitrario tem-se

zΩ = Xv, ou seja zΩ ∈ R(X).

2.5 Produto de Kronecker entre Matrizes

Dadas as matrizes A = [ai,j] do tipo m×n e B do tipo p× q, o respectivo produto

de Kronecker e dado pela matriz por blocos de ordem mp× nq

A⊗B =

a11B a12B · · · a1nB

a21B a22B · · · a2nB

· · · · · · · · · · · ·

am1B am2B · · · amnB

. (2.1)

Verifica-se facilmente que, estando definidos os produtos usuais A1A2 e B1B2,

se tem

(A1 ⊗B1)(A2 ⊗B2) = (A1A2)⊗ (B1B2) (2.2)

(A⊗B)T = AT ⊗BT .

Certas classes de matrizes sao “fechadas” para o produto⊗, assim, com Js = 1s1s

2.5. Produto de Kronecker entre Matrizes 13

tem-se

1u ⊗ 1v = 1uv

Iu ⊗ Iv = Iuv

Ju ⊗ Jv = Juv

vendo-se ainda que o produto ⊗ de matrizes ortogonais, ortogonais estandardizadas,

simetricas, idempotentes da respectivamente matrizes ortogonais, ortogonais estan-

dardizadas, simetricas, idempotentes. Daqui resulta que o produto ⊗ de matrizes

de projeccao ortogonal da matrizes de projeccao ortogonal.

Sendo D(γ1) e D(γ2) matrizes diagonais cujos elementos principais sao as com-

ponentes do vectores γ1 e γ2 respectivamente, tem-se

D(γ1)⊗D(γ2) = D(γ1 ⊗ γ2). (2.3)

Dadas as matrizes simetricas M1 e M2, existem matrizes ortogonais P1 e P2 e

matrizes diagonais D(γ1) e D(γ2) tais que

PjMjPTj = D(γj), j = 1, 2.

Os elementos principais de D(γj), j = 1, 2 sao os valores proprios de Mj correspondendo-

lhes, como vectores proprios, os vectores linha de Pj, j = 1, 2 (seccao 2.1). Ter-se-a

entao, atendendo a (2.2) e a (2.3):

(P1 ⊗P2) (M1 ⊗M2) (P1 ⊗P2)T =(P1M1P

T1

)⊗(P2M2P

T2

)= D (γ1 ⊗ γ2)

(2.4)

pelo que os valores proprios de M1 ⊗M2 serao os produtos dos valores proprios

de M1 e M2 e os vectores proprios sao os vectores linha de P1 ⊗ P2. Como a

caracterıstica de uma matriz simetrica e o numero dos seus valores proprios nao

nulos, ve-se que

Car(M1 ⊗M2) = Car(M1)Car(M2). (2.5)


Sendo o determinante de Mj, j = 1, 2 o produto dos seus valores proprios, o mesmo

acontecendo para o determinante de M1 ⊗M2, ter-se-a

Det (M1 ⊗M2) = Det (M1)Det (M2) . (2.6)

Por outro lado, ver [38], para qualquer matriz Vj tem-se

Car(Vj) = Car(VjVTj ), j = 1, 2

e como

(V1 ⊗V2) (V1 ⊗V2)T =(V1V

T1

)⊗(V2V

T2

)ter-se-a

Car (V1 ⊗V2) =2∏j=1

Car(VjV

Tj

)=

2∏j=1

Car (Vj). (2.7)

E ainda facil de verificar que, ver [38],(m∑i=1

aiVi

)⊗

(n∑j=1

bjUj

)=

m∑i=1

n∑j=1

aibj(Vi ⊗Uj) (2.8)

e utilizando (2.2), tem-se

(V1 ⊗V2)+ = V+1 ⊗V+

2 . (2.9)

Em particular se V1 e V2 forem regulares tem-se tambem

(V1 ⊗V2)−1 = V−11 ⊗V−1

2 . (2.10)

2.6 Vector Medio, Matriz de Covariancia e Matriz de Covariancia

Cruzada

Um vector aleatorio sera um vector cujas componentes sao variaveis aleatorias en-

quanto que uma matriz aleatoria sera uma matriz cujos elementos sao variaveis

aleatorias.

2.6. Vector Medio, Matriz de Covariancia e Matriz de Covariancia Cruzada 15

Dado um vector aleatorio

X =

X1

...

Xn

o vector medio de X tera como componentes os valores medios das componentes

de X, assim

E (X) =

E (X1)...

E (Xn)

quando estes valores medios estao definidos. Analogamente os elementos da matriz

media de uma matriz aleatoria serao os valores medios, supostos definidos, dos

elementos da matriz aleatoria. Em particular a matriz da covariancia do vector

aleatorio X sera

COV (X) = E[(X− E (X)) (X− E (X))T

]=

V (X1) . . . COV (X1, Xn)...

. . ....

COV (Xn, X1) · · · V (Xn)

supondo-se as variancias V (Xj), j = 1, ..., n e as covariancias COV (Xj, Xi), j, i =

1, ...n, j 6= i todas definidas. Uma matriz de covariancia e sempre simetrica.

Dado o par (X; Y) de vectores aleatorios de ordem n e m respectivamente, a

respectiva matriz de covariancia cruzada sera

COV (X; Y) = E[(X− E (X)) (Y− E (Y))T

]=

COV (X1, Y1) . . . COV (X1, Ym)...

. . ....

COV (Xn, Y1) · · · COV (Xn, Ym)

.supondo-se, mais uma vez, definidas as COV (Xj, Yi), j = 1, ...n, i = 1, ...,m. Se os

vectores X e Y forem independentes tem-se COV (X; Y) = On,m (matriz nula do

tipo n×m).


Utilizando a linearidade do operador E mostra-se facilmente que

• E (AX + a) = AE(X) + a

• COV (AX + a) = ACOV(X)AT

• COV (AX + a; BX + b) = ACOV(X)BT

• COV (AX + a; BY + b) = ACOV (X; Y) BT

onde A e B sao matrizes do tipo r×n e s×m, respectivamente e a e b vectores de

ordem r e s respectivamente. Alem disso, como

X + Y = [I : I]

X

Y

e COV(X,Y) e a matriz nula quando X e Y sao independentes, pode-se mostrar

entao que

COV (X + Y) = COV(X) + COV (Y) .

2.7 Estatısticas Suficientes, Completas e Estimadores UMVUE

Represente-se por En o espaco amostral constituıdo por todas as amostras possıveis

de dimensao n. Seja x uma amostra de dimensao n que sera vista como uma

realizacao vector aleatorio X, tendo-se Pr(X ∈ En) = 1. As probabilidade associadas

a X podem ser determinadas pela respectiva distribuicao F (x|θ) = Pr(X ≤ x|θ),

com θ um parametro a variar no espaco parametrico Ω. A funcao densidade de

X, caso exista, representa-se por f(x,θ), no caso discreto f(x,θ) sera a funcao de

probabilidade.

2.7. Estatısticas Suficientes, Completas e Estimadores UMVUE 17

Dada uma particao de En em conjuntos Ci, disjuntos dois a dois, atendendo ao

teorema da probabilidade total, tem-se

F (x|θ) =∑i

Pr(X ∈ Ci|θ) Pr(X 6 x|X ∈ Ci,θ) =∑i

Pr(X ∈ Ci|θ)F (x|Ci,θ)

(2.11)

com

F (x|Ci,θ) = Pr(X 6 x|X ∈ Ci, θ).

Uma particao diz-se suficiente quando as distribuicoes condicionais nao dependem

de θ, tendo-se

F (x|θ) =∑i

Pr(X ∈ Ci|θ)F (x|Ci). (2.12)

Uma estatıstica T(x) sera uma qualquer funcao escalar ou vectorial definida

no espaco amostral. As imagens inversas dadas por T(x) constituem uma particao

de En. Se a particao induzida por uma estatıstica for suficiente, entao a estatıstica

sera suficiente. Por outras palavras, T(x) ser suficiente significa que T(x) contem

toda a informacao acerca de θ que esta contida na amostra, podendo proporcionar

uma reducao de dados sem perda de informacao.

Um importante criterio de suficiencia e dado pela

Proposicao 2.7.1. Teorema da Factorizacao

A estatıstica T(x) e suficiente se e so se existirem funcoes nao negativas g e h tal

que

f(x|θ) = g (T(x)|θ)h(x)

onde h(x) nao depende de θ.

A seguir apresenta-se a demonstracao para o caso discreto, no entanto a tese

tambem e valida para o caso contınuo [13].


Demonstracao. Admita-se que se verifica a factorizacao. Quando T(x) = t, ter-se-a

Pr(T(x) = t|θ) =∑

x∈T−1(t)

f(x|θ) =∑

x∈T−1(t)

g(T(x)|θ)h(x) = g(t|θ)∑

x∈T−1(t)

h(x)

vindo para x ∈ T−1(t)

Pr(X = x|T = t,θ) =Pr [(X = x) ∩ (T = t)|θ]

Pr(T = t|θ)=

Pr(X = x|θ)

Pr(T = t|θ)

=g(t|θ)h(x)

g(t|θ)∑

x′∈T−1(t′)

h(x′)=

h(x)∑x′∈T−1(t′)

h(x′)

o que mostra que as distribuicoes condicionais nao dependem de θ, pelo que a

estatıstica sera suficiente.

Inversamente, por um lado igualmente se tem

Pr(X = x|T = t,θ) =Pr(X = x|θ)

Pr(T = t|θ)=

f(x|θ)

Pr(T = t|θ)

e por outro

Pr(X = x|T = t,θ) = h(x)

onde h(x) nao depende de θ por T(x) ser suficiente. Basta pois fazer g(t|θ) =

Pr(T = t|θ) para concluir que se tem a factorizacao.

Por outro lado, se para uma qualquer funcao g de T se tiver

E (g(T)|θ) = 0, ∀θ ∈ Ω =⇒ Pr (g(T) = 0|θ) = 1, ∀θ ∈ Ω,

T(x) sera uma estatıstica completa. Tem-se ainda

Proposicao 2.7.2. Se X tem distribuicao pertencente a familia exponencial de

dimensao s ou seja se

f(x|θ) = b(θ)h(x) exp

(s∑i=1

li(θ)Ti(x)

)

2.7. Estatısticas Suficientes, Completas e Estimadores UMVUE 19

onde b e li sao funcoes do parametro θ e Ti sao estatısticas e alem disso se um pro-

duto cartesiano de intervalos nao degenerados estiver contido no espaco parametrico

Ω, a estatıstica T(x) = [T1(x)...Ts(x)] sera suficiente e completa.

Demonstracao. Ver [13], [12] e [38].

Um estimador dum parametro sera uma estatıstica cujos valores sao “apro-

ximacoes” aos verdadeiros valores do parametro. Entre as propriedades convenien-

tes que um estimador pode ter esta ser UMVUE (estimador centrado de variancia

uniformemente mınima). Diz-se que g(X) e UMVUE de g(θ) se for centrado, i.e.

E(g(X)) = g(θ)

e se para todo θ se tem

V (g(X)|θ) ≤ V (g(X)|θ)

onde g(X) e qualquer outro estimador centrado de g(θ).

Como se ira ver, as estatısticas suficientes e completas sao uteis para se obter

UMVUE’s. Com efeito tem-se o

Proposicao 2.7.3. Teorema de Rao-Blackwell

Seja g uma funcao convexa e g um estimador centrado de g(θ). Dada a estatıstica

suficiente T(x)

• g(t) = E(g(X)|T(x) = t) e funcao da estatıstica suficiente T(x) = t mas nao

e funcao de θ;

• g(T(x)) e um estimador centrado de g(θ);

• V (g|θ) ≤ V (g|θ) para todo o θ.



e o

Proposicao 2.7.4. Teorema de Blackwell-Lehmann-Scheffe

Se T for uma estatıstica suficiente e completa e existir um estimador centrado g

para g(θ), g(t) = E(g(X)|T(x) = t) sera estimador UMVUE de g(θ).

Demonstracao. Atendendo ao teorema de Rao-Blackwell, sabe-se que g e estimador

centrado de g e a variancia deste nunca excede a variancia de g. Supondo agora

que existia um outro estimador centrado g para g, devido mais uma vez ao teorema

Rao-Blackwell, sabe-se que ˇg(t) = E(g(X)|T = t) e funcao de t mas nao de g(θ),

sendo estimador centrado de g e V (ˇg|θ) ≤ V (g|θ).

Como T e estatıstica suficiente e completa e g(t) se g(t) sao funcoes de t com o

mesmo valor medio, qualquer que seja θ, ter-se-a Pr(g(T) = g(T)|θ) = 1, qualquer

que seja θ, o que estabelece a tese.

2.8 Testes de Hipoteses

Atraves de um teste de hipoteses, pretende-se, de um modo geral, tomar uma decisao

ou fazer uma escolha de entre duas hipoteses alternativas, baseada na informacao

conhecida. Nesta seccao apenas serao abordados os testes de hipoteses parametricos,

para os quais a decisao e feita relativamente a um parametro desconhecido θ per-

tencente a um conjunto conhecido Θ em que

θ ∈ Θ0 ∨ θ ∈ Θ1, com Θ0,Θ1 ⊂ Θ e Θ0 ∩Θ1 = ∅.

Portanto, a escolha sera feita de entre a hipotese

H0 : θ ∈ Θ0

designada de hipotese nula a outra hipotese possıvel

H1 : θ ∈ Θ1

2.8. Testes de Hipoteses 21

designada de hipotese alternativa.

Considere-se uma amostra X = [X1, ..., Xn]T de variaveis aleatorias independen-

tes e identicamente distribuıdas, pertencentes a uma classe de densidades

F = fθ(.) : θ ∈ Θ.

Os testes de hipoteses sao regras criadas para tomar uma decisao e aos quais estao

associados um risco e uma perda.

Defina-se φ(x) a regra de decisao, que tomara o valor 0 se a H0 for aceite e o

valor 1 se esta for rejeitada em favor de H1.

Em qualquer processo de decisao existem associados erros. Nos testes de hipoteses

em que existe hipotese nula e alternativa existem 2 tipos de erro:

1. Erro tipo I: Probabilidade de rejeitar H0 quando H0 e verdadeira;

2. Erro tipo II: Probabilidade de aceitar H0 quando H1 e verdadeira.

Associado a um teste de hipoteses existe tambem uma regiao de aceitacao

R0 = x : φ(x) = 0

e uma regiao crıtica

R1 = x : φ(x) = 1.

O tamanho dum teste e dado pelo

supθ∈Θ

Pr(X ∈ R1)

o qual representa, de facto, o valor maximo que o erro tipo I pode assumir. Nos

testes de hipoteses a ser utilizados tem-se

supθ∈Θ

Pr(X ∈ R1) ≤ q


onde q representa o nıvel de significancia escolhido para um teste, que usualmente

pode assumir os valores 0.1, 0.05 e 0.01. Ao inverso, pode ser obtido o mais pequeno

nıvel de significancia abaixo do qual a hipotese nula seria rejeitada. A esse valor

chama-se “p-value”.

A potencia dum teste para algum θ ∈ Θ1 e dada por

Pot = Pr(X ∈ R1)

e a funcao potencia de um teste φ por

Potφ(θ) = Pr(X ∈ R1),θ ∈ Θ.

A funcao potencia dum teste da, em funcao do parametro, a probabilidade de

se rejeitar a hipotese nula, ou por outras palavras descreve a eficiencia dum teste a

detectar o afastamento dos dados da hipotese nula.

Nesse sentido, pretende-se pois maximizar a funcao potencia. Para tal, tomando

φ(x) =

0, x ∈ R0

1, x ∈ R2

ha que maximizar

Potφ(θ) = E(φ(x)), ∀θ ∈ Θ1

sujeito a condicao

E(φ(x)) ≤ q,∀θ ∈ Θ0.

Quando Θ0 e Θ1 tem apenas um elemento, a solucao e dada pela

Proposicao 2.8.1. (Lema Fundamental de Neyman-Pearson). Seja Θ0 = θ0 e

Θ1 = θ1, entao existe uma constante c tal que

1. φ(x) =

0,

fθ1(x)

fθ0(x)< c

1,fθ1(x)

fθ0(x)> c

;

2.9. Vectores Normais e Testes F 23

2. θ = θ0 ⇒ E(φ(X)) = q;

e φ e o mais potente teste para H0 : θ = θ0 vs. H1 : θ = θ1 ao nıvel de significancia

q. Alem disso, se φ∗ for um teste mais potente entao se satisfaz 1. tambem satisfaz

2. com probabilidade 1.


Nos testes de hipoteses e impossıvel escolher a melhor regra de decisao. A solucao

para este problema podera ser restringir a classe de regras de decisao de modo que

estas retenham propriedades desejaveis. Uma dessas propriedades e serem testes

nao distorcidos.

Um teste φ tal que Potφ(θ) ≤ q,∀θ ∈ Θ0

Potφ(θ) ≥ q,∀θ ∈ Θ1

diz-se nao distorcido, isto e, a potencia do teste para θ ∈ Θ1 e sempre maior que

o erro tipo I. Quando Potφ(θ0) = q, a probabilidade de rejeitar H0 quando H1 e

verdadeira e maior que a probabilidade de rejeitar H0 quando H0 e verdadeira.

2.9 Vectores Normais e Testes F

Dado Y um vector aleatorio de ordem n a respectiva funcao geradora de momentos

sera

ϕY(u) = E(eu

TY)

sendo facil de se verificar que

ϕAY+b(v) = ebTvϕY(ATv).


Sendo E(Y) = µ

COV(Y) = M

se a funcao geradora de momentos de Y for

ϕY(u) = eµTu+ 12uTMu (2.13)

o vector aleatorio Y, ver [14], sera normal escrevendo-se

Y ∼ N(µ,M).

Utilizando a expressao (2.13) e facil de mostrar que

AY + a ∼ N(Aµ+ a,AMAT ).

Dado agora Y ∼ N(µ, σ2In), ‖Y‖2 sera, ver [14], o produto por σ2 dum qui-

quadrado com n graus de liberdade e parametro de nao centralidade

δ =1

σ2‖µ‖2

escrevendo-se

‖Y‖2 ∼ σ2χ2n,δ.

Seja agora S ∼ σ2χ2m independente de Y

F =‖Y‖2/nS/m

tera, ver [14], distribuicao F com n e m graus de liberdade e parametro de nao

centralidade δ, escrevendo-se

F ∼ Fn,m,δ.

Em particular se µ = 0, δ = 0, vindo

‖Y‖2 ∼ σ2χ2n

2.9. Vectores Normais e Testes F 25

e portanto F tera distribuicao F central, escrevendo-se

F ∼ Fn,m.

Mais geralmente, ver [14], se Y ∼ N(µ, σ2M) com Car(M) = l ≤ n tem-se

(Y − b)TM+(Y − b) ∼ σ2χ2l,δ

com

δ =(µ− b)TM+(µ− b)

σ2

e b um vector qualquer, e se SQ ∼ σ2χ2m for independente de Y, ter-se-a que

F =m

l

(Y − b)TM+(Y − b)

SQ∼ Fl,m,δ.

F sera a estatıstica de um teste de hipoteses F com l e m graus de liberdade para

testar a hipotese

H0 : µ = b.

Em particular se b = µ ou seja se H0 se verificar, δ = 0, vindo

(Y − µ)TM+(Y − µ) ∼ σ2χ2l

logo

F ′ = m

l

(Y − µ)TM+(Y − µ)

SQ∼ Fl,m

ou seja F ′ tem distribuicao F central com l e m graus de liberdade.

Sendo F1−q,l,m o quantil para a probabilidade 1− q de Fl,m tem-se

Pr [F ′ ≤ F1−q,l,m] = 1− q

ou seja, como δ = 0 tem, neste caso, Pot = Pr [F ′ > F1−q,l,m,] = q donde o teste

sera nao distorcido. Como consequencia, as desigualdades

(µ−Y)TM+(µ−Y) ≤ lF1−q,l,mSQ

m


definem elipsoides de confianca nıvel 1− q para µ, isto e, a probabilidade de µ estar

coberto pelo elipsoide anterior e 1 − q, donde o teste F de nıvel q nao rejeita a H0

se e so se b pertencer ao elipsoide de confianca nıvel 1 − q atras definido. Diz-se,

neste caso, que o teste goza de dualidade [15] e [17].

Quando M e definida positiva, M+ = M−1 tambem e definida positiva, vindo

δ =(µ− b)TM−1(µ− b)

σ2,

podendo reescrever-se a hipotese nula como H0 : δ = 0, uma vez que

µ = b⇐⇒ δ = 0.

Neste caso, o teste e estritamente nao distorcido [14].

2.10 Modelos de Regressao Multipla

2.10.1 Introducao

Quando se tem uma variavel resposta y que depende de k variaveis independentes

ou variaveis controladas x1, x2, ..., xk, a relacao entre estas variaveis e caracterizada

por um modelo matematico, chamado modelo regressional.

O modelo regressional pode ser linear

y = α0 + α1x1 + α2x2 + ...+ αkxk + ε (2.14)

ou nao linear, como por exemplo exponencial, logarıtmico, etc. A equacao (2.14)

representa um modelo regressional multiplo linear, dado que se trata duma funcao

linear nos parametros ou coeficientes desconhecidos da regressao α1, α2, ..., αk.

No modelo regressional multiplo, cada αj, j = 1, ..., k representa a variacao es-

perada na variavel resposta y por unidade de variacao de xj, quando as restantes

2.10. Modelos de Regressao Multipla 27

variaveis controladas xi, i 6= j sao mantidas constantes e ε representa a variavel

aleatoria erro do modelo, para o qual usualmente se assume ε ∼ N(0, σ2).

Considere-se o caso mais geral, para o qual se dispoe de n > (k+ 1) observacoes

y1, y2, ..., yn para a variavel resposta y. A cada observacao yi corresponde um valor

xij, para a j-esima variavel controlada, j = 0, ..., k, i = 1, ..., n. O modelo regressio-

nal multi-linear pode ser entao escrito em termos de valores observados tomando-se

yi =k∑j=0

αjxij + εi, i = 1, 2, ..., n; j = 0, ..., k (2.15)

onde os ε1, ..., εn sao os erros aleatorios nao correlacionados entre si. A equacao

(2.15) pode ser escrita na forma matricial

y = Xα+ ε (2.16)

onde

y =

y1

...

yn

representa o vector das observacoes,

α =

α0

...

αk

e o vector dos coeficientes da regressao,

ε =

ε1...

εn


o vector dos erros aleatorios e

X =

1 x11 · · · x1k

1 x21 . . . x2k

......

1 xn1 · · · xnk

e a matriz do modelo do tipo n× (k + 1), isto e, a matriz dos valores das variaveis

controladas, havendo nesta matriz uma coluna por variavel controlada.

As variaveis controladas poderao estar relacionadas entre si como ,por exemplo,

numa regressao polinomial, onde estas sao potencias duma mesma variavel base.

Caso exista dependencia linear entre as variaveis controladas esta-se perante uma

situacao de multicolinariedade, em que Car(X) e inferior ao numero de variaveis

controladas. Considerando a situacao mais geral admitir-se-a que p = Car(X) ≤

k + 1.

Como ja foi referido, e usual admitir-se que os erros aleatorios εi, i = 1, ..., n tem

valor medio nulo e variancia σ2, sendo tambem independentes entre si, donde

COV(ε) = σ2In.

Contudo, dado que, na pratica, existem situacoes de correlacao entre os erros, mais

uma vez considerar-se-a o caso geral em que

COV(ε) = σ2C

onde C uma matriz conhecida e regular.

O modelo (2.15) representa um caso particular deste modelo.

Para o modelo em questao ter-se-a, portanto, y normal comE(y) = Xα = µ

COV(y) = σ2C.


Perante a ausencia de homocedasticidade no modelo, ou seja de igualdade e

independencia de variancias entre as variaveis aleatorias, ha que realizar uma trans-

formacao em y, chamada reducao da heterocedasticidade, de forma a obter-se a

homocedasticidade.

Com G ∈ U(C), tome-se y′ = Gy

X′ = GX(2.17)

atendendo aos resultados sobre matrizes uniformizadoras, ver [14], obtem-seE(y′) = X′α

COV(y′) = GTCOV(y)G = σ2GTCG = σ2In

passando a ter-se o modelo homocedastico

y′ = X′α+ ε′. (2.18)

2.10.2 Estimacao dos Coeficientes da Regressao

O metodo dos mınimos quadrados e o metodo mais usualmente utilizado para a

estimacao dos coeficientes da regressao. Este metodo consiste na obtencao de valores

para os coeficientes αj tais que a soma dos quadrados dos resıduos seja minimizada,

ou seja, encontra-se o vector α estimador de α que minimiza

‖y′ −X′α‖2. (2.19)

Para encontrar o vector α, ira ser utilizado um instrumento de algebra matricial

de grande importancia na estatıstica, que e o de matriz de projeccao ortogonal.

Tome-se Ω = R(X′)

ℵ = R(X′T )


e recorde-se que as matrizes de projeccao ortogonal sobre ℵ e Ω sao, ver seccao 2.4,Q(Ω) = X′(X′TX′)+X′T

Q(ℵ) = (X′TX′)+(X′TX′)(2.20)

Ora como o vector X′α que minimiza (2.19) e y′Ω = Q(Ω)y′ (proposicao 2.4.3),

atendendo a primeira das expressoes (2.20) vem

X′α = X′(X′TX′)+X′Ty′

donde

α = (X′TX′)+X′Ty′. (2.21)

Como y e normal, α sera tambem normal com

E(α) = (X′TX′)+X′TE(y′) = (X′TX′)+X′TX′α = Q(ℵ)α = αℵ (2.22)

pelo que α nao e necessariamente um estimador centrado de α. Contudo, os vectores

estimaveis vao permitir ultrapassar a limitacao anterior [14].

Um vector λ = Aα diz-se estimavel se existir um estimador linear centrado

λ∗ = By de λ.

Tem-se entao Aα = E(λ∗) = E(By) = BX′α para todo o α, logo A = BX′ e

AT = X′TBT . Donde λ e estimavel se e so se os vectores linha de A pertencerem a

ℵ.

Observe-se agora que, se c ∈ ℵ, tem-se

E(cT α) = cTαℵ = cTQ(ℵ)α =(Q(ℵ)Tc

)Tα = (Q(ℵ)c)T α = cTα

uma vez que as matrizes de projeccao ortogonal sao simetricas e a projeccao orto-

gonal de c sobre ℵ e o proprio vector c pois este encontra-se em ℵ. Portanto cT α

sera um estimador centrado de cTα, sendo que cTα e estimavel.


Por fim, pelo conhecido Teorema de Gauss-Markov, ver [14], os estimadores

da forma Aα sao BLUE (Estimadores Lineares Centrados Optimos) de Aα os quais

tem variancia mınima quando comparados com outros estimadores lineares centrados

de Aα [15].

Atendendo as propriedades das inversas generalizadas de Moore-Penrose tem-se

ainda

COV(α) = (X′TX′)+X′TCOV(y′)X′(X′TX′)+ = (X′TX′)+X′T (σ2In)X′(X′TX′)+

= σ2(X′TX′)+X′TX′(X′TX′)+ = σ2(X′TX′)+

(2.23)

portanto, o modelo ajustado tera a forma

y′ = X′α = y′Ω. (2.24)

Uma vez ajustado o modelo e frequentemente necessario estimar σ2, para a qual

se tem o estimador centrado

σ2 =SQE

n− p(2.25)

em que

SQE = ‖y′ − y′‖2= ‖y′ − y′Ω‖

2

representa a soma dos quadrados dos resıduos. Ora recorde-se que

y′ − y′Ω = y′Ω⊥ = (In −Q(Ω))y′ = Q(Ω⊥)y′

(seccao 2.4) pelo que

SQE = ‖y′Ω⊥‖2

=∥∥Q(Ω⊥)y′

∥∥2= y′

TQ(Ω⊥)TQ(Ω⊥)y′

dado Q(Ω⊥) ser idempotente e simetrica, logo

SQE = y′TQ(Ω⊥)y′ = y′

T(In −Q(Ω))y′ = y′

Ty′ − y′

TQ(Ω)y′ = y′

Ty′ − y′

Ty′Ω


vindo por fim

SQE = y′Ty′ − y′

TX′α. (2.26)

Um resultado importante e do Teorema de Fisher, ver [14], o qual estabelece

que, quando y e normal, α e independente de SQE e

SQE ∼ σ2χ2n−p.

Um outro resultado referente as matrizes uniformizadoras de C estabelece que

GTG = C−1, ver [14], vindo

X′TX′ = XTGTGX = XTC−1X

X′Ty′ = XTGTGy = XTC−1y

y′TX′ = yTGTGX = yTC−1X

y′Ty′ = yTGTGy = yTC−1y

obtendo-se para (2.21), (2.23) e (2.26) as expressoes

α =(XTC−1X

)+XTC−1y (2.27)

COV(α) = σ2(XTC−1X

)+(2.28)

SQE = yTC−1y − yTC−1Xα (2.29)

donde se conclui que, na realidade, estas expressoes podem ser calculadas sem haver

necessidade de efectuar a transformacao (2.17), bastando para tal inverter a matriz

C.

De referir que, caso se tenha COV(y) = σ2In e nao haja multicolinariedade,

tendo-se Car(X) = k+ 1, XTX e regular, logo (XTX)+ = (XTX)−1 vindo portanto

α = (XTX)−1XTy (2.30)

E(α) = α (2.31)


COV(α) = σ2(XTX)−1 (2.32)

SQE = yTy − yTXα (2.33)

σ2 =SQE

n− k − 1. (2.34)

Uma medida estatıstica para o ajustamento do modelo regressional as observacoes

e dada pelo coeficiente de determinacao multipla

R2 = 1− SQE

SQT; 0 6 R2 6 1

em que SQT representa soma dos quadrados dos resıduos para a media, dada por

SQT =n∑i=1

(y′i − y′)2

a qual e ainda dada por

SQT =n∑i=1

y′2i − ny′2 = y′Ty′ − ny′2 (2.35)

com

y′ =

n∑i=1

y′2i

n.

Este coeficiente mede a fraccao da variacao total entre observacoes da variavel de-

pendente que e explicada pela regressao. Para atender ao numero de variaveis

controladas pode substituir-se R2 por

R2adj = 1−

SQE/(n− p)SQT/(n− 1)

(2.36)

de forma a considerar-se menos bom um ajustamento conseguido aumentando muito

o numero de variaveis controladas.


2.10.3 Testes de Hipoteses para Modelos de Regressao Multipla

Testam-se hipoteses acerca dos parametros de modelos de regressao multipla com o

objectivo de medir a sua significancia, ou seja a sua utilidade para o modelo.

Como base de partida para construir os testes admite-se que y ∼ N(Xα, σ2C),

passando a ter-se, apos reducao da heterocedasticidade, y′ ∼ N(X′α, σ2In) e ex-

pressoes para α, COV(α) e SQE independentes da uniformizadora de C.

As hipoteses a serem testadas em geral sao da forma

H0 : ψ = ψ0

onde ψ = Aα, com A uma matriz cujos vectores linha pertencem a ℵ e ψ0 um

vector de R(A).

Dado que as componentes de ψ sao estimaveis, ψ = Aα sera um vector normal

com E(ψ) = E(Aα) = Aα = ψ

COV(ψ) = ACOV(α)AT = σ2A(XTC−1X

)+AT

independente de SQE, uma vez que α e independente de SQE, logo Aα tambem

o e.

Com h = Car(A(XTC−1X

)+AT)

, atendendo aos resultados apresentados na

seccao 2.9, tem-se

(ψ −ψ0)T(A(XTC−1X

)+AT)+

(ψ −ψ0) ∼ σ2χ2h,δ (2.37)

onde

δ =(ψ −ψ0)T

(A(XTC−1X

)+AT)+

(ψ −ψ0)

σ2

e como a forma quadratica que figura na expressao (2.37) e independente de SQE ∼


σ2χ2n−p por ser funcao de ψ, tem-se

F =n− ph

(ψ −ψ0)T(A(XTC−1X

)+AT)+

(ψ −ψ0)

SQE∼ Fh,n−p,δ

o que permite utilizar F como estatıstica de teste F para testar a hipotese H0 : ψ =

ψ0.

Por outro lado, quando ψ = ψ0, δ = 0, vindo

F0 =n− ph

(ψ −ψ)T(A(XTC−1X

)+AT)+

(ψ −ψ)

SQE∼ Fh,n−p

ou seja F tem distribuicao F central, logo estes testes sao nao distorcidos (seccao

2.9). O teste F de nıvel q nao rejeita H0 se e so se o vector ψ0 pertencer ao elipsoide

de confianca de nıvel 1− q

(ψ −ψ)T(A(XTC−1X

)+AT)+

(ψ −ψ) ≤ hF1−q,h,n−pSQE

(n− p)

onde F1−q,h,n−p e o quantil de probabilidade nıvel 1− q de Fh,n−p. Neste caso diz-se

que o teste F goza de dualidade. Equivalentemente, a hipotese H0 e rejeitada ao

nıvel q se e so se

F > F1−q,h,n−p.

Se se tiver(A(XTC−1X

)AT)+

=(A(XTC−1X

)AT)−1

, pode-se testar directa-

mente a hipotese H0 : δ = 0 e o teste sera estritamente nao distorcido (seccao

2.9).

Em particular, fazendo A = Ik+1 e ψ0 = 0, facilmente se ve que esta a ser

testada a hipotese

H0 : α0 = α1 = ... = αk = 0

contra


H1 : αj 6= 0 pelo menos para um j

Testa-se esta hipotese para saber se, de facto, existe uma relacao linear entre a

variavel resposta y e o conjunto de variaveis controladas x1, ..., xk . Rejeitar H0 im-

plica que pelo menos uma das variaveis xj, j = 1, ..., k e significativamente diferente

de zero e logo contribui significativamente para o modelo, estando-se portanto na

presenca de uma relacao linear.

Quando a matriz A e uma matriz linha cT e c ∈ ℵ, vem ψ = cTα e a hipotese

a testar sera

H0 : ψ = ψ0

entao ψ = cT α sera uma variavel aleatoria normal com valor medio ψ e

V (ψ) = σ2cT(XTC−1X

)+cT

logo F0 com as devidas substituicoes tera distribuicao F com 1 e n − p graus de

liberdade, obtendo-se a partir daı os intervalos de confianca para ψ

(ψ − ψ)T(cT(XTC−1X

)+c)+

(ψ − ψ) ≤ F1−q,1,n−pSQE

(n− p)

ou, equivalentemente,[ψ −

√F1−q,1,n−p

(cT (XTC−1X)+ c

) SQEn− p

; ψ +

√F1−q,1,n−p

(cT (XTC−1X)+ c

) SQEn− p

]

ou seja tambem neste caso os testes F gozam de dualidade.

Como particularidade interessante tem-se que a raiz quadrada da estatıstica F

t0 =ψ − ψ0√

cT (XTC−1X)+ cSQEn−p

(2.38)

tem distribuicao t-Student com n−p graus de liberdade, podendo ser utilizada para

construir testes bilaterais, unilaterais direitos e unilaterais esquerdos [14]. Assim,


se a unica componente nao nula de c for a j-esima e for igual a 1, tem-se ψ =

αj. Fazendo ψ0 = 0, os resultados anteriores corresponderao agora a intervalos de

confianca para αj e ao teste bilateral para

H0 : αj = 0, j = 0, ..., k

contra

H1 : αj 6= 0, j = 0, ..., k

reduzindo-se neste caso a estatıstica t0 a

t0 =αj√wjj

SQEn−p

onde wjj representa o elemento da linha j e coluna j da matriz W = (XTC−1X)+.

A hipotese H0 sera rejeitada ao nıvel de significancia q se

|t0| > t1−q/2,n−p

em que t1−q/2,n−p representa o quantil de probabilidade de nıvel 1 − q/2 de cada

uma das caudas da distribuicao t-Student. A rejeicao de H0 indica pois que αj e

significativamente diferente de zero e, portanto, a variavel xj deve ser mantida no

modelo. Se pelo contrario H0 nao for rejeitada, conclui-se que a variavel xj pode ser

eliminada do modelo.

Este teste t serve pois para testar hipoteses acerca dos coeficientes da regressao

individualmente, sendo util para determinar a importancia de uma determinada

variavel controlada no modelo. Dependendo do caso, um modelo pode ser mais

eficiente se se adicionar uma ou mais variaveis controladas ou, pelo contrario, se se

eliminar alguma(s) das ja existentes.

Para concluir observe-se que se nao houver multicolinariedade, ℵ = Rk+1, logo

os vectores linha de A podem ser quaisquer e continua-se a poder sempre estudar

questoes relativas aos varios coeficientes da regressao.


2.11 Modelos Log-Lineares e Tabelas de Contingencia

Os modelos log-lineares descrevem padroes de associacao entre variaveis categoricas

e sao utilizados para modelar as contagens por celula em tabelas de contingencia

[1]. O modelo amostral de Poisson para contagens e usualmente usado em tabelas

de contingencia e assume que as contagens sao realizacoes de variaveis aleatorias

independentes de Poisson.

Suponha-se que se tem (n1, ..., nN) contagens em N celulas duma tabela de con-

tingencia (frequencias observadas) com n =∑

i ni. Como ja foi referido, assume-se

que (n1, ..., nN) sao realizacoes de variaveis independentes com distribuicao de Pois-

son com parametros mi = E(ni), chamados de frequencias esperadas, aos quais

correspondem probabilidades πi, i = 1, ..., N . A funcao de probabilidade para cada

um dos ni, i = 1, ..., N eexp(−mi)m

nii

ni!(2.39)

satisfazendo V (ni) = E(ni) = mi.

O modelo log-linear e definido por

logmi =s∑j=1

xijθj, i = 1, ..., N (2.40)

ou na forma matricial

log m = Xθ (2.41)

onde m e o vector cujas componentes sao os mi, n o vector com componentes ni,

i = 1, ..., N , X = [xij], i = 1, ..., N, j = 1, ..., s e a matriz do modelo contendo os

valores das variaveis explıcitas para as N celulas e θ e o vector cujas componentes

sao os parametros do modelo θj, j = 1, ..., s.

Nos modelos log-lineares para amostras de Poisson independentes, a estimacao

dos parametros e realizada utilizado o metodo da maxima verosimilhanca. Sendo

2.11. Modelos Log-Lineares e Tabelas de Contingencia 39

que neste caso a funcao de verosimilhanca e dada por

L(m) =N∏i=1

exp(−mi)mnii

ni!(2.42)

donde o logaritmo da funcao de verosimilhanca que interessa maximizar e dado por

logL(m) =N∑i=1

ni logmi −N∑i=1

mi =N∑i=1

ni

(s∑j=1

xijθj

)−

N∑i=1

exp

(s∑j=1

xijθj

).

(2.43)

Derivando, obtem-se

∂ logL(m)

∂θj=

N∑i=1

nixij −N∑i=1

mixij (2.44)

dado que mi = exp[∑s

j=1 xijθj]. Para obter os estimadores da maxima verosimi-

lhanca θj de θj, j = 1, ..., s, igualam-se essas derivadas a zero. Obtem-se, deste

modo, em notacao matricial, as equacoes

XTn = XTm (2.45)

onde m tem componentes mi = exp[∑s

j=1 xij θj], i = 1, ..., N .

Na estimacao por maxima verosimilhanca, a matriz de informacao (INF) e a

variancia de ∂ logL(m)/∂θj. Ora a matriz de informacao e dada pelo pela simetrica

do valor esperado da matriz Hessiana. Sendo a matriz Hessiana constituıda pelos

elementos

∂2 logL(m)

∂θjθk= −

N∑i=1

xij∂mi

∂θk= −

N∑i=1

xij

∂

∂θk

[exp(

s∑h=1

xihθh)

]= −

N∑i=1

xijxikmi

(2.46)

os quais nao dependem das frequencias observadas n, vem

INF = XTD(m)X (2.47)


onde D(m) e a matriz diagonal cujos elementos principais sao as componentes de

m [1].

Para um numero fixo de celulas, o estimador da maxima verosimilhanca θ tem

distribuicao assimptoticamente normal, com valor medio θ e matriz de covariancia

igual a INF−1 [1]. Donde, para amostras de Poisson, a matriz de covariancia esti-

mada de θ e

COV(θ) =(XTD(m)X

)−1. (2.48)

Para cada celula i, duma tabela de contingencia, o resıduo estandardizado e dado

por

ei =ni − mi

m1/2i

. (2.49)

Quando o modelo se ajusta bem, os ei, i = 1, ..., N sao assimptoticamente normais

com valor medio nulo e variancias assimptoticas inferiores a 1 [1].

Seja e = [e1, ..., eN ]T , entao a estatıstica de Pearson X2 = eTe tem distribuicao

assimptotica qui-quadrado com N − s graus de liberdade. Por outras palavras, X2

tem distribuicao qui-quadrado aproximada, com graus de liberdade iguais ao numero

de celulas da tabela de contingencia menos o numero de parametros linearmente

independentes estimados do modelo [1].

Nos modelos log-lineares a “bondade” do ajustamento e dada pelo desvio residual

G2 = 2N∑i=1

ni log(ni/mi). (2.50)

Supondo que πi > 0, i = 1, ..., N quando o modelo se ajusta bem e n→∞, o desvio

residual, ver [1], distribui-se assimptoticamente como um qui-quadrado com N − s

graus de liberdade, o que e o mesmo que dizer que G2 converge em distribuicao para

um qui-quadrado com N − s graus de liberdade, ver [32], pondo-se

G2 d−→ χ2N−s.

2.11. Modelos Log-Lineares e Tabelas de Contingencia 41

Para avaliar a “bondade” do ajustamento de um model log-linear, um teste de

qui-quadrado pode ser utilizado, ver [21] e [28], no qual se testa a hipotese nula,

de o modelo se ajustar bem aos dados. Nao se rejeita H0 se o modelo tiver um

desvio residual inferior ou igual ao quantil do qui-quadrado para uma probabilidade

1 − q = 0.95 com N − s graus de liberdade. Por outras palavras, se o p − value

do teste for superior ao nıvel de significancia q, o modelo pode considerar-se bem

ajustado.

2.11.1 Modelos Log-lineares com 2 dimensoes

Suponha-se uma tabela de contingencia com 2 dimensoes, isto e, com 2 criterios de

classificacao/ variaveis (A e B), com a e b nıveis respectivamente (Tab. 2.1). As

frequencias observadas ntl com t = 1, ..., a e l = 1, ..., b representam as contagens

efectuadas para cada uma das celulas da tabela, as quais correspondem a todas as

combinacoes dos nıveis dos criterios A e B, havendo N = a× b celulas.

As frequencias observadas sao a variavel resposta na modelacao log-linear e, como

resultado desta modelacao, obtem-se para cada celula da tabela de contingencia

estimativas das frequencias observadas, designadas por frequencias esperadas mt,l.

Os modelos log-lineares com 2 dimensoes terao um papel central nas aplicacoes

apresentadas nos capıtulos 7 e 8. Existem diversos tipos de modelos log-lineares

Tab. 2.1: Tabela de contingencia com 2 dimensoes

B

A 1 ... b

1 n11 ... n1b

... ... ... ...

a na1 ... nab


com 2 dimensoes [1] e [24]. Os mais conhecidos sao os modelos de associacao linear,

efeito linhas, efeito colunas, quasi-associacao, quasi-independencia, quasi-simetria,

diagonal, etc. Contudo, aqui apenas se vai abordar um caso particular do modelo

de quasi-associacao, o qual interessa para a aplicacao apresentada, e cuja expressao

e dada por

log mtl = λ+ λAt + λBl + β × t× l + δtI(t = l) (2.51)

com parametros:

• λ - termo constante;

• λAt - t-esimo nıvel do criterio A;

• λBl - l-esimo nıvel do criterio B;

• β - parametro de associacao linear;

• δt - t-esimo elemento da diagonal AB;

onde

I(condicao) =

0 se condicao verdadeira

1 se condicao falsa. (2.52)

Sendo o modelo anterior um modelo completo, atraves do metodo de “backward

elimination” podera reduzir-se o numero de parametros do modelo ajustado, sem

perda significativa de informacao. Este metodo permite a seleccao dum sub-modelo

alternativo, por eliminacao dos parametros menos significativos do modelo completo.

A descricao deste metodo podera ser encontrada em [1] e [21].

3. ALGEBRAS DE JORDAN COMUTATIVAS

3.1 Primeiros Resultados

Neste capıtulo introduzem-se as Algebras de Jordan comutativas e operacoes binarias

sobre estas algebras, as quais permitirao estudar, em capıtulos seguintes, modelos

mistos e em particular modelos de efeitos fixos, em que se consideram todas as

combinacoes dos nıveis de dois ou mais factores/modelos.

Algebras de Jordan Comutativas sao espacos lineares vectoriais constituıdos por

matrizes simetricas que comutam, contem os quadrados das respectivas matrizes, e

tem uma unica base constituıda por matrizes de projeccao ortogonal mutuamente

ortogonais, chamada de base principal [37].

Observe-se que os espacos imagem das matrizes da base principal serao tambem

mutuamente ortogonais.

Estas algebras serao designadas doravante neste texto por a.j.c. e as matrizes

com que trabalhamos sao de ordem n× n, caso nada seja dita nada em contrario.

Sejam g1, ..., gw as caracterısticas das matrizes da base principal Q1, ...,Qw

duma a.j.c. A, se

w∑j=1

Qj = In ∈ A

diz-se que A e completa, o que significa quew∑j=1

gj = n, caso contrario tem-se

44 3. Algebras de Jordan Comutativas

w∑j=1

gj < n e as matrizes da base podem ser completadas juntando-lhe a matriz

Qw+1 = In −w∑j=1

Qj.

Diz-se que a a.j.c. A com base principal Q1, ...,Qw,Qw+1 e a completada de A.

Por outro lado, se1

nJn =

1

n1n1

Tn ∈ A

diz-se queA e regular. E facil verificar que 1nJn e uma matriz de projeccao ortogonal

uma vez que e simetrica e idempotente. Um exemplo muito simples de uma a.j.c.

completa e regular e a algebra A(s), que tem como base principal 1sJs, Is − 1

sJs.

Dada M uma matriz de projeccao ortogonal pertencente a A ter-se-a M =w∑j=1

ajQj. Como M e idempotente e as Q1, ...,Qw sao mutuamente ortogonais tem-se

w∑j=1

ajQj =M = M2 =w∑j=1

a2jQj (3.1)

vindo aj = a2j , pelo que aj = 0 ou aj = 1 com j = 1, ..., w. Sendo ϕ = j : aj 6= 0

ter-se-a

M =∑j∈ϕ

Qj (3.2)

pelo que as matrizes de projeccao ortogonal pertencentes a A serao somas de todas

ou de um subconjunto do conjunto das matrizes da base Q1, ...,Qw.

Seja M =w∑j=1

ajQj e ∇j = R(Qj), j = 1, ..., w, representando por a soma

directa ortogonal de sub-espacos vectoriais, tem-se

R(M) =∑j∈ϕ

ajR(Qj) = j∈ϕ∇j (3.3)

uma vez que os subespacos ∇j, j = 1, ..., w sao ortogonais entre si, logo ter-se-a

Car(M) = dim (R(M)) =∑j∈ϕ

dim (∇j) =∑j∈ϕ

Car (Qj) =∑j∈ϕ

gj (3.4)

3.1. Primeiros Resultados 45

com gj = Car(Qj) = dim(∇j) j = 1, ..., w.

Proposicao 3.1.1. Seja M =w∑j=1

ajQj com Q1, ...,Qw a base principal duma

a.j.c. completa A, entao os a1, ..., aw serao os valores proprios de M com multi-

plicidades g1 = Car(Q1), ..., gw = Car(Qw), caso os a1, ..., aw sejam distintos. Se

houver grupos de aj identicos somam-se as multiplicidades.

Demonstracao. Sendo as Qi, i = 1, ..., w matrizes de projeccao ortogonal n×n, logo

simetricas e idempotentes, os seus valores proprios sao iguais a 1, com multiplicidade

gi e a 0 com multiplicidade n − gi, i = 1, ..., w, tendo-sew∑j=1

gj = n porque a a.j.c.

e completa. Dados os gi vectores proprios de Qi associados ao valor proprio 1, os

mesmos constituem uma base ortonormada para ∇i = R(Qi), i = 1, ..., w, sendo

estes sub-espacos mutuamente ortogonais [14]. Juntando as bases dos sub-espacos

∇i obtem-se uma base v1,1, ...,vg1,1, ....,v1,w, ...,vgw,w para Rn. Nesta base de Rn,

os primeiros g1 vectores constituem uma base para ∇1, e assim sucessivamente,

ate que os ultimos gw vectores constituem uma base para ∇w. Ora, sendo M =w∑j=1

ajQj, a matriz cujos vectores linha sao os vectores desta base de Rn e a matriz

diagonalizadora ortogonal P, tendo-se

PMPT = D(a1, ..., a1, ..., aw, ..., aw).

Logo os a1, ..., a1, ..., aw, ..., aw sao os valores proprios de M com multiplicidades

g1, ..., gw. Os vectores proprios associados a estes valores proprios sao os vectores

linha v1,1, ...,vg1,1, ....,v1,n, ...,vgw,w de P, o que estabelece a tese.

Recordando as inversas de Moore-Penrose: se Q for uma matriz de projeccao

ortogonal tem-se Q+ = Q [35]. Alem disso, se M =w∑j=1

ajQj ∈ A com Q1, ...,Qw

a base principal de A ter-se-a, dado as Q1, ...,Qw serem idempotentes e mutuamente


ortogonais

M+ =w∑j=1

a+j Qj (3.5)

com

• a+j = 0 se aj = 0

• a+j = a−1

j se aj 6= 0

para j = 1, ..., w.

Segue-se a

Proposicao 3.1.2. A a.j.c. A contem matrizes regulares se e so se for completa.

Demonstracao. Seja M ∈ A regular, entao M =∑j∈ϕ

ajQj com ϕ = j : aj 6= 0, logo

por (3.4) n = Car(M) =∑j∈ϕ

gj =∑j∈ϕ

Car(Qj), vindo ϕ = 1, ..., w ew∑j=1

Qj = In,

logo A e completa.

Na prova da inversa, como A e completa tem-se que In =w∑j=1

Qj ∈ A e In e uma

matriz regular, logo A contem matrizes regulares.

Assim, com A a.j.c. completa, M =w∑j=1

ajQj ∈ A e regular se e so se aj 6= 0, j =

1, ..., w. Pela proposicao 3.1.1 os aj, j = 1, ..., w sao os valores proprios da matriz M

e como a matriz M e regular, todos os seus valores proprios sao nao nulos.

Tambem facilmente se ve que, caso M seja regular, se tem

M−1 =w∑j=1

a−1j Qj (3.6)

e, alem disso, que Det(M) =∏w

j agjj .

Sendo as Qj, j = 1, ..., w matrizes de projeccao ortogonal tem-se

Qj = ATj Aj

3.1. Primeiros Resultados 47

com AjATj = Igj sendo os vectores linha de Aj uma base ortonormada para ∇j,

j = 1, ..., w [14]. Portanto, se A for completa os vectores linha da matriz

P(A) = [AT1 ...A

Tw]T

constituirao uma base ortonormada de Rn, visto ter-se

In =w∑j=1

Qj =w∑j=1

ATj Aj.

Entao por definicao, P(A) sera uma matriz ortogonal que esta associada a A. Inver-

samente, dada uma matriz ortogonal P e uma particao de n = 1, ..., n em w con-

juntos ϕj, j = 1, ..., w, disjuntos dois a dois, ter-se-a In =w∑j=1

Qj com Qj = ATj Aj,

sendo as Aj constituıdas pelos vectores linha de P com ındices em ϕj, j = 1, ...w.

E facil de verificar que estas matrizes sao simetricas e idempotentes sendo, por-

tanto, matrizes de projeccao ortogonal e tambem mutuamente ortogonais. Assim,

Q1, ...,Qw sera a base principal duma a.j.c. completa que tem P como matriz

ortogonal associada.

Sendo M ∈ A uma matriz de projeccao ortogonal, entao atendendo (3.2) e (3.4),

se Car(M) = 1, M tera de pertencer a base principal Q1, ...,Qw.

Se A for uma a.j.c. regular com base principal Q1, ...,Qw convenciona-se que

Q1 = 1nJn e ter-se-a

Q1 =1

nJn =

(1√n

1n

)(1√n

1Tn

)vindo

A1 =1√n

1Tn .

Logo P(A) tem uma primeira linha com elementos iguais a 1√n

e alem disso, tem-se

AjAT1 = 0gj , j = 2, ..., w.


Como a soma de componentes de qualquer vector linha de Aj, j = 2, ..., w e nula,

esses vectores serao vectores de contrastes. Portanto as Aj, j = 2, ..., w serao ma-

trizes de contrastes e P(A) sera uma matriz ortogonal estandardizada (ver seccao

2.1).

3.2 Geracao de Algebras de Jordan Comutativas

Seja F(P) uma famılia de matrizes simetricas que tem como P a sua diagonalizadora

ortogonal, entao tem-se o seguinte resultado, apresentado em Ferreira(2006):

Proposicao 3.2.1. F(P) e uma a.j.c..

Demonstracao. F(P) e um espaco vectorial uma vez, que dadas as matrizes M1, ...,Ms ∈

F(P), uma sua combinacao linear

M =s∑j=1

bjMj ∈ F(P)

pois PMPT = P(s∑j=1

bjMj)PT =

s∑j=1

bjDj continua a ser uma matriz diagonal e

facilmente se verificam todas as outras condicoes para ser espaco vectorial.

Segundo a proposicao 2.1.1, as matrizes pertencentes a esta famılia comutam, e

alem disso tem-se (PMPT )(PMPT ) = D2 , isto e, PM2PT = D2 e uma matriz

diagonal, logo M2 ∈ F(P).

Sejam αn1 , ...,αnn os vectores linha de P e r1, ..., rn os valores proprios de M ∈

F(P), entao tem-se, ver [35],

M =n∑j=1

rjαnjα

njT .

Sendo portanto M uma matriz qualquer pertencente a F(P) e que pode ser escrita

como uma combinacao linear nao nula das matrizes Qj = αnjαnjT linearmente in-

dependentes, entao as matrizes Qj, j = 1, ..., n constituirao uma base para F(P).

3.2. Geracao de Algebras de Jordan Comutativas 49

Ve-se ainda facilmente, devido ao facto dos vectores αn1 , ...,αnn serem ortonormados,

que as Qj sao matrizes de projeccao ortogonal e que sao mutuamente ortogonais, ou

seja, QjQi = On, para j 6= i e j = 1, ..., n. Assim sendo F(P) tem dimensao n.

Falta ainda provar, relativamente a proposicao anterior, que a base e unica. Efec-

tivamente, Seely(1971) chamou as a.j.c. espacos vectoriais comutativos quadraticos

e apresentou o seguinte resultado:

Proposicao 3.2.2. Uma condicao necessaria e suficiente para um subespaco A ser

a.j.c. e a existencia de uma base Q1, ...,Qw para esse subespaco, tal que cada

matriz simetrica Qj, j = 1, ..., w e idempotente e QiQj = On para i 6= j. Alem

disso, independentemente do ındice das matrizes na base, essa base e unica.

Demonstracao. A parte da condicao necessaria e suficiente e facilmente provada [37].

A demonstracao de que essa base e unica apresenta-se de seguida.

Seja Q1, ...,Qw uma base de uma a.j.c. A, constituıda por matrizes de

projeccao ortogonal mutuamente ortogonais. Supondo que se tinha outra base

R1, ...,Rw para A formada por matrizes de projeccao ortogonal mutuamente or-

togonais. Fixando m ∈ 1, ..., w, sejam ai numeros reais tais que Rm =w∑i=1

aiQi e

bh,j numeros reais tais que Qh =w∑j=1

bh,jRj para h = 1, ..., w, entao, uma vez que as

matrizes Qi para i = 1, ..., w sao mutuamente ortogonais e idempotentes, vem

RmQh = (w∑i=1

aiQi)Qh = ahQhQh = ahQh

o mesmo para matrizes Rj para j = 1, ..., w

RmQh = Rm(w∑j=1

bh,jRj) = Rmbh,mRm = bh,mRm

logo ahQh = bh,mRm para h = 1, ..., w. Como as Qi sao linearmente independentes

tem-se Rm 6= O e como Qh e Rm sao matrizes pertencentes a bases tem-se que


(ah = 0 ou ah = 1) e (bh,m = 0 ou bh,m = 1), donde Rm = Qh para algum h. Dado

que esta igualdade se verifica para m = 1, ..., w, entao esta provada a unicidade da

base Q1, ...,Qw.

No caso de F(P), a base principal sera Q1, ...,Qn com Qj = αnjαnjT , j =

1, ..., n.

Sejam T1 e T2 duas famılias de matrizes simetricas e E(T1) e E(T2) os espaco vec-

toriais gerados por T1 e T2 respectivamente. Estabelece uma relacao de equivalencia

ε e entre famılias de matrizes

T1εT2 se E(T1) = E(T2).

Esta relacao verifica-se para bases duma a.j.c..

Dada T = M1, ...,Mw uma famılia de matrizes simetricas pertencentes a

F(P), como a interseccao de a.j.c.’s continua a ser uma a.j.c., a interseccao de

todas as a.j.c. que contem T sera tambem uma a.j.c., a a.j.c. A(T ) gerada por

T . Nao e no entanto certo que M1, ...,Mw seja uma base para a a.j.c. gerada

por estas matrizes.

Assumindo que as M1, ...,Mw sao linearmente independentes, interessa obter

condicoes para que E(T ) = A(T ). Os vectores linha α1, ...,αn de P sao os vectores

proprios das matrizes M1, ...,Mw associados aos valores proprios rl,j, l = 1, ..., w,

entao tem-se

Ml =n∑j=1

(αjTMlα

nj )αjαj

T =n∑j=1

rl,jαjαjT , l = 1, ..., w.

Defina-se agora a relacao de equivalencia γ no conjunto α1, ...,αn

αiγαj se rl,i = rl,j, l = 1, ..., w.

Deste modo, definem-se C1, ..., Cw classes de equivalencia γ com w ≤ n. A classe de

equivalencia γ e primaria, se existir pelo menos uma matriz Ml que tenha um valor

3.2. Geracao de Algebras de Jordan Comutativas 51

proprio nao nulo associado com os vectores na classe de equivalencia. Suponha-se

que existem m classes de equivalencia primarias, podendo existir a classe m + 1 se

existir uma classe de equivalencia secundaria para os vectores com valores proprios

nulos para todas as matrizes de T . Considere-se que os vectores incluıdos nas classes

de equivalencia primarias sao os vectores linha das matrizes A1, ...,Am, os vectores

da classe secundaria (se existir) sao os vectores linha da matriz Am+1. As matrizes

Q1, ...,Qm, com Qj = ATj Aj, j = 1, ...,m[m+1] constituem uma famılia de matrizes

de projeccao ortogonal mutuamente ortogonais que sera a base principal duma a.j.c.

A+(T ) e, se existir uma classe secundaria, as matrizes Q1, ...,Qm e Qm+1 serao a

base principal da completada de A+(T ), A+(T ). Alem disso, tem-se que

E(T ) ⊆ A(T ) ⊆ A+(T ) (3.7)

e

w ≤ m

dado que w = dim(E(T )), porque as M1, ...,Mw sao linearmente independentes e

m = dim(A+(T )). Estabeleca-se agora a proposicao

Proposicao 3.2.3. Se as matrizes M1, ...,Mw sao linearmente independentes, para

que se tenha E(T ) = A(T ), e necessario e suficiente que E(T ) contenha uma famılia

de w matrizes de projeccao ortogonal mutuamente ortogonais V, as quais consti-

tuirao a base principal de A(T ).

Demonstracao. Se E(T ) = A(T ) entao dim(A(T )) = w logo a base principal de

A(T ) sera uma famılia de matrizes de projeccao ortogonal mutuamente ortogonais

com w matrizes contidas em E(T ). Inversamente, se E(T ) contem uma famılia

de matrizes de projeccao ortogonal mutuamente ortogonais V , constituıda por w

matrizes, entao V sera uma base de E(T ) o qual tem dim(E(T )) = w. Alem disso


ve-se ainda que E(T ) e a.j.c., uma vez que E(T ) e gerado por T uma famılia

de w matrizes linearmente independentes, simetricas que comutam. Como toda a

a.j.c. que contem T , contem a a.j.c. mınima que inclui T (ou seja A(T )), vem

A(T ) ⊆ E(T ). Por outro lado, a partida, tem-se que E(T ) ⊆ A(T ) para alem

do facto de ter de se ter dim(A(T )) ≥ w, por A(T ) ser espaco linear e conter T .

Obtem-se, portanto, A(T ) = E(T ).

3.3 Operacoes Binarias

Nesta seccao, serao estudadas as operacoes sobre algebras de Jordan comutativas,

mais exactamente sobre as suas bases principais. Estas operacoes sobre a.j.c. permi-

tirao, em capıtulos seguintes, construir modelos complexos a partir de modelos mais

simples. Neste sentido, operacoes envolvendo algumas das mais simples algebras de

Jordan terao um papel importante.

O produto de Kronecker ⊗ de a.j.c. intervem na construcao de modelos obtidos

por cruzamento.

Estabeleca-se a proposicao

Proposicao 3.3.1. Sendo Qj,1, ...,Qj,wj a base principal da a.j.c. Aj constituıda

por matrizes nj × nj, para j = 1, 2, entao

A1 ⊗A2 =

w1∑i=1

w2∑j=1

ai,j(Q1,i ⊗Q2,j)

sera a.j.c. com base principal Q1,i ⊗Q2,j, i = 1, ..., w1, j = 1, ..., w2. Alem disso,

se A1 e A2 forem completas[regulares], A1 ⊗A2 tambem sera completa[regular].

Demonstracao. Sendo Qj,1, ...,Qj,wj a base principal da a.j.c. Aj, constituıda

por matrizes de projeccao ortogonal mutuamente ortogonais e, como o produto

3.3. Operacoes Binarias 53

⊗ de matrizes de projeccao ortogonal da matrizes de projeccao ortogonal, tem-

se que, por (2.2), as matrizes Q1,i ⊗ Q2,j, i = 1, ..., w1, j = 1, ..., w2 sao tambem

matrizes de projeccao ortogonal mutuamente ortogonais. Alem disso, utilizando

a propriedade distributiva (2.8) e a propriedade (2.2), facilmente se verifica que

A1 ⊗A2 =

w1∑i=1

w2∑j=1

ai,j(Q1,i ⊗Q2,j)

e um espaco vectorial, constituıdo por matri-

zes simetricas, que comutam, e contendo o quadrado dessas matrizes, logo A1 ⊗A2

sera a.j.c. Como as matrizes Q1,i ⊗ Q2,j, i = 1, ..., w1, j = 1, ..., w2 sao matrizes

de projeccao ortogonal mutuamente ortogonais, consequentemente linearmente in-

dependentes, as mesmas constituem a base principal de A1⊗A2. Por outro lado, sewl∑i=1

Ql,i = Inl , l = 1, 2, devido a propriedade (2.8) do produto de Kronecker, ter-se-a

w1∑i=1

w2∑j=1

Q1,i ⊗Q2,j = In1 ⊗ In2 = In1n2

e, caso 1nl

Jnl ∈ Al, l = 1, 2, vira

(1

n1

Jn1)⊗ (1

n2

Jn2) =1

n1n2

Jn1n2 ∈ A

Mostra-se que, se A1, A2 e A3 forem a.j.c. entao

A1 ⊗ (A2 ⊗A3) = (A1 ⊗A2)⊗A3 (3.8)

isto e, o produto de kronecker de a.j.c e associativo [9].

Tem-se ainda a

Proposicao 3.3.2. Tem-se P(A1 ⊗A2) = P(A1)⊗P(A2)

Demonstracao. Como ja foi visto P(Al) = [ATl,1, ...,A

Tl,wl

]T com Ql,j = ATl,jAl,j,

j = 1, ..., wl, l = 1, 2, pelo que por (2.2) tem-se

Q1,i ⊗Q2,j = (AT1,i ⊗AT

2,i)(A1,j ⊗A2,j)


para i = 1, ..., w1, j = 1, ..., w2, vindo

P(A1⊗A2) = [AT1,1⊗AT

2,1, ...,AT1,w1⊗AT

2,w2]T =

[AT

1,1, ...,AT1,w1

]T⊗[AT2,1, ...,A

T2,w2

]T= P (A1)⊗P (A2)

O produto restrito * de a.j.c. intervem na construcao de modelos obtidos por

encaixe. Quando cada tratamento dum modelo encaixa todos os tratamentos de

outro modelo, diz-se que o primeiro modelo encaixa o segundo. Se dois modelos

iniciais estao associados as a.j.c. A1 e A2, completas e regulares, entao o modelo

obtido por encaixe estara associado a a.j.c. A1*A2, ver [9]. Sendo Ql,1, ...,Ql,wl

a base principal da a.j.c. completa Al, l = 1, 2, assumindo que Q2,1 = 1n2

Jn2 , entao

a base principal de A1*A2 sera

Q1,1 ⊗1

n2

Jn2 , ...,Q1,w1 ⊗1

n2

Jn2 ∪ In1 ⊗Q2,2, ..., In1 ⊗Q2,w2.

Dada uma outra a.j.c A3 com base principal Q3,1, ...,Q3,w3, assumindo Q3,1 =

1n3

Jn3 , prova-se ainda que, ver [9],

(A1*A2)*A3 = A1*(A2*A3).

Esta operacao apenas e abordada de passagem, uma vez que a sua aplicacao

da-se quando se considera modelos com r repeticoes, para os quais seguidamente

se apresenta uma breve descricao. Seja A a a.j.c. associada a um modelo com

uma observacao por tratamento. Quando se tem r observacoes por tratamento, o

modelo passa a estar associado a a.j.c. A*A(r) tendo A(r) como base principal

1rJr, Ir − 1

rJr, ver [9]. Como ja foi referido anteriormente, A(r) e completa e

regular sendo a unica a.j.c. constituıda por matrizes r × r cuja base principal e

constituıda por essas matrizes. AA(r) esta associada ao modelo usual para amostras

de dimensao r com distribuicao normal e observacoes independentes e identicamente

distribuıdas.

4. MODELOS LINEARES ORTOGONAIS

Neste capıtulo apresentam-se os modelos associados a a.j.c.. Do ponto de vista

da estrutura do modelo, esta associacao permite estudar o cruzamento e encaixe

de modelos multi-factor. Na sequencia dos modelos associados a a.j.c., surgem os

modelos normais ortogonais na forma canonica, isto e, na forma conveniente para

aplicar as a.j.c. e obter estatısticas completas e suficientes e subsequentemente

estimadores UMVUE com vista a realizar inferencia.

4.1 Modelos Associados a uma Algebra de Jordan Comutativa

Diz-se que o modelo linear

y =w∑i=1

Xiαi + e (4.1)

com ci = Car(Xi), i = 1, ..., w + 1, esta associado a a.j.c. A se a famılia de

matrizes M1, ...,Mw,Mw+1 com Mi = XiXTi , i = 1, ..., w e Mw+1 = In for uma

base para A. Por outro lado, como Mw+1 = In ∈ A, A e completa. Em geral

assume-se que X1 = 1√n1n vindo 1

nJn ∈ A ou seja A e regular.

O modelo anterior e ortogonal porque as matrizes da base M1, ...,Mw+1 co-

mutam, ou seja,

MiMj = MjMi, i, j = 1, ..., w + 1.

O modelo linear atras apresentado podera ser o modelo misto (efeitos fixos +

aleatorios). Para tal, admite-se que os αi, i = 1, ...,m sao vectores fixos e que os αi,

56 4. Modelos Lineares Ortogonais

i = m + 1, ..., w sao normais, independentes, com vectores medios nulos e matrizes

de covariancia σ2i Ici , i = m + 1, ..., w. O vector do erro e sera tambem normal,

independente dos anteriores vectores aleatorios, com vector medio nulo e matriz de

covariancia σ2In. Escrito de outro modo

αi ∼ N(0, σ2i Ici), i = m+ 1, ..., w

e

e ∼ N(0, σ2In).

Entao, tem-se y ∼ N(µ,V), vendo-se facilmente queµ = E(y) =

m∑i=1

Xiαi

V = COV(y) =w∑

i=m+1

σ2iMi + σ2In

(4.2)

Note-se que, em geral, tem-se α1 = µ.

Sendo Q1, ...,Qw,Qw+1 a base principal de A tem-seMi =

w+1∑j=1

bi,jQj, i = 1, ..., w + 1

In =w+1∑j=1

Qj

. (4.3)

Fazendo bw+1,j = 1, j = 1, ..., w+1, a matriz B = [bi,j], i, j = 1, ..., w+1 sera regular

uma vez que se trata de uma matriz de transformacao de bases. A B chamar-se-a

matriz de transicao de A. Seja gj a caracterıstica de Qj, j = 1, ..., w + 1, entao por

(4.3) tem-se Wi = R(Mi) = R(Xi) = j∈ϕi∇j, i = 1, ..., w + 1

ci =∑j∈ϕi

gj(4.4)

4.1. Modelos Associados a uma Algebra de Jordan Comutativa 57

onde ∇j = R(Qj) = R(Aj), j = 1, ..., w + 1, ϕi = j : bi,j 6= 0, i = 1, ..., w + 1,

representa a soma directa ortogonal de sub-espacos e Xw+1 = In.

Devido a primeira das expressoes em (4.2) e, como µ ∈ mi=1Wi, resulta que

µ ∈ Ω com

Ω = R([X1...Xm]) = R([X1...Xm][X1...Xm]T ) = R(m∑i=1

Mi)

[38], e como as matrizes Mi, i = 1, ..., w + 1 sao semi-definidas positivas tem-se

ϕ = ϕ(m∑i=1

Mi) = ∪mi=1ϕi

vindo

Ω = j∈ϕ∇j.

Por outro lado, devido a (4.3), obtem-se

V =w∑

i=m+1

σ2i

(w+1∑j=1

bi,jQj

)+ σ2

w+1∑j=1

Qj.

Fazendo σ2i = 0, i = 1, ...,m, facilmente se ve que

w∑i=m+1

σ2i

(w+1∑j=1

bi,jQj

)=

w+1∑j=1

w∑i=1

bi,jσ2iQj

vindo

V =w+1∑j=1

(w∑i=1

bi,jσ2iQj + σ2Qj

)=

w+1∑j=1

(w∑i=1

bi,jσ2i + σ2

)Qj =

w+1∑j=1

γjQj (4.5)

e, como bw+1,j = 1, tem-se o sistema de equacoes

γj =w+1∑i=m+1

bi,jσ2i =

w∑i=m+1

bi,jσ2i + σ2, j = 1, ..., w + 1. (4.6)


em que σ2w+1 = σ2. Tomando bi,w+1 = 0 para i = m+1, ..., w, tem-se γw+1 = σ2. No

seguimento, como as Qj, j = 1, ..., w+1 sao idempotentes e mutuamente ortogonais,

tem-se V−1 =w+1∑j=1

1γj

Qj.

Estabeleca-se agora a

Proposicao 4.1.1. Estando o modelo associado a a.j.c A com µ ∈ Ω, Q(Ω) a

matriz de projeccao ortogonal sobre o espaco Ω pertence a A bem como V.

Demonstracao. Q(Ω) ∈ A ja que Q(Ω) =∑

j∈ϕ Qj devido a Ω = j∈ϕ∇j. Por

ultimo V ∈ A devido a (4.5).

Ordenem-se agora as matrizes de base principal de A, de modo a obter-se ϕ =

1, ...,m. Com ja foi referido no capıtulo 3, relembre-se que as matrizes Qj, j =

1, ..., w + 1 sendo matrizes de projeccao ortogonal, sao simetricas e idempotentes e

tem valores proprios iguais a 0 ou a 1. Alem disso, Qj = ATj Aj com AjA

Tj = Igj

sendo os gj vectores linha de Aj os vectores proprios de Qj, j = 1, ..., w+1 associados

ao valor proprio 1. Por outro lado, como A e completa tem-seIn =

w+1∑j=1

Qj

n =w+1∑j=1

gj

e dado as Q1, ...,Qw+1 serem mutuamente ortogonais tem-se

Rn = w+1j=1∇j. (4.7)

Por fim, como os vectores linha de Aj pertencem a ∇j e os vectores coluna de Qj′

pertencem a ∇j′ , e para j 6= j′, ∇j = R(Qj) e ortogonal a ∇j′ = R(Qj′), vindo

AjQj′ = Ogj×n, j 6= j′.

4.1. Modelos Associados a uma Algebra de Jordan Comutativa 59

Entao para j 6= j′ facilmente se ve queAjVAT

j = Aj

(w+1∑i=1

γiQi

)ATj = γjAjQjA

Tj = γjAjA

Tj AjA

Tj = γjIgj

AjVATj′ = Aj

(w+1∑i=1

γiQi

)ATj′ = γjAjQjA

Tj′ = γjAj (Aj′Qj)

T = Ogj×gj′

(4.8)

Assim sendo, tomando ηj = Ajµ e ηj = Ajy, vemE(ηj) = ηj

COV(ηj) = γjIgj

, j = 1, ..., w + 1 (4.9)

bem como y = Iny =

w+1∑j=1

Qjy =w+1∑j=1

ATj Ajy =

w+1∑j=1

ATj ηj

µ =w+1∑j=1

Qjµ =w+1∑j=1

ATj Ajµ =

w+1∑j=1

ATj ηj =

m∑j=1

ATj ηj

(4.10)

ja que

ηj = Ajµ = 0, j = m+ 1, ..., w + 1 (4.11)

devido aos vectores linha de Aj pertencerem ∇j, µ ∈ Ω e ∇j⊥Ω, j = m+1, ..., w+1.

Na primeira das expressoes (4.10), o modelo diz-se escrito na forma canonica.

Nesta formulacao intervem os parametros canonicos η1, ...,ηm e γ1, ...,γw+1. A

ortogonalidade deste modelo e baseada na expressao (4.7), ou seja, na particao

ortogonal do espaco da amostra, de forma que as projeccoes ortogonais dos vectores

das observacoes nesses sub-espacos (particoes ortogonais) sao nao correlacionadas.

Quando comparado o modelo (4.1) com o modelo da primeira das expressoes em

(4.10), observa-se que o vector dos erros aleatorios e = y − µ nao aparece isolado,

e facilmente se verifica que este corresponde, sem ser identico, ao termo ATw+1ηw+1

da formulacao canonica.


4.2 Estimadores UMVUE

Devido a (4.11) vem

‖ηj − ηj‖2 =

(y − µ)TATj Aj(y − µ) se j = 1, ...,m

yTATj Ajy = ‖ηj‖2 se j = m+ 1, ..., w + 1

. (4.12)

Dado que se tem y ∼ N(µ,V) por (4.9) vem

ηj ∼ N(ηj, γjIgj), j = 1, ..., w + 1

pois Ajy sera um vector normal. Alem disso, tem-se que os ηj, j = 1, ..., w + 1

sao independentes, visto ter-se matrizes de covariancia cruzadas nulas devido as

igualdades de (4.8).

Ponha-se

SQj = ‖ηj‖2, j = 1, ..., w + 1 (4.13)

e estabeleca-se a

Proposicao 4.2.1. O vector das observacoes y =∑w+1

j=1 ATj ηj tem densidade

n(y|µ,V) =e− 1

2

m∑j=1

‖ηj−ηj‖2

γj+

w+1∑j=m+1

SQjγj

(2π)n2

w+1∏j=1

γgj2j

e os ηj para j = 1, ...,m e os SQj, j = m + 1, ..., w + 1 sao estatısticas suficientes

e completas.

Demonstracao. Por (4.12) vem

(y − µ)TV−1(y − µ) =m∑j=1

‖ηj − ηj‖2

γj+

w+1∑j=m+1

SQj

γj. (4.14)

4.3. Inferencia para o Modelo de Efeitos Fixos 61

Por outro lado, recorde-se que Det(V) =∏w+1

j=1 γgij . Substituindo (4.14) e Det(V)

na funcao densidade de y, demonstra-se a primeira parte da tese.

Para a segunda parte, basta evocar o teorema da factorizacao (proposicao 2.7.2),

pelo que as estatısticas serao suficientes e como a distribuicao normal pertence a

famılia exponencial e o espaco parametrico contem o produto cartesiano de intervalos

nao degenerados, as estatısticas serao tambem completas, ver [13] e [38].

Sabe-se que (seccao 2.9)

SQj ∼ γjχ2gj ,δj

(4.15)

com δj = 1γj‖ηj‖2, j = 1, ..., w+ 1 devido a (4.9) e (4.11), sendo estes qui-quadrados

independentes. Entao, como δj = 0, j = m+ 1, ..., w + 1, tem-se

E(SQj) = gjγj, j = m+ 1, ..., w + 1

obtendo-se, deste modo, os estimadores centrados γj =SQjgj, j = m + 1, ..., w e

σ2 = SQw+1

gw+1, dado que γw+1 = σ2. Ponha-se SQe = SQw+1 e g = gw+1 = n−

∑wj=1 gj.

Utilizando o teorema de Blackwell-Lehmann-Scheffe (seccao 2.7) facilmente se

verifica que os ηj, j = 1, ...,m sao estimadores UMVUE para os vectores medios

ηj, j = 1, ...,m, e que os estimadores γj =SQjgj

sao tambem UMVUE para os γj,

j = m + 1, ..., w, assim como σ2 = SQeg

o e para σ2. Observe-se ainda que os ηj,

j = 1, ...,m alem de independentes entre si, como ja vimos, sao independentes dos

γj, j = m+ 1, ..., w e de σ2, os quais tambem sao independentes entre si.

4.3 Inferencia para o Modelo de Efeitos Fixos

Este trabalho centra-se na inferencia para modelos de efeitos fixos. Assim, no modelo

(4.1), considera-se que w = m ou seja os αi, i = 1, ...,m sao vectores fixos. Entao,


de (4.6) resulta γi = σ2, i = 1, ...,m, dondeE(ηi) = ηi

COV(ηi) = σ2Igi

com ηi = Aiµ e ηi = Aiy para i = 1, ...,m+ 1, assim comoy =

m+1∑i=1

ATi ηi

µ =m∑i=1

ATi ηi

. (4.16)

As hipoteses relativas aos factores de efeitos fixos que interessam testar sao

H0,i : ηi = 0, i = 1, ...,m (4.17)

que equivalem a testar a nulidade dos vectores que intervem na parte de efeitos fixos

αi, i = 1, ...,m (alias a unica).

Ora, por (4.13) e (4.15), tem-se

SQi = yTATi Aiy ∼ σ2χ2

gi,δi, i = 1, ...,m

com

δi =1

σ2µTAT

i Aiµ, i = 1, ...,m.

Por outro lado, SQe = SQm+1 = ‖ηm+1‖2 ∼ σ2χ2g,δm+1

com δm+1 = 1σ2‖ηm+1‖2.

Devido a (4.11) δm+1 = 0, donde SQe ∼ σ2χ2g, a qual e independente dos SQi, i =

1, ...,m. Assim sendo, as hipoteses H0,i, i = 1, ...,m podem ser reescritas como

H0,i : δi = 0, i = 1, ...,m

obtendo-se para estas, testes F com gi e g graus de liberdade e estatısticas

Fi =g

gi

SQi

SQe

, i = 1, ...,m (4.18)

4.3. Inferencia para o Modelo de Efeitos Fixos 63

as quais terao distribuicoes F com gi e g graus de liberdade e parametros de nao

centralidade δi, ou seja Fi ∼ F (z|gi, g, δi), i = 1, ...,m.

Ora, quando H0,i se verifica, δi = 0, i = 1, ...,m, e o teste e estritamente nao

distorcido (seccao 2.9). Rejeita-se H0,i, i = 1, ...,m para o nıvel de significancia 1−q

se Fi > F1−q,gi,g, onde F1−q,gi,g o quantil da distribuicao F com gi e g graus de

liberdade para o nıvel 1− q.

Sendo ηi =

ηi,1...

ηi,gi

e ηi =

ηi,1...

ηi,gi

, H0,i verifica-se, se e so se, se verificarem as

sub-hipoteses

H0,i,j : ηi,j = 0, i = 1, ...,m, j = 1, ..., gi. (4.19)

Para estas sub-hipoteses, constroem-se testes F com 1 e g graus de liberdade e

estatısticas

Fi,j = gη2i,j

SQe

, i = 1, ...,m, j = 1, ..., gi (4.20)

ou seja, Fi,j ∼ F (z|1, g, δi,j), i = 1, ...,m, j = 1, ..., gi, com

δi,j =1

σ2η2i,j, i = 1, ...,m, j = 1, ..., gi (4.21)

Facilmente se verifica, para i = 1, ...,m, que δi =gi∑j=1

δi,j e Fi = 1gi

gi∑j=1

Fi,j. As

hipoteses e as sub-hipoteses deverao ser testadas simultaneamente, ver [16]. A si-

tuacao mais comum e H0,i nao ser rejeitada a um dado nıvel, mas uma ou mais

sub-hipoteses serem-no.

Para os testes de hipoteses referentes as componentes de variancia consultar [8],

[9], [10] e [5], onde a teoria anteriormente apresentada e desenvolvida.


4.4 Vectores Estimaveis e Testes F para os Efeitos Fixos

Considerem-se os vectores estimaveis

ψi = Biηi, i = 1, ...,m. (4.22)

onde os vectores linha das Bi sao os coeficientes de combinacoes lineares das com-

ponentes dos ηi, i = 1, ...,m. Admita-se que os si vectores linha das matrizes Bi,

i = 1, ...,m, sao linearmente independentes, logo Car(Bi) = si e BiBTi sera de-

finida positiva [38]. Dado que as componentes de ψi, i = 1, ...,m sao estimaveis,

atendendo ao teorema de Blackwell-Lehmann-Scheffe, tem-se entao os estimadores

UMVUE ψi = Biηi ∼ N(ψi, σ2Wi) com Wi = BiB

Ti , i = 1, ...,m, os quais sao

independentes de SQe ∼ σ2χ2g. Recorrendo aos resultados da seccao 2.9, obtem-se

para os ψi, i = 1, ...,m, os elipsoides de confianca

Pr

((ψi − ψi)

TW−1i (ψi − ψi) 6 siF1−q,si,g

SQe

g

)= 1− q, i = 1, ...,m (4.23)

em que F1−q,si,g e o quantil para a probabilidade 1− q de F (z|si, g, 0), i = 1, ...,m.

Utilizando agora o teorema de Scheffe, ver [34], obtem-se

Pr

[⋂di

(∣∣∣dTi ψi − dTi ψi

∣∣∣ 6√siF1−q,si,gdTi Widi

SQe

g

)]= 1− q, i = 1, ...,m

onde⋂di

indica que se consideram todos os vectores di ∈ Rni . Tem-se assim os

intervalos de confianca simultaneos, dados pelas desigualdades∣∣∣dTi ψi − dTi ψi

∣∣∣ 6√siF1−q,si,gd

Ti Widi

SQeg

, i = 1, ...,m, ver [16].

Por outro lado, para um vector bi ∈ R(Bi), i = 1, ...,m tem-se

(ψi − bi)TW−1i (ψi − bi) ∼ σ2χ2

si,δi(bi)(4.24)

com

δi(bi) =1

σ2(ψi − bi)TW−1

i (ψi − bi). (4.25)

4.5. Construcao de Modelos 65

Assim, como (4.24) e independente de SQe, para testar hipoteses do tipo

H0,i(bi) : ψi = bi, i = 1, ...,m (4.26)

obtem-se testes F com si e g graus de liberdade e estatısticas

Fi(bi) =g

si

(ψi − bi)TW−1i (ψi − bi)

SQe

(4.27)

com distribuicao F (z|si, g, δi(bi)), i = 1, ...,m. Quando a hipotese H0,i(bi) se veri-

fica, tem-se δi(bi) = 0, i = 1, ...,m e vem

F ′i(bi) =g

si

(ψi −ψi)TW−1

i (ψi −ψi)

SQe

∼ Fsi,g (4.28)

sendo estes testes estritamente nao distorcidos (seccao 2.9). Por outro lado, nao se

rejeita H0,i(bi) pelo teste de nıvel q, se e so se bi pertencer ao elipsoide de confianca

de nıvel 1− q

(ψi − ψi)TW−1

i (ψi − ψi) ≤ siF1−q,si,gSQe

g(4.29)

pelo que os testes gozam de dualidade (seccao 2.9).

Estes resultados aplicam-se a vectores ηi, i = 1, ...,m, para o que basta considerar

Bi = Igi , i = 1, ...,m.

4.5 Construcao de Modelos

De seguida ira ver-se como se constroi as a.j.c. utilizadas para descrever modelos

com encaixe e cruzamento-encaixe de factores. Esta teoria e desenvolvida em [9] e

[8], onde poderao ser consultados mais detalhes.

4.5.1 Modelos para Encaixe

Suponha-se que num delineamento se tem u factores com a1, ..., au nıveis. Num

delineamento de encaixe, em cada um dos a1 nıveis do primeiro factor estao en-

caixados os a2 nıveis do segundo factor, e assim sucessivamente ate aos au nıveis


do u-esimo factor. Deste modo havera c(h) =h∏t=1

at combinacoes de nıveis para os

primeiros h factores, de tal forma que o numero total de combinacoes de nıveis sera

c = c(u). Alem do mais, cada combinacao de nıveis dos primeiros h factores encaixa

b(h) = c/c(h) combinacoes de nıveis dos restantes factores. Seja a o vector cujas

componentes sao os numeros a1, ..., au.

Assumindo que existem r replicas para cada combinacao de nıveis de factores, o

modelo para descrever este tipo de delineamento pode ser escrito na forma

y =u∑h=0

Xhαh + e (4.30)

tendo y, n = cr componentes e

Xh =

(u⊗t=1

Xh,t

)⊗ 1r (4.31)

onde

Xh,t =

Iat se t ≤ h

1at se t > h(4.32)

e X0 = 1n. O vector α0 e constituıdo apenas por uma componente, o valor medio

geral µ, enquanto que os restante vectores αh tem c(h) componentes, as quais repre-

sentam os efeitos do h-esimo factor encaixado nos h− 1 factores que o antecedem.

As matrizes

Mh = XhXTh = b(h)

h∑t=0

Qt, h = 0, ..., u (4.33)

constituem uma base para a a.j.c. A(a)*A(r) = (A(a1)*...*A(au)) *A(r), onde *

representa o produto restrito de a.j.c., sendo que as matrizes Q0, ...,Qu constituem

a base principal de A(a)*A(r). Como ja foi referido anteriormente, a a.j.c. A(r) =

1rJr, Jr e usada para descrever a existencia de replicas para cada combinacao de


nıveis de factores. A a.j.c. A(a) tera base principal da forma

Qh+1(a) =u⊗t=1

Qh,t, h = 0, ..., u (4.34)

em que a0 = 1 e

Qh,t =

Iat se t < h

Jat se t = h

Jatat

se t > h

(4.35)

onde Jat = Iat − 1at

Jat . Fazendo

Ah+1(a) =u⊗t=1

Ah,t, h = 0, ..., u

com

Ah,t =

Iat se t < h

Tat se t = h

1√at

1atT se t > h

onde Tat e a matriz que se obtem, eliminando a 1a linha igual a 1√at

1at de uma

matriz ortogonal estandardizada at × at (seccao 2.1), ter-se-a

Qh(a) = ATh (a)Ah(a), h = 1, ..., u+ 1.

As matrizes A1(a), ...,Au+1(a) sao usadas para descrever grupos de factores encai-

xados. Subsequentemente, o modelo (4.30) com r replicas, pode ser escrito na forma

canonica como

y =u∑h=0

ATh ηh + AT

u+1e∗ (4.36)

onde e∗ = Au+1y = Au+1e e

Ah+1 =

(u⊗t=1

Ah,t

)⊗ 1r

T

√r, h = 0, ..., u.


4.5.2 Modelos para Cruzamento-Encaixe

Para descrever o cruzamento entre L grupos de factores encaixados cada um com

ul factores, cada factor com al(hl) nıveis, hl = 1, ..., ul e l = 1, ..., L, utilizar-se-a o

produto⊗L

l=1A(al), onde as componentes de al serao al(1), ..., al(ul), l = 1, ..., L.

Pondo Al = A(al), havera uma correspondencia entre as matrizes na base principal

de⊗L

l=1Al e os vectores h no conjunto Γ = h;hl = 0, ..., ul, l = 1, ..., L, cujas

componentes sao os valores hl = 0, ..., ul, l = 1, ..., L.

Seja Ql,1, ...,Ql,ul+1 a base principal de Al, l = 1, ..., L com

Ql,hl+1 =

ul⊗t=1

Ql,t(hl), hl = 0, ..., ul (4.37)

em que

Ql,t(hl) =

Ial(t) se t < hl

Jal(t) se t = hl

Jal(t)al(t)

se t > hl

. (4.38)

Fazendo

Al,hl+1 =

ul⊗t=1

Al,t(hl), hl = 0, ..., ul (4.39)

com

Al,t(hl) =

Ial(t) se t < hl

Tal(t) se t = hl

1√al(t)

1al(t)T

se t > hl

(4.40)

facilmente se verifica que

Ql,hl = ATl,hl

Al,hl , hl = 1, ..., ul + 1, l = 1, ..., L. (4.41)

Entao, a base principal da a.j.c A(Γ) =⊗L

l=1Al, tera matrizes da forma

Q(h) =L⊗l=1

Ql,hl+1, h ∈ Γ (4.42)


sendo facil verificar que

Q(h) = A(h)TA(h), h ∈ Γ (4.43)

com

A(h) =L⊗l=1

Al,hl+1, h ∈ Γ. (4.44)

O modelo na forma canonica para descrever delineamentos de cruzamento de L

grupos com u1, ..., uL factores encaixados, com r replicas para todas as combinacoes

de nıveis de todos os factores, pode ser escrito na forma

y =∑h∈Γ

A(h)T η(h) + A⊥Te∗ (4.45)

com η(h) = A(h)y e η(h) = A(h)µ, h ∈ Γ vectores de efeitos fixos, sendo µ =∑h∈Γ A(h)Tη(h) e e∗ = A⊥y = A⊥e com

A(h) =L⊗l=1

(ul⊗t=1

Al,t(hl)

)⊗ 1r

T

√r, h ∈ Γ (4.46)

e

A⊥ = Ic ⊗Tr (4.47)

onde Tr e obtida retirando a primeira linha igual a 1√r1r de uma matriz ortogonal

estandardizada r × r.

A unica componente do vector η(0) correspondera ao valor medio geral µ. Para

vectores h 6= 0, caso h tenha uma unica componente nao nula, este correspondera

aos efeitos desse factor, caso contrario correspondera a interaccoes entre os factores

indexados pelas componentes nao nulas.

Este tipo de delineamento sera desenvolvido e concretizado no capıtulo seguinte.

5. FAMILIAS ESTRUTURADAS DE MODELOS:

CASO EQUILIBRADO

5.1 Generalidades

Uma famılia de modelos diz-se estruturada quando os modelos nela incluıdos cor-

respondem aos tratamentos doutro modelo, designado de modelo base. Os modelos

contidos na famılia designam-se de modelos elementares. Ira agora considerar-se

o caso no qual:

1. O modelo base corresponde a um cruzamento-encaixe completo e equilibrado,

ver [11], e

2. Para os modelos elementares consideram-se duas situacoes:

• regressoes lineares nas mesmas variaveis dependente e controladas;

• modelos log-lineares nos mesmos parametros, ajustados a tabelas de con-

tingencia.

Chama-se tratamento a cada combinacao de nıveis dos factores envolvidos no deli-

neamento base.

As famılias estruturadas de modelos (f.e.m.) correspondem a formalizacao e ge-

neralizacao dos delineamentos regressionais multiplos introduzidos em Mexia(1987).

A abordagem utilizada neste trabalho tem duas fases. Na primeira fase, condensa-

se a informacao dos modelos elementares em estatısticas suficientes. Na segunda fase,

72 5. Famılias Estruturadas de Modelos: Caso Equilibrado

aplicam-se os algoritmos desenvolvidos para o modelo base aos resultados obtidos

na primeira fase.

5.2 Modelo Base

Como foi atras referido, para o modelo base considera-se o cruzamento-encaixe com-

pleto e equilibrado. Nesta situacao, consideram-se todas as combinacoes de nıveis

dos factores que cruzam para as quais existira sempre igual numero de replicas.

Assim, de forma a frisar alguns detalhes, mais uma vez suponha-se que existem

L grupos com u1, ..., uL factores. O primeiro factor of l-esimo grupo tera al(1) nıveis

com l = 1, ..., L. Se ul > 1 ha encaixe para o l-esimo grupo de factores. Nesse caso,

serao encaixados al(2) nıveis do segundo factor desse grupo dentro de cada nıvel

do primeiro factor e assim sucessivamente. Existirao cl(h) =h∏p=1

al(p) combinacoes

de nıveis para os primeiros h factores, h = 1, ..., ul, no l-esimo grupo, cada um

encaixando bl(h) = cl(ul)/cl(h), h = 1, ..., ul combinacoes de nıveis dos restantes

factores do grupo, l = 1, ..., L. Alem disso, por-se-a cl(−1) = 0 e cl(0) = 1 assim

como gl(h) = cl(h)− cl(h− 1), h = 1, ..., ul, l = 1, ..., L. Deste modo, o numero total

de combinacoes de nıveis, ou seja, de tratamentos, sera c =L∏l=1

cl(ul). Se para cada

um dos c tratamentos se tomar r repeticoes, havera um total de n = c.r observacoes

neste delineamento.

Os c tratamentos podem ser representados por vectores j com componentes jl =

1, ..., cl = cl(ul), l = 1, ..., L e podem ser ordenados atraves dos ındices

i(j) = j1 +L∑l=2

(jl − 1)l−1∏h=1

ch (5.1)

com

jl = pl,1 +

ul∑h=2

(pl,h − 1)cl(h), l = 1, ..., L (5.2)

5.2. Modelo Base 73

onde pl,h = 1, ..., al(h), h = 1, ..., ul sao os nıveis dos factores do l-esimo grupo.

Havendo r observacoes por tratamento, as mesmas encontram-se agrupadas no

vector de observacoes y, estando os tratamentos ordenados de acordo com os res-

pectivos ındices.

Os factores que encaixam outro ou outros, nao interagem com os efeitos de fac-

tores do mesmo grupo, logo interaccoes so existem para nıveis conjuntos de factores

pertencendo a diferentes grupos. Seja h o vector com componentes hl = 0, ..., ul, l =

1, ..., L, que representam os ındices de factores pertencentes a diferentes grupos.

Quando hl = 0 nenhum factor do grupo l e seleccionado. Se h tiver apenas uma

componente nao nula hl′ , h indica apenas um factor, estando associado ao efeito

desse factor. Se h tiver mais do que uma componente nao nula, entao correspondera

a uma interaccao entre os factores correspondentes a essas componentes os quais

pertencem a diferentes grupos. A h = 0 estara associado o valor medio geral µ.

Sendo Γ = h;hl = 0, ..., ul, l = 1, ..., L, note-se que #(Γ) =∏L

l=1 (ul + 1).

O modelo linear na forma canonica definido na expressao (4.45) descreve a in-

fluencia dos nıveis dos factores no vector das observacoes para um delineamento de

cruzamento-encaixe. A este modelo esta associada a a.j.c A(Γ), cuja base princi-

pal sera constituıda pelas matrizes Q(h) = A(h)TA(h) com h ∈ Γ (seccao 4.5.2.).

Como foi visto na seccao 4.1, a essa algebra corresponde uma particao ortogonal do

espaco amostral, sendo deste modo a ortogonalidade do modelo assegurada.

Como foi visto na seccao 4.2, quando se admite a normalidade os η(h),h ∈ Γ e

SQe constituem uma estatıstica suficiente e completa, tendo-se η(h) ∼ N(η(h), σ2Ig(h))

com

g(h) = Car(A(h)) =L∏l=1

(cl(hl)− cl(hl − 1)). (5.3)

Por outro lado tem-se

SQ(h) = ‖η(h)‖2 = yTA(h)TA(h)y ∼ σ2χ2g(h),δ(h), h ∈ Γ (5.4)


com

δ(h) =1

σ2µTA(h)TA(h)µ

independente da soma de quadrados para o erro

SQe = ‖A⊥y‖2 = yTA⊥TA⊥y ∼ σ2χ2

g (5.5)

com g = n− c.

Usando o teorema Blackwell-Lehmann-Scheffe, η(h), h ∈ Γ e σ2 = SQeg

sao

UMVUE para os vectores medios η(h), h ∈ Γ e para σ2, respectivamente.

Quando nao existem efeitos ou interaccoes associadas a h, tem-se η(h) = 0,

h ∈ Γ/0.

Assim, para testar as hipoteses relativas aos efeitos fixos

H0(h) : η(h) = 0,h ∈ Γ (5.6)

usam-se os testes F com estatıstica

F(h) =g

g(h)

SQ(h)

SQe

,h ∈ Γ. (5.7)

Quando a hipotese H0(h) se verifica, δ(h) = 0, e F(h) tem distribuicao F central

com g(h) e g graus de liberdade.

5.3 Modelos Elementares

Suponha-se que o modelo base de cruzamento-encaixe tem c tratamentos ordenados

com os ındices i = i(j), i = 1, ..., c. Para cada um deste tratamentos tem-se um

modelo elementar.

5.3. Modelos Elementares 75

5.3.1 Regressoes Multiplas

Neste caso, interessa considerar que os modelos elementares sao regressoes lineares

multiplas, com a mesma variavel dependente e as mesmas k variaveis controladas

yi = Xiβi + εi, i = 1, ..., c. (5.8)

No caso regular, tem-se os mesmos valores para as k variaveis controladas em todas

as regressoes, ou seja, Xi = X, i = 1, ..., c, resultando que o numero de observacoes

por regressao e sempre igual a n. Por outro lado, assume-se tambem a homocedas-

ticidade, tomando-se σ2i = σ2, i = 1, ..., c.

Como ja foi anteriormente referido inicia-se a inferencia condensando a informacao

contida nos modelos elementares. Apenas sera abordado o caso regular, para o qual

se assume que:

• A matriz X e do tipo n × (k + 1), com vectores coluna linearmente indepen-

dentes,

• os vectores dos erros εi, i = 1, ..., c sao normais, independentes, com valores

medios nulos e matrizes de covariancia σ2In.

Assim sendo, vem

yi ∼ N(Xβi, σ

2In), i = 1, ..., c (5.9)

e como tal os estimadores dos mınimos quadrados dos βi sao

βi =(XT X

)−1XTyi ∼ N

(βi, σ

2(XT X)−1), i = 1, ..., c (5.10)

independentes das

SQEi = yTi yi − yTi Xβi, i = 1, ..., c (5.11)

as quais sao produtos por σ2 de qui-quadrados centrais com n − k − 1 graus de

liberdade, pondo-se SQEi ∼ σ2χ2n−k−1, i = 1, ..., c (seccao 2.10).


Os pares(βi, SQEi

), i = 1, ..., c serao estatısticas suficientes, logo incluem toda

a informacao transportada pelos vectores das observacoes dos modelos elementares.

Nos modelos regressionais multiplos, estamos interessados nos coeficientes indi-

viduais das regressoes e nas suas combinacoes lineares. Uma vez que os coeficientes

individuais sao casos particulares das suas combinacoes lineares, ir-se-ao considerar

apenas as segundas.

Assim, dado a um vector com k + 1 componentes, de coeficientes duma com-

binacao linear, pode-se associar ao modelo base um vector y, cujas componentes sao

os yi = aT βi, i = 1, ..., c. Estas componentes serao normais, independentes e com

valores medios µi = aTβi, i = 1, ..., c e variancia σ2v com

v = aT (XT X)−1a.

Consequentemente, o vector y sera tambem normal, com vector medio µ, cujas

componentes sao os valores aTβi, i = 1, ..., c e com

COV(y) = σ2vIc. (5.12)

Alem disso, y sera independente da soma da soma dos quadrados dos erros das c

regressoes

SSQE =c∑i=1

SQEi (5.13)

a qual, de acordo com a reprodutividade do qui-quadrado, sera o produto por σ2

dum qui-quadrado central com g′ = c(n− k − 1) graus de liberdade.

O vector y, com as componentes ordenadas de acordo com os ındices i = i(j),

constituira o vector de observacoes para o modelo base. Aplicando a y o algoritmo

exposto na seccao anterior, para o modelo base de cruzamento-encaixe equilibrado,

pode ser estudada a influencia dos factores do modelo base, nos valores da com-

binacoes lineares dos coeficientes das regressoes. Para isso, apenas se tem de efectuar

no modelo (4.45) as substituicoes seguintes:


• y por y;

• µ por µ;

• SQe por SSQE;

• g por g′

donde η(h) = A(h)y ∼ N(η(h), σ2vIg(h)) logo

SQ(h) = yTA(h)TA(h)y ∼ σ2vχ2g(h),δ(h), h ∈ Γ (5.14)

com

δ(h) =1

σ2vµTA(h)TA(h)µ

e independente SSQE. Assim, obtem-se a estatıstica F

F(h) =g′

g(h)

SQ(h)

vSSQE,h ∈ Γ (5.15)

com g(h) e g′ graus de liberdade, para testar as hipoteses

H0(h) : η(h) = A(h)µ = 0,h ∈ Γ (5.16)

atraves das quais se testa a accao dos factores do modelo base nos valores da com-

binacoes lineares dos coeficientes das regressoes.

Em particular, se apenas interessar comparar individualmente o j-esimo coefici-

ente de todas as regressoes, toma-se para a um vector com todas as componentes

iguais a zero com excepcao da j-esima componente, com 0 ≤ j ≤ k.

Para estudar os vectores estimaveis, toma-seψ(h) = B(h)η(h)

ψ(h) = B(h)η(h)(5.17)


vindo ψ(h) ∼ N(ψ(h), σ2W(h)) com

W(h) = vB(h)B(h)T . (5.18)

Admita-se que, os s(h) vectores linha de B(h) sao linearmente independentes, entao

Car(B(h)) = Car(W(h)) = s(h) e W(h) sera regular, ver [38]. Para testar

hipoteses do tipo

H0(h) : ψ(h) = ψ0(h) (5.19)

com ψ0(h) ∈ R(B(h)), utilizam-se as estatısticas

F =g′

s(h)

(ψ(h)−ψ0(h))TW(h)−1(ψ(h)−ψ0(h))

SSQE(5.20)

com distribuicao F (z|s(h), g′, δ(h)) e

δ(h) =1

σ2(ψ(h)−ψ0(h))TW(h)−1(ψ(h)−ψ0(h)). (5.21)

Quando H0(h) se verifica, δ(h) = 0, pelo que o teste e estritamente nao distorcido

(seccao 2.9).

Por outro lado,

F ′(h) =g′

s(h)

(ψ(h)−ψ(h))TW(h)−1(ψ(h)−ψ(h))

SSQE∼ Fs(h),g′ (5.22)

obtendo-se o elipsoide de confianca de nıvel 1− q

(ψ(h)− ψ(h))TW(h)−1(ψ(h)− ψ(h)) 6 s(h)F1−q,s(h),g′SSQE

g′. (5.23)

Como o teste F de nıvel q nao rejeita H0(h) quando e so quando ψ0(h) pertencer ao

elipsoide de confianca de nıvel 1− q, estes testes gozam de dualidade (seccao 2.9).

Aplicando o teorema de Scheffe, ver [34], ao par (ψ(h), SSQE) vem

Pr

⋂d(h)

(∣∣∣d(h)Tψ(h)− d(h)T ψ(h)∣∣∣ 6√s(h)F1−q,s(h),g′

(d(h)TW(h)d(h)

) SSQE

g′

) = 1−q

(5.24)


para todos os vectores d(h) ∈ Rn, pelo que se tem, ver [16], os intervalos de confianca

simultaneos de nıvel 1−q para parametros ρ = d(h)Tψ(h) dados pelas desigualdades

∣∣∣d(h)Tψ(h)− d(h)T ψ(h)∣∣∣ 6√s(h)F1−q,s(h),g′

(d(h)TW(h)d(h)

) SSQEg′

. (5.25)

Quando

∣∣∣ρ0(h)− d(h)T ψ(h)∣∣∣ >√s(h)F1−q,s(h),g′

(d(h)TW(h)d(h)

) SSQEg′

(5.26)

a desigualdade correspondente a d nao pode ser satisfeita para d(h)Tψ(h) = ρ0(h),

concluı-se que ρ(h) e significativamente diferente de ρ0(h) ao nıvel de significancia

q, ver [16].

Tomando-se para d(h), um vector com todas as componentes nulas, a excepcao

da i-esima e da i′-esima, respectivamente iguais a 1 e -1, obtem-se

ρ(h) = ψi(h)− ψi′(h)

podendo, assim, detectar-se os pares para os quais as componentes de ψ(h) que

diferem significativamente (metodo das comparacoes multiplas de Scheffe), ver [17].

Mais adiante no, capıtulo 6, sera abordado o caso nao equilibrado, no qual as

matrizes X(h) podem diferir de regressao para regressao.

5.3.2 Modelos Log-Lineares

Com o objectivo de mostrar a versatilidade das f.e.m., suponha-se agora que os mo-

delos elementares, em vez de regressoes multiplas, sao modelos log-lineares ajustados

a tabelas de contingencia (seccao 2.11).

Suponha-se, para isso, que existe uma tabela de contingencia por tratamento

com N celulas cada uma. Seja ni,j o numero de contagens da celula j referente a


tabela do tratamento i com j = 1, ..., N, i = 1, ..., c. Entao, ter-se-a

n =N∑j=1

ni,j, i = 1, ..., c,

isto e, a soma das N contagens de cada tabela totaliza sempre o mesmo valor n para

todos os tratamentos e replicas.

Assume-se que os ni,j sao independentes e tem distribuicao de Poisson com

parametros mi,j, j = 1, ..., N , i = 1, ..., c (seccao 2.11).

Seja mi o vector com componentes mi,j, j = 1, ..., N , i = 1, ..., c. Para cada

tratamento do modelo base, os modelos log-lineares sao da forma

log mi = Xθi (5.27)

onde X e a matriz do modelo igual, para todos os modelos e θi, i = 1, ..., c representa

o vector de parametros. θi e composto pelos s parametros que integram o modelo

log-linear ajustado, sendo que o numero e o tipo de parametros e igual para todos

os modelos.

Como foi visto na seccao 2.11, para n grande os estimadores de maxima verosi-

milhanca θi de θi tem distribuicao normal aproximada, sao independentes entre si

e

COV(θi) =(XTD(mi)X

)−1, i = 1, ..., c (5.28)

onde D(mi) representa a matriz diagonal, cujos elementos principais sao as compo-

nentes de mi, i = 1, ..., c.

Por outro lado, ver seccao 2.11, o desvio residual converge em distribuicao para

um qui-quadrado com N − s graus de liberdade, ou seja

G2i = 2

N∑j=1

ni,j log(ni,j/mi,j)d−→ χ2

N−s, i = 1, ..., c (5.29)


sendo este independente de θi. Deste modo, os pares (θi, G2i ), i = 1, ..., c sao as

estatısticas suficientes a ser utilizadas.

Dado a um vector de coeficientes de uma combinacao linear com s componentes,

pode-se associar ao modelo base um vector y, cujas componentes sao os c valo-

res yi = aT θi, i = 1, ..., c. Estas componentes serao assimptoticamente normais,

independentes, com valores medios

µi = aTθi, i = 1, ..., c

e variancia

V (yi) = aT (XTD(mi)X)−1a.

Consequentemente, o vector y sera tambem assimptoticamente normal, com vector

medio µ, cujas componentes sao os valores aTθi e matriz de covariancia igual a uma

matriz diagonal, cujos elementos principais sao os valores V (yi), i = 1, ..., c devido a

independencia entre os yi, i = 1, ..., c. Ponha-se

COV(y) = D [V (y1), ..., V (yc)] (5.30)

ou seja, COV(y) sera uma matriz diagonal cujos elementos principais sao os c

valores V (yi), i = 1, ..., c. Alem do mais, y sera independente da soma dos desvios

residuais dos c modelos log-lineares

SG2 =c∑i=1

G2i (5.31)

a qual, de acordo com a reprodutividade do qui-quadrado, tera distribuicao as-

simptotica qui-quadrado central com g′′ = c(N − s) graus de liberdade.

O vector y com as componentes ordenadas de acordo com os ındices i = i(j),

constituira o vector de observacoes para o modelo base, ao qual se vai aplicar o algo-

ritmo exposto na seccao 5.1, para o modelo base de cruzamento-encaixe equilibrado.


Deste modo, pode ser estudada a influencia dos factores do modelo base, nos valores

das combinacoes lineares dos parametros dos modelos log-lineares.

Tal como quando se tem regressoes lineares, efectuando em (4.45) as substituicoes

• y por y;

• µ por µ;

• SQe por SG2;

• g por g′′

com η(h) = A(h)y e η(h) = A(h)µ, ver seccao 2.9, vem

η(h)d−→ N(η(h),A(h)D [V (y1), ..., V (yc)] A(h)T ).

Seja K(h) = A(h)D [V (y1), ..., V (yc)] A(h)T . Veja-se agora que, dado um vector

v qualquer

vTA(h)D [V (y1), ..., V (yc)] A(h)Tv = (A(h)Tv)TD [V (y1), ..., V (yc)] (A(h)Tv).

Uma vez que D [V (y1), ..., V (yc)] e definida positiva, a expressao anterior e nula, se

e so se A(h)Tv = 0, a qual se verifica se e so se v = 0, visto que os vectores linha

de A(h) sao linearmente independentes, por serem uma base ortonormada (seccao

3.1). Assim, por definicao, para um v 6= 0, vTK(h)v > 0 e portanto K(h) sera

definida positiva, logo existe K(h)−1, a qual tambem e definida positiva.

Devido ao

Proposicao 5.3.1. Teorema

Sendo Xn uma sucessao de variaveis aleatorias reais e g uma funcao continua

definida em R, se Xnd−→ X entao g(Xn)

d−→ g(X) a medida que n→∞.


Demonstracao. Ver [31] e [32].

pode-se escrever

η(h)TK(h)−1η(h)d−→ χ2

g(h),δ(h), h ∈ Γ (5.32)

com

δ(h) = η(h)TK(h)−1η(h)

(seccao 2.9). Sendo esta forma quadratica independente de SG2, obtem-se a es-

tatıstica

F(h) =g′′

g(h)

η(h)TK(h)−1η(h)

SG2,h ∈ Γ (5.33)

para testar as hipoteses

H0(h) : η(h) = A(h)µ = 0,h ∈ Γ (5.34)

as quais equivalem a testar a accao dos factores do modelo base, nos valores da

combinacoes lineares dos parametros dos modelos log-lineares. Se a hipotese nula

for verdadeira, δ(h) = 0 e F(h) tera distribuicao F central com g(h) e g′′ graus de

liberdade.

No que respeita aos vectores estimaveis e as comparacoes multiplas de Scheffe,

aplicam-se os resultados apresentados na parte final da seccao anterior, apenas ha

que substituir nas expressoes (5.17) a (5.26)

W(h) = vB(h)B(h)T (5.35)

por

W(h) = B(h)K(h)B(h)T , (5.36)

SSQE por SG2 e g′ por g′′.

O caso nao equilibrado, no qual se poderiam ter diferentes matrizes X(h) de

modelo log-linear para modelo log-linear, nao e abordado, uma vez que nao faz


sentido comparar tabelas de contingencia com diferente numero de celulas, as quais

teriam de se ajustar modelos log-lineares com diferentes parametros.

6. MODELOS L-ORTOGONAIS PARA EFEITOS FIXOS

6.1 Projeccoes e Estatısticas

Admita-se que y ∼ N(µ, σ2In), com µ ∈ Ω = R(L), vindo

µ = Lλ. (6.1)

Diz-se que o modelo de efeitos fixos y = Lλ+ e e L-ortogonal se:

• os vectores coluna de L forem linearmente independentes;

• se tiver λ =∑m

i=1 Xiαi, constituindo as matrizes Mi = XiXTi , i = 1, ...,m,

uma base para uma a.j.c. completa A.

Seja Q1, ...,Qm a base principal de A, ter-se-a entao a matriz de transicao B =

[bi,j], i, j = 1, ...,m vindo

Mi =m∑j=1

bi,jQj (6.2)

onde Qj = ATj Aj, j = 1, ...,m.

Observe-se, agora, que a matriz de projeccao ortogonal sobre Ω, uma vez que os

vectores coluna de L sao linearmente independentes, e

P = L(LTL)−1LT (6.3)

vindo Pµ = µ e que, com Pc = In −P se tem Pcµ = 0 (seccao 2.4).

Como

86 6. Modelos L-Ortogonais para Efeitos Fixos

• y, e ∈ Rn

• Lλ ∈ Ω

• Rn = Ω Ω⊥

• y = yΩ + yΩ⊥

onde yΩ e yΩ⊥ representam os vectores projeccao ortogonal de y sobre os sub-espacos

Ω e Ω⊥ respectivamente, tem-se que (seccao 2.4)

yΩ = Py = P(Lλ+ e) = Pµ+ Pe = µ+ eΩ

e

yΩ⊥ = Pcy = Pc(Lλ+ e) = Pcµ+ Pce = eΩ⊥

donde

y = µ+ eΩ + eΩ⊥ .

Por P e Pc serem matrizes de projeccao ortogonal, logo simetricas, vem

COV(yΩ; yΩ⊥) = COV(Py; Pcy) = Pσ2InPcT = σ2PPc = 0

donde, no caso de normalidade do modelo, ha independencia entre yΩ e yΩ⊥ , ou

seja, entre as duas partes do modelo.

Tem-se ainda

1

σ2(y−µ)T (y−µ) =

1

σ2(y−µ)T (P+Pc)(y−µ) =

1

σ2(y−µ)TP(y−µ)+

1

σ2yTPcy

(6.4)

ou seja, a expressao do primeiro membro da equacao e dividido em dois termos, o

primeiro do qual vem, devido a P ser uma matriz de projeccao ortogonal,

(y−µ)TP(y−µ) = ‖Py−µ‖2 = ‖L(LTL)−1LTy−µ‖2 = ‖Lλ−Lλ‖2 = (λ−λ)TLTL(λ−λ)

(6.5)

6.2. Inferencia 87

com λ = (LTL)−1LTy, e o segundo termo, tambem devido a Pc ser uma matriz de

projeccao ortogonal, e dado por

yTPcy = yT (In −P)y = yTy − yTPy = yTy − yTLλ = ‖y − µ‖2 = SQe. (6.6)

Ter-se-a, assim, para y a densidade

n(y) =e−

12σ2 (λ−λ)

TLTL(λ−λ)−SQe

2σ2

(2π)n/2 σn(6.7)

e, atendendo ao teorema da factorizacao, ve-se que λ e SQe constituem uma es-

tatıstica suficiente. Como a distribuicao normal pertence a famılia exponencial e

o espaco parametrico contem o produto cartesiano de intervalos nao degenerados,

estas estatısticas serao tambem completas [13].

Ve-se ainda que

λ ∼ N(λ, σ2(LTL)−1)

e independente de

SQe ∼ σ2χ2g (6.8)

onde g = dim(Ω⊥) = n− Car(L) [14].

6.2 Inferencia

Como a a.j.c. A e completa, sendo n = dim(Ω) = Car(L), ter-se-a

In =m∑j=1

Qj =m∑j=1

ATj Aj (6.9)

logo, com ηj = Ajλ, j = 1, ...,m

ηj = Ajλ, j = 1, ...,m(6.10)


ter-se-a

ηj ∼ N(ηj, σ2Aj(L

TL)−1ATj ), j = 1, ...,m

independente de SQe, bem comoλ =

m∑j=1

ATj Ajλ =

m∑j=1

ATj ηj

λ =m∑j=1

ATj Ajλ =

m∑j=1

ATj ηj

. (6.11)

Considerando, agora, os vectores estimaveisψ = Gλ

ψ = Gλ(6.12)

onde G e uma matriz de vectores linha linearmente independentes, tem-se ψ ∼

N(ψ, σ2W) com

W = G(LTL)−1GT

bem como ψ =

m∑j=1

Gjηj

ψ =m∑j=1

Gjηj

(6.13)

com Gj = GATj , j = 1, ...,m.

Utilizando o teorema de Blackwell-Lehmann-Scheffe (seccao 2.7), facilmente se

verifica que os λ, ηj e ψ sao estimadores UMVUE, para os vectores λ, ηj e ψ.

Ora, sendo s = Car(W), obtem-se para ψ o elipsoide de confianca

Pr

((ψ − ψ)TW+(ψ − ψ) 6 sF1−q,s,g

SQe

g

)= 1− q (6.14)

6.2. Inferencia 89

atendendo ao teorema de Scheffe tem-se

Pr

[⋂d

(∣∣∣dTψ − dT ψ∣∣∣ 6√sF1−q,s,gdTWd

SQe

g

)]= 1− q (6.15)

para todos os vectores d ∈ Rn, resultando daqui intervalos de confianca simultaneos,

dados pelas desigualdades∣∣∣dTψ − dT ψ

∣∣∣ 6√sF1−q,s,gdTWdSQeg

.

Por outro lado, para ψ0 ∈ R(G) tem-se

(ψ −ψ0)TW+(ψ −ψ0) ∼ σ2χ2s,δ (6.16)

com

δ =1

σ2(ψ −ψ0)TW+(ψ −ψ0). (6.17)

Assim, como a forma quadratica da expressao (6.16) e independente de SQe, para

testar hipoteses do tipo

H0 : ψ = ψ0 (6.18)

obtem-se testes F com estatısticas

F =g

s

(ψ −ψ0)TW+(ψ −ψ0)

SQe

(6.19)

com distribuicao F (z|s, g, δ). Quando a hipotese H0 se verifica tem-se δ = 0 e vem

F ′ = g

s

(ψ −ψ)TW+(ψ −ψ)

SQe

∼ Fs,g (6.20)

sendo estes testes nao distorcidos (seccao 2.8). Nao se rejeita H0 pelo teste de nıvel

q, se e so se ψ0 pertencer ao elipsoide de confianca de nıvel 1− q

(ψ − ψ)TW+(ψ − ψ) ≤ sF1−q,s,gSQe

g(6.21)

pelo que os testes gozam de dualidade. Se se tiver W+ = W−1, entao pode-se testar

directamente a hipotese H0 : δ = 0 e o teste sera estritamente nao distorcido (seccao

2.9).


Considerem-se agora os vectores estimaveis, tal com na seccao 4.4., da formaψj = Bjηj

ψj = Bjηj

(6.22)

vindo ψj ∼ N(ψj, σ2Wj) com

Wj = BjAj(LTL)−1AT

j BTj . (6.23)

Observe-se que, os ηj e os ψj, j = 1, ...,m sao casos particulares dos vectores

estimaveis ψ, entao para o caso particular destes vectores ψj, j = 1, ...,m, ha que

substituir s por sj = Car(Wj) no teorema de Scheffe, para obter os intervalos de

confianca simultaneos∣∣∣djTψj − dj

T ψj

∣∣∣ 6 √sjF1−q,sj ,gdj

TWjdjSQeg, j = 1, ...,m.

Por outro lado, para um bj ∈ R(Bj) tem-se

(ψj − bj)TWj

+(ψj − bj) ∼ σ2χ2sj ,δj

, j = 1, ...,m (6.24)

independente de SQe, com

δj =1

σ2(ψj − bj)

TWj+(ψj − bj). (6.25)

Igualmente se obtem testes F com estatısticas

Fj =g

sj

(ψj − bj)TWj

+(ψj − bj)

SQe

(6.26)

tendo distribuicao F (z|sj, g, δj), para testar as hipoteses

H0,j : ψj = bj, j = 1, ...,m. (6.27)

Quando a hipotese H0,j se verifica, tem-se δj = 0, j = 1, ...,m e vem

F ′j =g

sj

(ψj −ψj)TWj

+(ψj −ψj)

SQe

∼ Fsj ,g (6.28)

obtendo-se, tal com atras, testes nao distorcidos.

6.3. Um Primeiro Exemplo 91

6.3 Um Primeiro Exemplo

Vai agora abordar-se, neste primeiro exemplo, um modelo para observacoes escalares,

em que o numero de repeticoes varia de tratamento para tratamento.

Seja y. o vector das medias das observacoes por tratamento. Suponha-se que

existem c tratamentos com nl observacoes, l = 1, ..., c. Entao, as componentes de y.

serao da forma

yl =

∑nli=1 ylinl

, l = 1, ..., c

em que yli, i = 1, ..., nl e a i-esima observacao do l-esimo tratamento.

y. sera um estimador de

µ. =

µ1

...

µc

= E (y.) (6.29)

e

COV (y.) =

V (y1) · · · 0

· · · . . . · · ·

0 · · · V (yc)

= σ2D

(1

n1

, ...,1

nc

)(6.30)

uma vez que

V (yl) = V

(1

nl

nl∑i=1

yli

)=

1

n2l

nl∑i=1

V (yli) =nlσ

2

n2l

=σ2

nl, l = 1, ..., c

e que os yli sao normais e independentes entre si. Tem-se, portanto

y. ∼ N

(µ., σ2D

(1

n1

, ...,1

nc

))(6.31)

o qual sera tambem independente de SQe.


E facil verificar que

µ =

µ1

...

µc

=

1n1 · · · 0

.... . .

...

0 · · · 1nc

µ. = D(1n1 , ...,1nc)µ. (6.32)

em que

µl =

µl...

µl

, l = 1, ..., c

tem nl, l = 1, ..., c componentes.

Por outro lado, tambem facilmente se verifica quey. = D(

1

n1

1Tn1, ...,

1

nc1Tnc)y

µ. = D(1

n1

1Tn1, ...,

1

nc1Tnc)µ

. (6.33)

Sejam Xi, i = 1, ...,m matrizes tais que

Xi = D(1n1 , ...,1nc)Xi.

considerando (6.32) e a 1a expressao de (4.2) vem

D(1n1 , ...,1nc)µ. = µ =m∑i=1

Xiαi = D(1n1 , ...,1nc)m∑i=1

Xiαi

donde

µ. =m∑i=1

Xiαi. (6.34)

correspondendo os vectores αi, i = 1, ...,m aos efeitos e interaccoes de factores fixos.

No que se refere ao modelo (6.1), fazendo λ = µ. em (6.32), vem

L = D(1n1 , ...,1nc) (6.35)

6.3. Um Primeiro Exemplo 93

logo LTL = D(n1, ..., nc)

(LTL)−1 = D

(1

n1

, ...,1

nc

) (6.36)

vindo, devido a (6.5) e (6.33)

λ = (LTL)−1LTy = D

(1

n1

1Tn1, ...,

1

nc1Tnc

)y = y. (6.37)

independente de

SQe = yTy − yTD(1n1 , ...,1nc)y. ∼ χ2g (6.38)

com g = Car(In −D(1n1 , ...,1nc)) = n− c.

Substituindo em (6.11) vem y. =

m∑j=1

ATj ηj

µ. =m∑j=1

ATj ηj

com ηj = Ajy. e ηj = Ajµ., j = 1, ...,m com

ηj ∼ N(ηj, σ2AjD

(1

n1

, ...,1

nc

)ATj ), j = 1, ...,m

independente de SQe.

No que se segue, tem-se ψ = Gµ. =

m∑j=1

Gjηj

ψ = Gy. =m∑j=1

Gjηj

(6.39)

com Gj = GATj , em que

ψ ∼ N(ψ, σ2W) (6.40)


onde

W = GD

(1

n1

, ...,1

nc

)GT .

Com ψj = Bjηj

ψj = Bjηj

(6.41)

vem ψj ∼ N(ψj, σ2Wj), onde

Wj = BjAjD

(1

n1

, ...,1

nc

)ATj BT

j . (6.42)

A partir daqui, a parte restante relativa a inferencia, processa-se tal como foi

apresentada na seccao anterior.

6.4 Modelos Regressionais Multiplos: Caso nao Equilibrado

A teoria desenvolvida nesta seccao permite abordar agora o caso nao equilibrado

das f.e.m., quando os modelos elementares sao regressoes multiplas, ou seja, o caso

em que as matrizes do modelo das regressoes podem diferir de tratamento para tra-

tamento. Assim, podem-se ter regressoes do mesmo tipo mas com diferente numero

de observacoes.

6.4.1 Estrutura

Supondo que os tratamentos do modelo base foram ordenados pelos ındices l = i(j) =

1, ..., c, referidos na seccao 5.3, para cada um dos c tratamentos do delineamento

base, existe uma regressao multipla nas mesmas k variaveis controladas

yl = Xlβl + εl, l = 1, ..., c (6.43)

6.4. Modelos Regressionais Multiplos: Caso nao Equilibrado 95

com

yl =

yl1...

ylnl

, l = 1, ..., c

os vectores das observacoes, e matrizes de modelo

Xl =

1 x

(l)11 · · · x

(l)1k

1 x(l)21 . . . x

(l)2k

......

1 x(l)nl1· · · x

(l)nlk

, l = 1, ..., c

sendo estas do tipo nl × (k + 1), l = 1, ...c, com vectores coluna linearmente inde-

pendentes e vectores dos coeficientes e de erro aleatorio

βl =

βl0...

βlk

e εl =

εl1...

εlnl

, l = 1, ..., c

respectivamente.

Alem disso, assume-se que o numero de observacoes para a l-esima regressao nl

e sempre maior ou igual ao numero de variaveis controladas k, l = 1, ..., c.

No caso standard, admite-se que Car(Xl) = k + 1, l = 1, ..., c e que

COV(εl) = σ2Inl

ou seja, exige-se que se verifique a homocedasticidade.

Assim sendo, obtem-se estimadores dos vectores dos coeficientes de cada re-

gressao da forma

βl =(XTl Xl

)−1XTl yl, l = 1, ..., c (6.44)


os quais sao normais, comE(βl

)= β, l = 1, ..., c

COV(βl

)= σ2

(XTl Xl

)−1, l = 1, ..., c

(6.45)

independentes entre si e independentes das somas dos quadrados dos erros para cada

regressao, dadas por

SQEl = ylTyl − yl

T Xlβl, l = 1, ..., c (6.46)

as quais tem distribuicao produto de σ2 por um χ2nl−k−1.

Passando ao caso que interessa, dado que

µl = Xlβl, l = 1, ..., c (6.47)

e facil verificar que

µ =

µ1

...

µc

= D(X1, ..., Xc)[βT1 ...β

Tc ]T . (6.48)

Em (6.48), fazendo λ = [βT1 , ...,βTc ]T , vem

L = D(X1, ..., Xc) (6.49)

logo

LTL = D(XT1 X1, ..., X

Tc Xc). (6.50)

Com

y =

y1

...

yc

(6.51)


devido a (6.44) vem

λ = (LTL)−1LTy = D((XT

1 X1)−1XT1 , ..., (X

Tc Xc)

−1XTc

)y =

(XT

1 X1)−1XT1 y1

...

(XTc Xc)

−1XTc yc

(6.52)

ou seja

λ = [βT

1 ...βT

c ]T . (6.53)

λ sera, pois, um estimador normal centrado, facilmente se vendo que

COV(λ) = σ2D((XT

1 X1)−1, ..., (XTc Xc)

−1)

(6.54)

independente da soma da soma dos quadrados dos erros das c regressoes

SSQE =c∑l=1

SQEl ∼ σ2χ2g′ (6.55)

com g′ =∑c

l=1 (nl − k − 1).

6.4.2 Inferencia

Tal como na seccao 6.2, com ηj = Aj[βT1 ...β

Tc ]T , j = 1, ...,m tem-se

ηj = Aj[βT

1 ...βT

c ]T ∼ N(ηj, σ2Wj), j = 1, ...,m (6.56)

onde

Wj = AjD((XT

1 X1)−1, ..., (XTc Xc)

−1)

ATj

e independente de SSQE.

No que respeita a vectores estimaveis, devido a (6.11), tem-se igualmenteψ = Gλ =

m∑j=1

Gjηj

ψ = Gλ =m∑j=1

Gjηj

(6.57)


com Gj = GATj sendo

ψ ∼ N(ψ, σ2W) (6.58)

onde

W = GD((XT

1 X1)−1, ..., (XTc Xc)

−1)GT . (6.59)

tambem independente de SSQE.

Como ja foi referido no capıtulo 5, no que respeita as famılias estruturadas de

modelos, e em particular, aos modelos regressionais multiplos, esta-se interessado

em combinacoes lineares dos coeficientes das regressoes. Assim, para se obter os

vectores y e µ, cujas componentes sao os valores yl = aT βl e µl = aTβl, com

l = 1, ..., c correspondentes a combinacoes lineares dos coeficientes das c regressoes,

basta fazer em (6.57)

G = [Ic ⊗ aT ]

obtendo-se, deste modoψ = Gλ = [Ic ⊗ aT ][βT1 ...βTc ]T = µ

ψ = Gλ = [Ic ⊗ aT ][βT

1 ...βT

c ]T = y(6.60)

passando-se a ter

W = [Ic ⊗ aT ]D((XT

1 X1)−1, ..., (XTc Xc)

−1)

[Ic ⊗ aT ]T . (6.61)

Com o objectivo concluir acerca da influencia dos factores do modelo base nos

valores das combinacoes lineares nos coeficientes das regressoes, basta substituir em

(6.56) λ por µ, λ por y, obtendo-se

ηj = Ajy ∼ N(Ajµ, σ2Wj), j = 1, ...,m (6.62)

independente de SSQE, onde

Wj = Aj[Ic ⊗ aT ]D((XT

1 X1)−1, ..., (XTc Xc)

−1)

(Aj[Ic ⊗ aT ])T .


No sentido de obter um tratamento mais geral, suponha-se agora vectores es-

timaveis do tipo ψj = Bjηj

ψj = Bjηj

(6.63)

com j = 1, ...,m, entao vem ψj ∼ N(ψj, σ2W∗

j ) independente de SSQE com

W∗j = BjWjB

Tj . (6.64)

Pretende-se testar hipoteses do tipo

Hj,0 : ψj = ψj,0, j = 1, ...,m (6.65)

com ψj,0 ∈ R(Bj), para as quais se obtem as estatısticas

Fj =g′

sj

(ψj −ψj,0)TWj∗+(ψj −ψj,0)

SSQE(6.66)

com distribuicao F (z|sj, g′, δj), sendo sj = Car(W∗j ) e

δj =1

σ2(ψj −ψj,0)TWj

∗+(ψj −ψj,0). (6.67)

Quando a hipotese Hj,0 se verifica, tem-se δj = 0 e vem

F ′j =g′

sj

(ψj −ψj)TWj

∗+(ψj −ψj)

SSQE∼ Fsj ,g′ (6.68)

sendo estes testes nao distorcidos (seccao 2.9). Nao se rejeita Hj,0, pelo teste de

nıvel q, se e so se, ψj,0 pertencer ao elipsoide de confianca de nıvel 1− q

(ψj − ψj)TW∗+(ψj − ψj) 6 sjF1−q,sj ,g′

SSQE

g′(6.69)

pelo que, os testes gozam de dualidade (seccao 2.9). Se se tiver Wj∗+ = W∗

j−1,

entao pode-se testar directamente a hipotese Hj,0 : δj = 0, j = 1, ...,m e o teste sera

estritamente nao distorcido (seccao 2.9).


Aplicando o teorema de Scheffe ao par (ψj, SSQE) vem

Pr

[⋂d

(∣∣∣dTψj − dT ψj

∣∣∣ 6√sjF1−q,sj ,g′dTW∗

jdSSQE

g′

)]= 1− q (6.70)

para todos os vectores d ∈ Rn, onde os intervalos de confianca simultaneos de nıvel

1 − q, para parametros ρj = dTψj, j = 1, ...,m, sao dados pelas desigualdades, ver

[16], ∣∣∣dTψj − dT ψj

∣∣∣ 6√sjF1−q,sj ,g′dTW∗

jdSSQE

g′. (6.71)

Quando ∣∣∣ρj,0 − dT ψj

∣∣∣ >√sjF1−q,sj ,g′(dTW∗

jd) SSQE

g′(6.72)

a desigualdade correspondente a d nao pode ser satisfeita para dTψj = ρj,0, podendo

entao concluı-se que ρj e significativamente diferente de ρj,0, ao nıvel de significancia

q.

Tomando-se para d, um vector com todas as componentes nulas a excepcao da

i-esima e da i′-esima, respectivamente iguais a 1 e -1, obtem-se

ρj = ψi − ψi′

podendo assim detectar-se os pares para os quais as componentes de ψj, j = 1, ...,m

diferem significativamente.

7. ANALISE DE TRANSICOES ENTRE CLASSES DE SECA

UTILIZANDO FAMILIAS ESTRUTURADAS DE MODELOS

LOG-LINEARES

7.1 Introducao

Neste capıtulo ira ser aplicada a teoria das f.e.m. a um caso, em que os modelos

elementares sao modelos log-lineares ajustados a tabelas de contingencia. Para o

modelo base, considera-se o modelo mais simples de um “one way” com 3 tratamen-

tos.

Este estudo surge na sequencia dos trabalhos anteriores, desenvolvidos no sentido

de investigar a influencia das alteracoes climaticas na ocorrencia de secas no Alentejo

[24] e [22]. Nos referidos artigos, os quais se anexam a esta dissertacao (Apendice

C), foi aplicada uma abordagem diferente, como se podera confirmar atraves da

respectiva leitura.

Na presente abordagem, ajustaram-se modelos log-lineares a tabelas de con-

tingencia representando contagens de numero de transicoes entre classes de seca

durante um determinado perıodo de tempo, cada uma calculada a partir de uma

serie temporal. Como resultado, pretende-se inferir a respeito de diferencas signifi-

cativas entre diferentes perıodos da mesma serie temporal.

102 7. Analise de Transicoes entre Classes de Seca utilizando Famılias Estruturadas de Modelos Log-lineares

7.2 Dados

Os dados a utilizar no presente trabalho sao os mesmos ja analisados por outro

metodo em [24] e correspondem a series temporais de valores mensais de ındices

de seca “Standardized Precipitation Index” (SPI). Os dados utilizados no referido

estudo, correspondem ao perıodo Setembro 1932 - Setembro 1999, para 6 estacoes

pluviometricas na regiao do Alentejo: Portalegre, Elvas, Evora, Beja, Barrancos e

Almodovar.

Com o objectivo de comparar probabilidades de transicao entre classes de secas,

as series temporais, todas com um total de 67 anos, foram divididas nos 3 perıodos

equivalentes seguintes:

• 1o perıodo: de 1932/33 a 1954/55 com 23 anos;

• 2o perıodo: de 1955/56 a 1976/77 com 22 anos;

• 3o perıodo: de 1977/78 a 1998/99 com 22 anos.

Esta divisao, em 3 perıodos equivalentes, foi uma primeira aproximacao, no sentido

de tentar detectar uma tendencia ou um ciclo no comportamento das secas. Para

Tab. 7.1: Classificacao das classes de seca segundo o SPI

codigo classe de seca calor SPI

1 Nao seca SPI ≥ 0

2 Quase normal -1 < SPI < 0

3 Moderada -1.5 < SPI ≤ -1

4 Severa/Extrema SPI ≤ -1.5

cada uma das referidas estacoes e para os 3 perıodos temporais, foram calculadas

7.3. Ajustamento de Modelos Log-lineares com Duas Dimensoes 103

as classes de seca mensais, baseadas nas 4 classes da Tabela 7.1. Seguidamente,

com vista a obtencao das frequencias observadas de tabelas de contingencia bi-

dimensionais, calcularam-se as transicoes mensais entre todas as classes de seca de

um mes para o mes seguinte.

7.3 Ajustamento de Modelos Log-lineares com Duas Dimensoes

Tab. 7.2: Tabelas de contingencia com duas dimensoes: frequencias observadas para Por-

talegre, Elvas, Evora, Beja, Barrancos e Almodovar

1o PERIODO 2o PERIODO 3o PERIODO

Classe seca mes t Classe seca mes t+1 Classe seca mes t+1 Classe seca mes t+1

Portalegre 1 2 3 4 1 2 3 4 1 2 3 4

1 99 16 0 0 134 11 1 0 113 12 2 0

2 16 78 8 3 12 83 5 1 13 65 8 0

3 0 9 8 6 1 6 9 0 0 7 22 7

4 0 2 7 24 0 0 1 0 0 2 5 7

Elvas 1 2 3 4 1 2 3 4 1 2 3 4

1 107 10 0 0 140 13 0 0 97 8 0 1

2 11 85 10 2 12 85 5 0 9 75 9 1

3 0 13 27 4 0 5 4 0 0 9 23 7

4 0 0 6 1 0 0 0 0 0 1 8 15

Evora 1 2 3 4 1 2 3 4 1 2 3 4

1 137 14 1 0 129 9 0 0 101 10 0 0

2 16 47 10 1 9 81 7 1 9 68 4 2

3 0 10 20 6 0 7 14 3 0 5 15 10

4 0 2 5 7 0 1 3 0 0 0 11 28

Beja 1 2 3 4 1 2 3 4 1 2 3 4

1 106 12 0 0 136 13 0 0 109 12 2 0

2 13 81 9 0 12 82 8 0 13 65 5 1

3 0 9 22 5 0 7 4 1 0 7 13 5

4 0 1 4 14 1 0 0 0 0 0 6 25

Barrancos 1 2 3 4 1 2 3 4 1 2 3 4

1 117 16 0 0 121 12 0 0 109 16 0 0

2 15 83 8 2 12 70 9 2 15 54 3 2

3 1 7 4 5 1 8 20 2 0 3 20 10

4 0 3 4 11 0 2 2 3 0 1 10 20

Almodovar 1 2 3 4 1 2 3 4 1 2 3 4

1 112 13 0 0 134 8 1 0 111 12 0 0

2 14 87 5 2 9 79 8 0 11 72 9 0

3 0 6 3 3 0 8 11 3 0 7 9 6

4 0 2 4 25 0 1 2 0 0 1 4 21


Obtiveram-se tabelas de contingencia com duas dimensoes (Tabela 7.2) para cada

estacao e, dentro de cada estacao, para o 1o perıodo, 2o perıodo e 3o perıodo. Nestas

tabelas, as categorias A e B correspondem, respectivamente, a classe de seca no mes

t e a classe de seca no mes t+ 1.

As frequencias observadas nhj, representam o numero de transicoes entre a classe

de seca h no mes t e a classe de seca j no mes t + 1, h, j = 1, 2, 3, 4. Diversos

tipos de modelos para tabelas de contingencia foram testados para se ajustarem as

frequencias observadas (seccao 2.11.1). Contudo, o modelo que melhor se ajustou,

em geral, a todas as diferentes tabelas foi o modelo de quasi-associacao

log mhj = λ+ λAh + λBj + β × h× j + δhI(h = j). (7.1)

Para avaliar o ajustamento dos modelos, utilizou-se o teste do qui-quadrado

referido no final da seccao 2.11.1. Neste teste, para que o modelo seja considerado

bem ajustado, o respectivo desvio residual (G2), dado pela expressao (2.50), nao

podera exceder o quantil duma variavel qui-quadrado, para a probabilidade 0.05

e N − s = 16 − 12 = 4 graus de liberdade (χ24:0.05 = 9.4877). No seguimento,

com o objectivo de reduzir o numero de parametros do modelo ajustado aplicou-

se o metodo de “backward elimination” (seccao 2.11.1) [21]. Contudo, todos os

parametros se revelaram significativos em todos os modelos e, portanto, os modelos

permaneceram completos.

Os valores obtidos para os estimadores dos parametros do modelo log-linear de

quasi-associacao e respectivos desvios residuais para as 6 estacoes, apresentam-se na

Tabela A.1 do Apendice A.

Note-se que, os parametros λA1 e λB1 nao aparecem, por serem considerados como

ordenada na origem, sendo portanto nulos.

7.4. Analise 105

7.4 Analise

Como resultado deste estudo, pretendeu-se saber se existem diferencas significativas

entre os 3 perıodos em que se dividiram as series temporais. Tendo em vista esse

objectivo, considerou-se para modelo base, o modelo mais simples - o one-way - onde

os 3 perıodos representam os 3 tratamentos de um unico factor. Para cada um dos

3 perıodos (tratamentos) de cada estacao, existe um modelo log-linear (7.1), o qual

representado na forma matricial vem

log mi = Xθi, i = 1, 2, 3 (7.2)

onde

mi =[mi

11 mi12 mi

13 mi14 mi

21 mi22 mi

23 mi24 mi

31 mi32 mi

33 mi34 mi

41 mi42 mi

43 mi44

]Te o vector das frequencias esperadas relativo ao perıodo i com 16 componentes, e

X =

1 0 0 0 0 0 0 1 1 0 0 0

1 0 0 0 1 0 0 2 0 0 0 0

1 0 0 0 0 1 0 3 0 0 0 0

1 0 0 0 0 0 1 4 0 0 0 0

1 1 0 0 0 0 0 2 0 0 0 0

1 1 0 0 1 0 0 4 0 1 0 0

1 1 0 0 0 1 0 6 0 0 0 0

1 1 0 0 0 0 1 8 0 0 0 0

1 0 1 0 0 0 0 3 0 0 0 0

1 0 1 0 1 0 0 6 0 0 0 0

1 0 1 0 0 1 0 9 0 0 1 0

1 0 1 0 0 0 1 12 0 0 0 0

1 0 0 1 0 0 0 4 0 0 0 0

1 0 0 1 1 0 0 8 0 0 0 0

1 0 0 1 0 1 0 12 0 0 0 0

1 0 0 1 0 0 1 16 0 0 0 1

e a matriz do modelo do tipo 16× 12 e

θi =[λ λA2 λA3 λA4 λB2 λB3 λB4 β δ1 δ2 δ3 δ4

]To vector dos parametros relativo ao perıodo i com 12 componentes.


Tab. 7.3: Frequencias observadas e esperadas - Almodovar1o PERIODO 2o PERIODO 3o PERIODO

Observado Esperado Observado Esperado Observado Esperado

m11 112 112.00 134 134.00 111 111.00

m12 13 12.60 8 8.49 12 11.49

m13 0 0.37 1 0.50 0 0.50

m14 0 0.03 0 0.02 0 0.01

m21 14 14.43 9 8.53 11 11.52

m22 87 87.00 79 79.00 72 72.00

m23 5 4.94 8 8.33 9 8.30

m24 2 1.64 1 1.14 1 1.18

m31 1 0.52 0 0.46 1 0.47

m32 6 6.14 8 7.70 7 7.72

m33 3 3.00 11 11.00 9 9.00

m34 3 3.33 3 2.84 6 5.81

m41 0 0.05 0 0.01 0 0.01

m42 2 2.26 1 0.81 1 0.79

m43 4 3.69 2 2.17 4 4.20

m44 25 25.00 1 1.00 21 21.00

Considere-se agora o caso da estacao de Almodovar. Nas outras estacoes proceder-

se-a de igual forma. Na tabela 7.3 colocam-se, lado a lado, as frequencias observadas

e esperadas para os 3 perıodos.

Dado que o numero de observacoes utilizado para calcular as tabelas de con-

tingencia e grande (n = 263), os vectores estimadores da maxima verosimilhanca θ

para o 1o, 2o e 3o perıodo (Tabela 7.3) sao assimptoticamente normais, centrados

com matrizes de covariancia

COV(θ1

)=

0.64 -0.30 0.46 0.73 -0.29 0.46 0.74 -0.15 -0.49 0.54 -0.22 0.27

-0.30 0.57 0.69 1.11 0.49 0.64 1.07 -0.13 0.43 -0.22 0.17 0.25

0.46 0.69 2.65 4.00 0.62 2.51 3.92 -0.60 0.14 0.63 -0.23 1.19

0.73 1.11 4.00 6.62 1.05 3.95 6.45 -0.96 0.23 0.95 -0.04 1.55

-0.29 0.49 0.62 1.05 0.55 0.71 1.15 -0.14 0.42 -0.22 0.16 0.25

0.46 0.64 2.51 3.95 0.71 2.79 4.17 -0.61 0.15 0.63 -0.25 1.23

0.74 1.07 3.92 6.45 1.15 4.17 6.89 -0.98 0.24 0.95 -0.04 1.55

-0.15 -0.13 -0.60 -0.96 -0.14 -0.61 -0.98 0.15 0.00 -0.17 0.03 -0.27

-0.49 0.43 0.14 0.23 0.42 0.15 0.24 0.00 0.50 -0.37 0.19 0.00

0.54 -0.22 0.63 0.95 -0.22 0.63 0.95 -0.17 -0.37 0.60 -0.25 0.32

-0.22 0.17 -0.23 -0.04 0.16 -0.25 -0.04 0.03 0.19 -0.25 0.73 -0.24

0.27 0.25 1.19 1.55 0.25 1.23 1.55 -0.27 0.00 0.32 -0.24 1.02

,

7.4. Analise 107

COV(θ2

)=

0.70 -0.39 0.31 0.41 -0.39 0.31 0.41 -0.11 -0.58 0.54 -0.30 0.28

-0.39 0.88 1.16 2.10 0.77 1.04 1.96 -0.24 0.64 -0.27 0.39 0.25

0.31 1.16 3.43 5.54 1.05 3.18 5.31 -0.77 0.47 0.58 0.06 1.24

0.41 2.10 5.54 9.79 1.98 5.29 9.21 -1.31 0.90 0.75 0.53 1.51

-0.39 0.77 1.05 1.98 0.88 1.14 2.06 -0.24 0.64 -0.28 0.39 0.25

0.31 1.04 3.18 5.29 1.14 3.35 5.42 -0.77 0.46 0.58 0.05 1.23

0.41 1.96 5.31 9.21 2.06 5.42 9.54 -1.30 0.89 0.76 0.52 1.58

-0.11 -0.24 -0.77 -1.31 -0.24 -0.77 -1.30 0.19 -0.08 -0.15 -0.03 -0.28

-0.58 0.64 0.47 0.90 0.64 0.46 0.89 -0.08 0.67 -0.39 0.34 0.00

0.54 -0.27 0.58 0.75 -0.28 0.58 0.76 -0.15 -0.39 0.63 -0.34 0.36

-0.30 0.39 0.06 0.53 0.39 0.05 0.52 -0.03 0.34 -0.34 0.59 -0.20

0.28 0.25 1.24 1.51 0.25 1.23 1.58 -0.28 0.00 0.36 -0.20 2.16

e

COV(θ3

)=

0.66 -0.33 0.41 0.55 -0.33 0.41 0.56 -0.13 -0.52 0.54 -0.28 0.35

-0.33 0.75 1.00 1.85 0.67 0.89 1.75 -0.21 0.54 -0.25 0.33 0.08

0.41 1.00 3.20 5.24 0.91 2.98 5.04 -0.73 0.32 0.61 -0.01 1.01

0.55 1.85 5.24 9.31 1.77 5.01 8.89 -1.25 0.69 0.81 0.42 1.19

-0.33 0.67 0.91 1.77 0.75 0.97 1.83 -0.21 0.54 -0.25 0.33 0.08

0.41 0.89 2.98 5.01 0.97 3.13 5.14 -0.72 0.31 0.61 -0.02 1.00

0.56 1.75 5.04 8.89 1.83 5.14 9.12 -1.24 0.68 0.82 0.41 1.24

-0.13 -0.21 -0.73 -1.25 -0.21 -0.72 -1.24 0.18 -0.05 -0.16 -0.01 -0.23

-0.52 0.54 0.32 0.69 0.54 0.31 0.68 -0.05 0.58 -0.38 0.30 -0.12

0.54 -0.25 0.61 0.81 -0.25 0.61 0.82 -0.16 -0.38 0.61 -0.31 0.41

-0.28 0.33 -0.01 0.42 0.33 -0.02 0.41 -0.01 0.30 -0.31 0.56 -0.30

0.35 0.08 1.01 1.19 0.08 1.00 1.24 -0.23 -0.12 0.41 -0.30 0.92

respectivamente, dadas pela expressao (5.28).

Considere-se, agora, o vector a de coeficientes de combinacoes lineares. Se

a = [ 1 0 0 0 0 0 0 1 1 0 0 0 ]T

ou seja, se a for igual a 1a linha da matriz X, obtem-se aT θi = λ+ β+ δ1 = logm11.

Se a for igual a 2a linha da matriz X obtem-se aT θi = λ + λB2 + 2β = logm12 e

assim sucessivamente, se obtem os logaritmos de todas as frequencias esperadas mhj,

h, j = 1, 2, 3, 4 para os 3 perıodos. Portanto, o vector a neste estudo, sera um vector

que ira coincidindo com os vectores linha da matriz X, os quais sao coeficientes de

combinacoes lineares dos parametros do modelo log-linear. Desta forma, obtem-se

as frequencias esperadas para cada uma das transicoes entre as 4 classes de seca,

e faz-se a comparacao dos 3 perıodos de cada estacao, atraves da comparacao da

mesma frequencia esperada relativa aos 3 perıodos.


Tomando por exemplo

a = [ 1 0 0 1 0 0 1 16 0 0 0 1 ]T

ou seja, igual a ultima linha de X, vira

y = [logm144 logm2

44 logm344]T = [3.222 − 0.003 3.045]T

o qual e assimptoticamente normal com matriz de covariancia

COV (y) =

V (logm1

44) 0 0

0 V (logm244) 0

0 0 V (logm344)

=

0.040 0 0

0 1.000 0

0 0 0.048

cujos elementos principais sao dados por

V (logmi44) = aT COV

(θi

)a

para i = 1, 2, 3.

Uma vez que, nesta aplicacao, o modelo base so tem um factor (perıodo) com 3

nıveis, nao ha necessidade de aplicar a teoria dos modelos de cruzamento-encaixe.

Basta, para efeito do modelo base, considerar uma matriz ortogonal estandardizada

do tipo 3× 3

P3 =

1√3

1√3

1√3

− 1√2

0 1√2

1√6− 2√

61√6

retirar-lhe a 1a linha e obter

A =

− 1√2

0 1√2

1√6− 2√

61√6

vindo o vector de efeitos fixos

η = Ay =[

-0.125 2.561]T

7.4. Analise 109

com matriz de covariancia

K = ACOV (y) AT =

0.044 0.002

0.002 0.681

.Somando os desvios residuais dos 3 modelos log-lineares, obtem-se SG2 = 4.753 e,

por fim, a estatıstica

F =g′′

g

ηTK−1η

SG2= 12.665

com distribuicao F central com 2 e 12 graus de liberdade, a qual se utiliza para

testar a hipotese nula

H0 : η = 0

ou seja − 1√2

0 1√2

1√6− 2√

61√6

µ1

µ2

µ3

=

0

0

ou seja −µ1 + µ3

µ1 − 2µ2 + µ3

=

0

0

o que e o mesmo que testar µ1 = µ2 = µ3.

Sendo o quantil de uma F , com 2 e 12 graus de liberdade, para um nıvel de 5%

igual a 3.885, conclui-se que existem diferencas significativas entre os 3 perıodos no

que diz respeito a transicao da classe de seca 4 para ela propria.

Com vista a descobrir entre que perıodos existem diferencas significativas, de

seguida ira aplicar-se o metodo das comparacoes multiplas de Scheffe. Interessa

comparar o 1o com o 2o perıodo, 1o com o 3o perıodo e 2o com o 3o perıodo. Para

tal considera-se no teorema de Scheffe (expressao (5.26))

• uma matriz A = I3;


• uma matriz B = I3;

• um vector d que devera ser igual a

1. d = [1 − 1 0]T para comparar o 1o com o 2o perıodo;

2. d = [1 0 − 1]T para comparar o 1o com o 3o perıodo;

3. d = [0 1 − 1]T para comparar o 2o com o 3o perıodo, e

• ρ0 = 0,

obtendo-se, para o primeiro membro de (5.26)

| 0− dT y |

e para o segundo membro√2F0.05,2,12(dTCOV(y)d)

SG2

12.

Na tabela 7.4 apresentam-se os valores obtidos para o 1o e 2o membro de cada

uma das comparacoes de perıodos, duas a duas. Estes resultados sao indicativos

da existencia, com 95% de confianca, de diferencas significativas entre o 1o e o 2o

perıodo e entre o 2o e o 3o na m44, ou seja nas transicoes da classe de seca 4 para

ela propria. O numero destas transicoes e indicativo da existencia e permanencia

de seca severa/extrema num determinado local, durante um determinado perıodo.

Sendo m44 no 1o, 2o e 3o perıodo igual a 25, 1, 21 respectivamente (Tabela 7.3),

conclui-se que, no que diz respeito a seca severa/extrema na estacao de Almodovar,

o 1o e o 3o perıodo sao semelhantes, sendo caracterizados pela existencia de mais

secas severas/extremas, comparativamente com o perıodo do meio, no qual quase

nao existem secas de classe 4.

Para todas as outras transicoes entre classes de seca, foram realizados o teste F

e as comparacoes multiplas de Scheffe, tendo-se verificado tambem a existencia de

7.5. Resultados e Conclusoes 111

Tab. 7.4: Resultado das comparacoes multiplas de Scheffe para Almodovar

perıodos 1o membro sinal 2o membro conclusao

1o e 2o 3.225 > 1.789 ha diferencas significativas

1o e 3o 0.177 < 0.519 nao ha diferencas significativas

2o e 3o 3.048 > 1.796 ha diferencas significativas

diferencas significativas entre o 1o e o 2o perıodo para a m33 (numero de transicoes

entre a classe de seca 3 e ela propria). Da interpretacao deste resultado pode-se

concluir que, em termos de secas moderadas na estacao de Almodovar, o 2o perıodo

e significativamente superior ao 1o.

7.5 Resultados e Conclusoes

Na tabela 7.5 apresenta-se os valores da estatıstica F obtidos para as 6 estacoes. A

negrito encontram-se os valores de F que superaram o quantil de uma distribuicao

F com 2 e 12 graus de liberdade e nıvel 0.05, ou seja, os casos em que existem

diferencas significativas entre os 3 perıodos.

Nas tabelas A.2 e A.3 do Apendice A, apresentam-se os resultados da aplicacao

do metodo das comparacoes multiplas de Scheffe aos casos onde se detectaram di-

ferencas significativas entre os 3 perıodos no teste de hipoteses anterior. A negrito,

na 1a coluna, estao os casos em que se considera haver, com 95% de confianca,

diferencas significativas entre dois dos perıodos. Nalguns casos, o 1o membro da

desigualdade (5.26) nao supera o 2o membro. No entanto, como o teste F consi-

dera que existem diferencas para esses casos e o metodo das comparacoes multiplas

de Scheffe se sabe ser muito conservador, considerou-se que havia, efectivamente,

diferencas significativas entre os correspondentes 2 perıodos.


Tab. 7.5: Valores da estatıstica F para Portalegre, Elvas, Evora, Beja, Barrancos e Al-

modovar

F0.05,2,12 = 3.885 Portalegre Elvas Evora Beja Barrancos Almodovar

m11 3.023 4.310 6.758 1.742 0.719 3.563

m12 0.647 0.537 1.485 0.003 1.301 1.072

m13 0.204 0.051 0.013 0.181 0.001 0.070

m14 0.000 0.198 0.176 0.901 0.002 0.166

m21 0.360 0.337 3.390 0.004 0.471 1.929

m22 1.192 0.399 10.375 0.901 6.749 1.787

m23 0.497 1.200 2.330 0.175 3.335 1.465

m24 1.220 0.244 0.216 0.345 0.306 0.219

m31 0.257 0.110 0.034 0.103 0.000 0.012

m32 0.322 1.427 3.086 0.327 3.405 0.314

m33 4.932 6.253 1.478 3.925 10.740 5.027

m34 2.233 2.131 5.383 1.335 7.591 1.712

m41 0.008 0.145 0.060 0.446 0.003 0.775

m42 1.162 0.160 0.246 0.031 0.531 1.966

m43 2.282 2.215 5.361 1.610 6.464 0.945

m44 9.127 6.329 23.352 4.529 11.557 12.665

O principal objectivo da realizacao deste estudo foi inferir sobre a evolucao das

secas de gravidade alta, na regiao do Alentejo, durante o perıodo de Set.1932 -

Set.1999. Trata-se de tentar perceber se, de facto, existe uma tendencia crescente

de agravamento da frequencia e severidade das secas, que podera ser atribuıda a

alteracoes climaticas. Ou se, em vez disso, podera existir um perıodo de retorno de

secas, o qual estaria relacionado com uma variabilidade natural de longo termo.

Os resultados obtidos, atraves da aplicacao das f.e.m., revelaram a existencia de

diferencas significativas, essencialmente ao nıvel das transicoes da classe de seca 4

para ela propria (m44) e da classe de seca 3 para ela propria (m33), e tambem nal-

guns casos, ao nıvel das transicoes entre a classe 4 e 3 e vice-versa (m43 e m34). Nas

transicoes de 1 para 1 e 2 para 2, tambem foram encontradas algumas diferencas

significativas. Contudo, para inferir a respeito de seca grave interessam principal-

mente as transicoes que envolvem a classe de seca 4 e tambem a 3, sendo esta ultima

menos importante.


Relativamente a m44, para Barrancos e Almodovar, as diferencas significativas

foram entre o 1o e o 2o e o 2o e o 3o perıodos, sendo o 1o e o 3o perıodos semelhan-

tes, ambos com maior frequencia de secas severas/extremas. Este comportamento

e mais consistente com a hipotese de existencia de uma periodicidade relacionada

com variabilidade natural de longo termo. Nas restantes localidades, este compor-

tamento nao foi tao evidente. Em Portalegre, o 1o perıodo difere significativamente

dos outros dois, no sentido em que teve mais secas severas/extremas. Em Elvas,

Evora e Beja, o 3o perıodo difere do 1o e 2o, por ter mais secas severas/extremas.

Duma maneira geral, o 2o perıodo e caracterizado por quase nao ter registado secas

severas/extremas.

No que diz respeito a secas moderadas (m33), em Evora nao ha diferencas signi-

ficativas. Nos outros locais, para Elvas e Beja, nao existem diferencas entre o 1o e o

3o perıodo, ambos com mais secas moderadas do que o 2o. Barrancos e Almodovar

caracterizam-se por terem diferencas entre o 1o perıodo e os outros dois, ambos com

mais secas moderadas.

No que diz respeito as transicoesm43 em34, as diferencas significativas sao sempre

entre o 2o e o 3o perıodo, tendo o 3o mais secas que o 2o.

Salvo algumas excepcoes, pode-se dizer que os resultados da presente aborda-

gem nao contradizem os resultados obtidos em Moreira et al.(2006), os quais foram

obtidos atraves duma outra abordagem, utilizando racios de frequencias espera-

das (odds) e correspondentes intervalos de confianca assimptoticos. Nesse estudo

foi revelado que, duma maneira geral, o 1o e o 3o perıodos eram semelhantes em

termos de probabilidades de transicao entre as classes de seca mais altas, tendo-

se registado, precisamente nesses perıodos, as maiores ocorrencias de secas seve-

ras/extremas. Consequentemente, concluia-se que, nos dados analisados, nao se en-

controu evidencia de existir uma tendencia de aumento da frequencia e severidade


de secas no Alentejo. A mesma conclusao pode ser tirada do presente estudo.

8. ANALISE DE DIFERENCAS SIGNIFICATIVAS AO NIVEL

DAS OCORRENCIAS DE SECA NO SUL DE PORTUGAL

8.1 Introducao

Neste capıtulo, aplica-se de novo a teoria das f.e.m., a um caso em que os modelos

elementares sao log-lineares, mas desta vez com um objectivo diferente.

Nesta segunda aplicacao a hidrologia, dividiu-se o Alentejo em 4 zonas de acordo

com 2 factores (latitude e longitude), cada factor com 2 nıveis (norte e sul, oeste e

leste) e para cada zona escolheram-se 10 estacoes que nao apresentavam diferencas

significativas entre elas, as quais serao consideradas como replicas num modelo de

cruzamento de 2 factores (Tabela 8.1). Teve-se como objectivo, encontrar diferencas

significativas, ao nıvel das transicoes entre classes de seca, entre o norte e o sul e o

oeste e o leste do Alentejo.

8.2 Dados

Os dados a utilizar no presente trabalho correspondem igualmente a series temporais

de valores mensais de indices de seca “Standardized Precipitation Index (SPI)”, para

o perıodo Setembro 1932 - Setembro 1999 (67 anos), para as 40 estacoes na regiao

do Alentejo referidas na Tabela 8.1.

Neste estudo, o objectivo e comparar probabilidades de transicao entre classes de

secas entre estacoes e nao entre perıodos da mesma estacao. Para tal, calcularam-se

116 8. Analise de Diferencas Significativas ao Nıvel das Ocorrencias de Seca no Sul de Portugal

para cada estacao, tabelas de contingencia do mesmo tipo das do estudo anterior,

com duas categorias correspondentes a classe de seca no mes t e a classe de seca no

mes t+ 1, contemplando o perıodo total de 67 anos (Tabelas B.1 e B.2 do Apendice

B).

A estas tabelas, ajustaram-se os modelos log-lineares de quasi-associacao (ex-

pressao (7.1)) e os valores obtidos, para os estimadores dos parametros do modelo

e respectivos desvios residuais para as 40 estacoes, apresentam-se na Tabela B.3 do

Apendice B. Note-se que, o numero de observacoes n utilizado para calcular todas

as tabelas de contingencia, foi de 803 contagens.

Tab. 8.1: Definicao das zonas 1, 2, 3 e 4Zona 1: Latitude > 38.13 e Longitude > 8.05 Zona 2: Latitude > 38.13 e Longitude ≤ 8.05

Longitude Latitude Longitude Latitude

Chouto 8.21 39.17 Nisa 7.38 39.31

Lamarosa 8.28 39.04 Castelo de Vide 7.27 39.25

Lavre 8.21 38.47 Portalegre 7.25 39.17

Canha 8.37 38.46 Arronches 7.18 39.07

Reguengos 8.53 38.42 Avis 7.54 39.04

Montemor-o-Novo 8.13 38.39 Pavia 8.01 38.54

Aguas de Moura 8.41 38.35 Arraiolos 8.00 38.43

B. Pego do Altar 8.24 38.25 Vila Vicosa 7.25 38.47

Comporta 8.47 38.23 Evora 7.54 38.34

Torrao 8.13 38.17 Viana do Alentejo 8.00 38.19

Zona 3: Latitude ≤ 38.13 e Longitude > 8.05 Zona 4: Latitude ≥ 38.13 e Longitude ≤ 8.05

Longitude Latitude Longitude Latitude

Grandola 8.33 38.11 Amareleja (D.G.R.N.) 7.14 38.13

Alvalade 8.24 37.57 Cuba 7.53 38.10

Cercal do Alentejo 8.40 37.48 Barrancos 6.58 38.08

Reliquias 8.29 37.42 Beja 7.52 38.01

Aldeia de Palheiros 8.15 37.36 Serpa 7.36 37.57

Saboia 8.30 37.29 Trindade 7.54 37.53

S. Marcos da Serra 8.23 37.22 Algodor 7.48 37.45

Aljezur 8.50 37.19 Martim Longo 7.77 37.44

Monchique 8.33 37.19 Almodovar 8.04 37.31

S. Bartol. Messines 8.18 37.15 S.B.Alportel 7.90 37.17

8.3. Analise da Homogeneidade 117

8.3 Analise da Homogeneidade

Tendo em vista o objectivo referido na introducao deste capıtulo, considerou-se para

modelo base o modelo “two-way” com interaccao (cruzamento de 2 factores), em que

o 1o factor e a latitude com os nıveis

1. norte: latitude > 38.13;

2. sul: latitude ≤ 38.13;

e o 2o factor e a longitude com os nıveis

1. oeste: longitude > 8.05;

2. leste: longitude ≤ 8.05.

Desta forma, foram definidas 4 zonas, cada uma contendo 10 estacoes, as quais irao

ser consideradas como replicas nos 4 tratamentos do modelo base (Tabela 8.1). Antes

de passar efectivamente a construcao do modelo “two-way”, em primeiro lugar foi

necessario saber se cada uma das 4 zonas definidas eram homogeneas, ou seja, se as

estacoes dentro se cada zona, nao apresentavam diferencas significativas entre elas

ao nıvel das transicoes entre classes de seca. Para tal, realizou-se um delineamento

“one-way” dentro de cada zona, considerando as 10 estacoes como tratamentos de

um unico factor estacao.

Para cada estacao dentro de cada zona (Tabela 8.1) existe ajustado um modelo

log-linear

log mi = Xθi,i = 1, ..., 10 (8.1)

com

mi =[mi

11 mi12 mi

13 mi14 mi

21 mi22 mi

23 mi24 mi

31 mi32 mi

33 mi34 mi

41 mi42 mi

43 mi44

]T,


X =

1 0 0 0 0 0 0 1 1 0 0 0

1 0 0 0 1 0 0 2 0 0 0 0

1 0 0 0 0 1 0 3 0 0 0 0

1 0 0 0 0 0 1 4 0 0 0 0

1 1 0 0 0 0 0 2 0 0 0 0

1 1 0 0 1 0 0 4 0 1 0 0

1 1 0 0 0 1 0 6 0 0 0 0

1 1 0 0 0 0 1 8 0 0 0 0

1 0 1 0 0 0 0 3 0 0 0 0

1 0 1 0 1 0 0 6 0 0 0 0

1 0 1 0 0 1 0 9 0 0 1 0

1 0 1 0 0 0 1 12 0 0 0 0

1 0 0 1 0 0 0 4 0 0 0 0

1 0 0 1 1 0 0 8 0 0 0 0

1 0 0 1 0 1 0 12 0 0 0 0

1 0 0 1 0 0 1 16 0 0 0 1

e

θi =[λ λA2 λA3 λA4 λB2 λB3 λB4 β δ1 δ2 δ3 δ4

]Ttal como no capıtulo anterior.

De seguida, considera-se um vector a de coeficientes de combinacoes lineares,

que vao coincidindo com os vectores linha da matriz X, os quais sao coeficientes de

combinacoes lineares dos parametros do modelo log-linear, de forma a obter cada

uma das frequencias esperadas, para as transicoes entre classes de seca.

Por exemplo, considerando que se esta a comparar a frequencia m44 em todas as

estacoes da zona 1, vem

y = [logm144 logm2

44 ... logm1044]T

com matriz de covariancia

COV (y) =

V (logm1

44) ... 0

... ... ...

0 ... V (logm1044)

em que

V (logmi44) = aT COV

(θi

)a

para i = 1, ..., 10.

8.4. Modelo Base “Two-Way” 119

Analogamente ao que se fez na aplicacao anterior, utilizando agora uma matriz

A, resultante de eliminar a 1a linha de uma matriz ortogonal estandardizada P10

do tipo 10× 10, testa-se a hipotese nula

H0 : η = Aµ = 0

o que e o mesmo que testar µ1 = ... = µ10.

Com K = ACOV (y) AT , a matriz de covariancia de η = Ay e SG2, a soma

dos desvios residuais dos 10 modelos log-lineares obtem-se a estatıstica

F =g′′

g

ηTK−1η

SG2

com distribuicao F central com g = 9 e g′′ = 40 graus de liberdade.

No que diz respeito a transicao da classe de seca 4 para a classe de seca 4, os

resultados obtidos sao os seguintes

F F0.05,9,40

Zona 1 0.664 < 2.124

Zona 2 1.019 < 2.124

Zona 3 0.594 < 2.124

Zona 4 0.954 < 2.124

donde se conclui que nao existem diferencas significativas entre as 10 estacoes de cada

zona. No que diz respeito as outras transicoes entre classes de seca, as conclusoes

sao similares.

8.4 Modelo Base “Two-Way”

Na construcao do modelo base “two-way” ira aplicar-se a teoria dos modelos de

cruzamento-encaixe apresentada na seccao 5.2. Assim sendo, considere-se que se


tem 2 grupos de factores com 1 factor cada, L = 2, u1 = 1 e u2 = 1. O factor do

1o grupo tem a1(1) = 2 nıveis, e o factor do 2o grupo tem a2(1) = 2 nıveis. Deste

modo, tem-se c = 4 tratamentos, cada um com r = 10 replicas, resultando que o

numero total de observacoes sera n = 40.

Nesta situacao, o vector h sera igual a cada um dos vectores seguintes:

• h0 = [0 0]T indicando a media geral;

• h1 = [1 0]T indicando o efeito principal do 1o factor (latitude);

• h2 = [0 1]T indicando o efeito principal do 2o factor (longitude);

• h3 = [1 1]T indicando a interaccao entre o 1o factor e o 2o factor,

vindo Γ = h0,h1,h2,h3. Entao, o modelo base na forma canonica, vem

y = A(h0)T η(h0) + A(h1)T η(h1) + A(h2)T η(h2) + A(h3)T η(h3) + e

com

A(h0) = A1,1(0)⊗A2,1(0)⊗ 110T

√10

=12T

√2⊗ 12T

√2⊗ 110T

√10

=140T

√40,

A(h1) = A1,1(1)⊗A2,1(0)⊗ 110T

√10

= T2 ⊗12T

√2⊗ 110T

√10

onde T2 = [ 1√2− 1√

2] e obtida retirando a 1a linha a matriz ortogonal estandardizada

P2 =

1√2

1√2

1√2− 1√

2

,vindo

A(h1) =1√40

[1 ...1︸︷︷︸10

1 ...1︸︷︷︸10

−1 ...− 1︸︷︷︸10

−1 ...− 1︸︷︷︸10

],


A(h2) = A1,1(0)⊗A2,1(1)⊗110T

√10

=12T

√2⊗T2⊗

110T

√10

=1√40

[1 ...1︸︷︷︸10

−1 ...− 1︸︷︷︸10

1 ...1︸︷︷︸10

−1 ...− 1︸︷︷︸10

],

e

A(h3) = A1,1(1)⊗A2,1(1)⊗110T

√10

= T2⊗T2⊗110T

√10

=1√40

[1 ...1︸︷︷︸10

−1 ...− 1︸︷︷︸10

−1 ...− 1︸︷︷︸10

1 ...1︸︷︷︸10

].

Seja yh,j,k a k-esima observacao do nıvel h do 1o factor e nıvel j do 2o factor,

com k = 1, ..., 10 e h, j = 1, 2. Ordenem-se, agora, estas observacoes do modelo base

pelos ındices i, da seguinte forma:

i → (h, j, k)

1 → (1,1,1)

... → ... zona 1

10 → (1,1,10)

11 → (1,2,1)

... → ... zona 2

20 → (1,2,10)

21 → (2,1,1)

... → ... zona 3

30 → (2,1,10)

31 → (2,2,1)

... → ... zona 4

40 → (2,2,10)

8.5 Resultados e Conclusoes

Havendo para cada i = 1, ..., 40, um modelo log-linear ajustado, entao para se obter

o vector y considere-se

a = [ 1 0 0 1 0 0 1 16 0 0 0 1 ]T

obtendo-se

yi = aT θi = logmi44, i = 1, ..., 40

logo

y = [logm144 ... logm40

44]T .


As componentes de y apresentam-se na Tabela B.4 do Apendice B, assim como os

valores principais da matriz COV(y) = D[V (y1), ..., V (y40)].

Efectuando os calculos, os vectores estimadores dos efeitos fixos reduzem-se aos

valores

η(h0) = A(h0)y = 23.757

η(h1) = A(h1)y = −0.042

η(h2) = A(h2)y = 0.639

η(h3) = A(h3)y = 0.069

com variancia

K = K(h0) = K(h1) = K(h2) = K(h3) = A(h0)COV(y)A(h0)T = 0.024.

vindo

η(h0)TK−1η(h0) = 23802.951

η(h1)TK−1η(h1) = 0.076

η(h2)TK−1η(h2) = 17.234

η(h3)TK−1η(h3) = 0.199

g = g(h0) = g(h1) = g(h2) = g(h3) = 1.

A soma dos desvios residuais dos 40 modelos log-lineares totaliza SG2 = 174.012,

com g′′ = (16− 12)× 4× 10 = 160, obtendo-se, for fim, as estatısticas F para cada

vector h

F(h0) =g′′

g

η(h0)TK−1η(h0)

SG2= 21886.318

F(h1) =g′′

g

η(h2)TK−1η(h1)

SG2= 0.070

F(h2) =g′′

g

η(h1)TK−1η(h2)

SG2= 15.846

F(h3) =g′′

g

η(h3)TK−1η(h3)

SG2= 0.183


todas com distribuicao F central com 1 e 160 graus de liberdade. As hipoteses que

interessam testar sao as seguintes:

• H0(h1) : η(h1) = 0 relativa ao efeito da latitude;

• H0(h2) : η(h2) = 0 relativa ao efeito da longitude;

• H0(h3) : η(h3) = 0 relativa a interaccao latitude-longitude,

o que se traduz em testar

• µ1 + ...+ µ10 + µ11 + ...+ µ20 = µ21 + ...+ µ30 + µ31 + ...+ µ40;

• µ1 + ...+ µ10 + µ21 + ...+ µ30 = µ11 + ...+ µ20 + µ31 + ...+ µ40;

• µ1 + ...+ µ10 + µ31 + ...+ µ40 = µ11 + ...+ µ20 + µ21 + ...+ µ30,

respectivamente, ou seja

• zona 1 + zona 2 = zona 3 + zona 4;

• zona 1 + zona 3 = zona 2 + zona 4;

• zona 1 + zona 4 = zona 2 + zona 3.

Sendo o quantil de uma F , com 1 e 160 graus de liberdade, para um nıvel de

5%, igual a 3.9, o unico caso em que F supera o valor 3.9, corresponde a hipotese

H0(h2) : η(h2) = 0, relativa ao efeito da longitude. Daı, se conclui que existem

diferencas significativas entre os 2 nıveis do factor longitude, no que diz respeito ao

numero de transicoes entre a classe de seca 4 para ela propria, ou seja, na persistencia

da classe de seca severa/extrema.

Os valores da estatıstica F(h) com h = h1,h2,h3 para todas as transicoes entre

classes de seca, apresentam-se na Tabela 8.2. A negrito, encontram-se os valores


Tab. 8.2: Valores das estatısticas F(h) para as diferentes frequencias esperadas do numero

de transicoes entre classes de seca

F0.05;1;160 = 3.9 m11 m12 m13 m14

Longitude 2.506 2.074 0.940 1.910

Latitude 0.047 0.015 0.352 0.155

Interaccao 1.016 3.173 0.036 0.749

m21 m22 m23 m24

Longitude 2.249 11.199 1.294 0.758

Latitude 0.005 1.416 0.526 1.964

Interaccao 3.303 0.094 0.211 1.220

m31 m32 m33 m34

Longitude 0.923 1.435 12.590 1.249

Latitude 0.419 0.741 2.932 0.046

Interaccao 0.082 0.027 0.257 0.404

m41 m42 m43 m44

Longitude 1.640 0.377 0.547 15.846

Latitude 0.125 1.725 0.037 0.070

Interaccao 0.984 1.906 0.135 0.183

em que F(h) supera o quantil F0.05;1;160 = 3.9. Os resultados obtidos na Tabela

8.2 apontam apenas para a existencia de diferencas significativas ao nıvel do factor

longitude, ou seja, entre o oeste e o leste no que diz respeito as transicoes m22, m33 e

m44. No que respeita ao factor latitude, nao foram detectadas diferencas significati-

vas entre o norte e o sul, nem interaccoes entre ambos os factores. Conjugando estes

resultados com os valores das frequencias observadas para cada uma das transicoes

entre classes de seca (Tabelas B.1 e B.2 - Apendice B), pode-se concluir com 95%

de confianca que:

1. A persistencia da classe de seca 4 (severa/extrema) e significativamente maior

no oeste que no leste do Alentejo;

2. A persistencia da classe de seca 3 (moderada) e significativamente maior no

leste que no oeste do Alentejo;

3. A persistencia da classe de seca 2 (ligeira) e significativamente maior no leste


que no oeste do Alentejo.

9. MODELACAO REGRESSIONAL DA REMOCAO

ELECTRODIALITICA DE METAIS PESADOS DE RESIDUOS

DE MADEIRA

9.1 Introducao

No estudo apresentado neste capıtulo foi aplicada a teoria das f.e.m. desta vez ao

caso em que os modelos elementares sao regressoes polinomiais do 3o e do 4o grau

cujas variaveis controladas sao o tempo, em dias, e as suas potencias. Para o modelo

base considerou-se mais uma vez o modelo “one way”, visto que os dados disponıveis

nao permitiram a realizacao de uma analise com dois ou mais factores.

Este estudo surgiu na sequencia de um trabalho anterior que teve como objectivo

saber qual dos tratamentos aplicados era mais eficiente na remocao conjunta de

diferentes metais pesados de resıduos de madeira [25]. Como resultado do presente

estudo foi produzido o artigo Moreira et al.(2005b) o qual e incluıdo no Apendice C

desta dissertacao.

9.2 Experiencias e Dados

Os dados utilizados resultaram da realizacao de experiencias laboratoriais de remocao

electrodialıtica dos metais pesados cobre, cromio e arsenio (adiante designados pe-

los seus sımbolos quımicos Cu, Cr e As respectivamente) de resıduos de madeira

128 9. Modelacao Regressional da Remocao Electrodialıtica de Metais Pesados de Resıduos de Madeira

tratada com CCA - Chomated Copper Arsenate, um preservante de madeiras muito

utilizado. O metodo utilizado nas experiencias combina o movimento electrocinetico

de ioes com o princıpio da electrodialise.

O metodo consistiu em aplicar varios nıveis de corrente electrica durante um

determinado perıodo, a uma matriz constituıda por estilha, proveniente de diversos

postes de madeira tratada, a qual foi impregnada numa solucao de um agente adju-

vante cujo proposito foi o de facilitar a mobilidade do contaminantes quando sujeitos

ao campo electrico. Todas as experiencias foram realizadas numa celula laboratorial

electrodialıtica desenvolvida especialmente para a aplicacao do metodo referido. A

celula electrodialıtica e divida em tres compartimentos: um compartimento central

onde a estilha e colocada e dois compartimentos dos electrodos (catodo ou electrodo

negativo + catolito) e (anodo ou electrodo positivo + anolito) [25]. Os comparti-

mentos dos electrodos e o compartimento central estao separados por membranas

de troca ionica, as quais apenas permitem a passagem de ioes no sentido do com-

partimento central para os compartimentos dos electrodos.

Foram realizadas 12 experiencias correspondentes a diferentes tratamentos que

decorreram durante 14 dias e uma mais que durou 28 dias (Tabela 9.1). Seis solucoes

de agente adjuvante foram utilizadas: agua, 2.5% acido oxalico, mistura de 2.5%

acido oxalico com 5% acido formico, 5% acido formico, 2.5% EDTA e 1.25% NaCl.

A corrente inicial aplicada a celula electrodialıtica tambem variou: 0, 20, 40, 60, 80

e 120 mA.

Antes do inıcio das experiencias, foi medida a concentracao de Cu, Cr e As em

diversas amostras de estilha e calculada a media e desvio padrao das concentracoes

para cada um dos tres metais pesados. Durante cada experiencia, amostras das

solucoes nos dois electrolitos (catolito e anolito) foram periodicamente recolhidas e

analisadas para determinacao das concentracoes de Cu, Cr e As. No fim de cada

9.2. Experiencias e Dados 129

Tab. 9.1: Tratamentos (condicoes experimentais)Tratamentos Agente Adjuvante Corrente Inicial (mA) Duracao (dias)

1 agua 0 14

2 agua 11.6 14

3 2.5% acido oxalico 0 14





8 5% acido formico:2.5% acido oxalico 0 14

9 5% acido formico:2.5% acido oxalico 40 14

10 5% acido formico 40 14

11 2.5% EDTA 40 14

12 1.25% NaCl 40 14


experiencia foi medida a quantidade de cada dos metais depositados nas membranas

de troca ionica e no electrodo negativo ou catodo. Por fim foi medida tambem a

concentracao de Cu, Cr e As na estilha, apos o final das experiencias. Deste modo,

tres diferentes tipos de dados experimentais estavam disponıveis para analise:

1. Concentracao de Cu, Cr e As no catolito e anolito ao longo do tempo de

duracao das experiencias (mg/L);

2. Eficiencia de remocao (%) calculada com base na concentracao inicial e final

de Cu, Cr e As na estilha;

3. Quantidades de Cu, Cr e As depositadas no final das experiencias nas mem-

branas de troca ionica e no catodo (mg).

Numa primeira fase do estudo, efectuou-se uma analise preliminar centrada nas

eficiencias de remocao conjuntas dos tres metais pesados, a qual pode ser consul-

tada na seccao 3.1 do artigo Moreira et al.(2005b) apresentado no Apendice C. Esta

primeira analise levou a seleccao dum grupo com os tratamentos 4, 5, 7 e 9, conside-

rados os mais eficientes, para passarem a fase seguinte de analise das concentracoes


de Cu, Cr e As no catolito e anolito ao longo do tempo das experiencias. No final

da segunda fase, o melhor tratamento resultante foi comparado com o tratamento

13, o qual tem o dobro da duracao (28 dias) e portanto, em termos de eficiencia de

remocao no final nao e comparavel com as outras experiencias. Os dados que inte-

ressam para a aplicacao dos modelos regressionais multiplos sao os da concentracao

de Cu, Cr e As no catolito e anolito (soma dos dois) ao longo do tempo e e sobre

eles que neste capıtulo sera centrada a atencao.

9.3 Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr

e As nos Electrolitos

Dispondo-se de dados de concentracao dos tres metais ao longo do tempo, estes

podem ser descritos por um modelo regressional, em que a variavel resposta y, re-

presentando as concentracoes dos metais, depende de uma unica variavel controlada

t que representa o tempo em dias. O modelo regressional descreve o processo de

remocao dos tres metais para os electrolitos, ao longo dos 14 dias das experiencias.

Contudo, para alguns dos tratamentos, o numero de observacoes nao corresponde a

14, ou porque foram efectuadas mais que uma observacao por dia (tratamento 9) ou

porque no caso dos tratamentos 5 e 7 a recolha da ultima observacao correu mal.

Para efeitos do tratamento 13, considerou-se apenas as 14 primeiras observacoes

correspondentes aos primeiros 14 dias de experiencia deixando os 14 restantes fora

da modelacao. Portanto, o numero de observacoes difere de tratamento para trata-

mento tendo-se n4 = n13 = 14, n5 = n7 = 13 e n9 = 20. Esta-se pois perante um

caso nao equilibrado, para o qual as matrizes X dos modelos regressionais diferem

de tratamento para tratamento.

No seguimento da primeira analise efectuada e com o objectivo de detectar qual

9.3. Modelacao da Evolucao Temporal das Concentracoes de Cu, Cr e As nos Electrolitos 131

dos tratamentos revela os melhores resultados na remocao dos tres metais, esta

fase do estudo foi enquadrada no caso nao equilibrado das famılias estruturadas de

modelos de regressao multipla (seccao 6.4), com o proposito de refinar a comparacao

entre os melhores tratamentos.

Apos uma analise inicial, chegou-se a conclusao que o modelo regressional que

melhor descrevia a relacao entre as concentracoes dos metais e o tempo era um

modelo polinomial do 3o ou 4o grau. Assim, utilizando o metodo dos mınimos

quadrados e testes de significancia para os coeficientes da regressao (seccao 2.10),

ajustou-se para o Cu e para o Cr, um polinomio do 4o grau do tipo

yl = αl,1t+ αl,2t2 + αl,3t

3 + αl,4t4, l = 4, 5, 7, 9, 13 (9.1)

onde t representa o tempo em dias, l o numero do tratamento e αl,j, j = 1, 2, 3, 4

os coeficientes da regressao, enquanto que para o As ajustou-se um polinomio de 3o

grau

yl = αl,1t+ αl,2t2 + αl,3t

3, l = 4, 5, 7, 9, 13. (9.2)

A inexistencia de termo independente em todos os polinomios ajustados deve-se ao

facto de no momento t = 0 (inıcio das experiencias), a quantidade de metais pesados

removida ser nula.

Representando o modelo polinomial para o Cu e o Cr na forma matricial, vem

yl = Xlαl + εl, l = 4, 5, 7, 9, 13

onde o vector dos coeficientes vem

αl = [αl,1 αl,2 αl,3 αl,4]T ,


a matriz do modelo e

Xl =

1 1 1 1

2 4 8 16

3 9 27 81

4 16 64 256

5 25 125 625

6 36 216 1296

7 49 343 2401

8 64 512 4096

9 81 729 6561

10 100 1000 10000

11 121 1331 14641

12 144 1728 20736

13 169 2197 28561

14 196 2744 38416

para os tratamentos 4 e 13. Para os tratamentos 5 e 7 a ultima linha de Xl cor-

respondente a observacao 14 nao e considerada, e para o tratamento 9 a matriz do

modelo e

X9 =

0.5 0.3 0.1 0.1

0.6 0.3 0.2 0.1

0.7 0.5 0.3 0.2

0.8 0.6 0.5 0.3

1.5 2.2 3.2 4.7

2.5 6.1 15.0 36.9

3.4 11.5 38.8 131.4

3.7 13.5 49.7 182.8

4.4 19.5 86.2 380.6

4.7 22.3 105.1 495.8

5.4 29.0 156.6 843.8

6.4 40.9 261.1 1669.0

7.4 54.7 404.2 2988.5

8.0 64.0 512.0 4096.0

9.4 88.7 835.0 7863.0

10.4 108.7 1133.7 11820.9

11.4 130.4 1488.9 17001.0

12.4 154.2 1914.3 23769.5

13.4 180.2 2419.6 32483.1

14.4 208.1 3002.9 43322.6

.

Ora, como foi referido na seccao 2.10, nas regressoes polinomiais pode existir

dependencia linear entre as linhas da matriz Xl do modelo. No entanto, para os

modelos em questao, estas matrizes nao apresentam dependencia linear entre a suas

linhas, estando-se portanto, a partida, numa situacao de nao multicolinariedade.

Por outro lado, assume-se a homocedasticidade dos modelos, dado que as matrizes

de covariancia de εl, l = 4, 5, 7, 9, 13 nao sao conhecidas.


Os αl,j estimados com j = 1, 2, 3, 4, l = 4, 5, 7, 9, 13, os valores de R2 e as somas

de quadrados dos erros para o Cu, Cr e As apresentam-se na tabela 9.2.

Tab. 9.2: Estimadores dos coeficientes das regressoes para o Cobre, Cromio e ArsenioTratamento

4 5 7 9 13

Cobre α4 -0.001 0.000 -0.001 0.001 0.000

α3 0.036 0.013 0.030 -0.023 -0.003

α2 -0.393 -0.167 -0.296 0.240 0.005

α1 2.079 1.326 1.230 0.090 0.341

R2 0.760 0.960 0.900 0.970 0.990

SQE 2.843 0.779 0.396 3.860 0.018

Cromio α4 -0.001 -0.002 -0.002 0.000 -0.002

α3 0.041 0.057 0.061 0.021 0.088

α2 -0.596 -0.698 -0.668 -0.371 -1.232

α1 3.364 3.514 2.968 2.089 6.916

R2 0.970 0.990 0.810 0.860 0.970

SQE 0.294 0.089 0.574 5.744 1.460

Arsenio α3 0.033 0.016 0.045 0.007 0.014

α2 -1.047 -0.619 -1.111 -0.478 -1.187

α1 10.950 8.009 8.702 7.518 12.233

R2 0.910 0.940 0.900 0.900 0.740

SQE 70.619 62.812 16.166 257.269 252.066

9.3.1 Analise Regressional

Uma vez obtido o modelo regressional definitivo para os tratamentos 4, 5, 7, 9 e

13 de cada metal, o passo seguinte foi o da aplicacao do caso nao equilibrado dos

modelos regressionais multiplos descrito na seccao 6.4. Como ja foi anteriormente

referido para o modelo base considerou-se um “one-way” com 4 tratamentos, e apos

a seleccao do melhor tratamento desse grupo, este foi comparado com o tratamento

13.

O proposito desta analise foi o de comparar coeficientes da mesma variavel con-

trolada, ou seja da mesma potencia de t entre tratamentos. Para tal tomou-se

1. aT = [1 0 0 0] para comparar o coeficiente de t para os 4 tratamentos;

2. aT = [0 1 0 0] para comparar o coeficiente de t2 para os 4 tratamentos;


3. aT = [0 0 1 0] para comparar o coeficiente de t3 para os 4 tratamentos;

4. aT = [0 0 0 1] para comparar o coeficiente de t4 para os 4 tratamentos.

Considerando-se agora

λ = [αT4 αT5 αT7 αT9 ]T

com matriz de covariancia igual ao produto de σ2 pela matriz diagonal por blocos

D((XT

4 X4)−1, (XT5 X5)−1, (XT

7 X7)−1, (XT9 X9)−1)

)=

0.405 -0.148 0.016 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

-0.148 0.058 -0.007 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.016 -0.007 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

-0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.505 -0.198 0.024 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 -0.198 0.083 -0.010 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.024 -0.010 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.505 -0.198 0.024 -0.001 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.198 0.083 -0.010 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.024 -0.010 0.001 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.002 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

e por outro lado considerando-se para o modelo base uma matriz

A =

[12 − 1

212 − 1

212

12 − 1

2 − 12

− 12

12

12 − 1

2

]

resultante de eliminar a 1a linha de uma matriz ortogonal estandardizada P4, vem

ψ = A[I4 ⊗ aT ]λ com matriz de covariancia σ2W∗ onde

W∗ = A[I4 ⊗ aT ]D((XT

4 X4)−1, (XT5 X5)−1, (XT

7 X7)−1, (XT9 X9)−1)

)[I4 ⊗ aT ]TAT .

Para o exemplo do Cu, obtem-se

1. ψ =[

0,947 1,042 0,194

]e W∗ =

[0,354 -0,151 -0,101

-0,151 0,354 -0,101

-0,101 -0,101 0,354

]se aT = [1 0 0 0]


2. ψ =[

-0,381 -0,252 -0,155

]e W∗ =

[0,056 -0,027 -0,014

-0,027 0,056 -0,014

-0,014 -0,014 0,056

]se aT = [0 1 0 0]

3. ψ =[

0,038 0,021 0,015

]e W∗ =

[0,00088 -0,00044 -0,00018

-0,00044 0,00088 -0,00018

-0,00018 -0,00018 0,00088

]se aT = [0 0 1 0]

4. ψ =[

-0,0012 -0,0006 -0,0004

]e W∗ =

[0,0000013 -0,0000007 -0,0000002

-0,0000007 0,0000013 -0,0000002

-0,0000002 -0,0000002 0,0000013

]se aT =

[0 0 0 1]

para testar as hipoteses relativas ao Cu

H0 : ψ = 0

as quais se traduzem em testar

1. H10 : α4,1 = α5,1 = α7,1 = α9,1

2. H20 : α4,2 = α5,2 = α7,2 = α9,2

3. H30 : α4,3 = α5,3 = α7,3 = α9,3

4. H40 : α4,4 = α5,4 = α7,4 = α9,4.

Agora, somem-se as SQE para as 4 regressoes obtendo-se SSQE = 2.843 + 0.779 +

0.396 + 3.860 = 7.877 com g′ = 10 + 9 + 9 + 16 = 44 graus de liberdade e calcule-se

SQe = ψTW∗−1ψ.

Os resultados obtidos para o Cu, para as 4 hipoteses testadas, apresentam-se na

tabela 9.3 e indicam a rejeicao das 4 hipoteses, para um nıvel de significancia de

5%, ou seja, indicam a existencia de diferencas significativas para os coeficientes de

t, t2, t3 e t4 entre os tratamentos 4, 5, 7 e 9.


Tab. 9.3: Resultados dos testes F para o Cu

SQt g.l. F F0,05;3;44

H10 15.342 3 29.213 2.816

H20 11.568 3 22.027

H30 6.300 3 11.997

H40 3.791 3 7.219

SSQE 7.877 44

De seguida, com vista a detectar entre que pares de tratamentos existiam as

diferencas significativas, aplicou-se o metodo das comparacoes multiplas de Scheffe.

Assim sendo, tomou-se ρ0 = 0 e calcularam-se ambos os membros da desigualdade

(6.72), verificando-se se esta era satisfeita para todas as combinacoes possıveis de

pares de tratamentos. Deste modo, fazendo aT = [1 0 0 0], [0 1 0 0], [0 0 1 0] e

[0 0 0 1] para testar os coeficientes de t, t2, t3 e t4 respectivamente, verificou-se a

desigualdade para:

1. ρ = α4,j − α5,j fazendo dT = [1 − 1 0 0]

2. ρ = α4,j − α7,j fazendo dT = [1 0 − 1 0]

3. ρ = α4,j − α9,j fazendo dT = [1 0 0 − 1]

4. ρ = α5,j − α7,j fazendo dT = [0 1 − 1 0]

5. ρ = α5,j − α9,j fazendo dT = [0 1 0 − 1]

6. ρ = α7,j − α9,j fazendo dT = [0 0 1 − 1]

com j = 1, 2, 3, 4. Os resultados do metodo de Scheffe, ao nıvel de significancia

de 5%, para todos os casos anteriores sao apresentados na Tabela 9.4 e permitiram


Tab. 9.4: Resultados do metodo de Scheffe para o CuTratamentos 1omembro 2omembro Resultado

Coeficiente de t

1 4 e 5 0.75310 1.28177 nao ha diferencas significativas


3 4 e 9 1.98894 0.85568 ha diferencas significativas




Coeficiente de t2







Coeficiente de t3







Coeficiente de t4







saber entre que tratamentos existiam diferencas significativas para os coeficientes

da mesma potencia de t, t2, t3 e t4. Na referida Tabela apresentam-se os valores

assumidos pelo 1o membro e 2o membro da desigualdade (6.72) para cada uma das

6 comparacoes de tratamentos 2 a 2.

Os resultados do metodo de Scheffe para o Cu, permitiram duma maneira geral,

detectar a existencia de diferencas significativas entre o tratamento 9 e os restantes.

Essas diferencas diminuem a medida que se compara coeficientes de uma potencia

de t superior.

Para o Cr, hipoteses semelhantes as do Cu foram testadas e os resultados dos

testes F , para um nıvel de 5%, sao apresentados na tabela 9.5, indicando a existencia


Tab. 9.5: Resultados dos testes F para o Cr

SQt g.l. F F0,05;3;44

H10 3.811 3 8.341 2.816

H20 1.328 3 2.906

H30 1.241 3 2.716

H40 1.228 3 2.688

SSQE 6.701 44

de diferencas significativas apenas entre os coeficientes de t e t2. Em termos de

comparacoes multiplas de Scheffe basta comparar 2 a 2 os coeficientes de t e t2. Os

resultados da aplicacao do metodo de Scheffe para o Cr sao apresentados na Tabela

9.6 e indicam a existencia de diferencas significativas nos coeficientes de t entre o

tratamento 9 e o 4 e o 9 e o 5.

Tab. 9.6: Resultados do metodo de Scheffe para o CrTratamentos 1omembro 2omembro Resultado

Coeficiente de t







Coeficiente de t2







Para o As, dado que se ajustou um polinomio do 3o grau, so se tem coeficientes

de t, t2 e t3, vindo αl = [αl,1 αl,2 αl,3], l = 4, 5, 7, 9, 13 logo as matrizes Xl do

modelo polinomial so incluem as 3 primeiras colunas, vindo entao λ com matriz de


covariancia igual ao produto de σ2 pela matriz

D((XT

4 X4)−1, (XT5 X5)−1, (XT

7 X7)−1, (XT9 X9)−1)

)=

0.09999 -0.02078 0.00101 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

-0.02078 0.00460 -0.00023 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00101 -0.00023 0.00001 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.12421 -0.02774 0.00145 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 -0.02774 0.00661 -0.00036 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00145 -0.00036 0.00002 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.12421 -0.02774 0.00145 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.02774 0.00661 -0.00036 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00145 -0.00036 0.00002 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.06530 -0.01373 0.00066

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.01373 0.00312 -0.00016

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00066 -0.00016 0.00001

.

Considerando para o modelo base a mesma matriz A =

[12 − 1

212 − 1

212

12 − 1

2 − 12

− 12

12

12 − 1

2

]obtem-

se

1. ψ =[

2,063 1,370 -0,879

]e W∗ =

[0,1034 -0,0208 -0,0087

-0,0208 0,1034 -0,0087

-0,0087 -0,0087 0,1034

]se aT = [1 0 0]

2. ψ =[

-0,531 -0,038 -0,102

]e W∗ =

[0,0052 -0,0014 -0,0004

-0,0014 0,0052 -0,0004

-0,0004 -0,0004 0,0052

]se aT = [0 1 0]

3. ψ =[

0,027 -0,001 0,011

]e W∗ =

[0,000015 -0,000005 -0,000001

-0,000005 0,000015 -0,000001

-0,000001 -0,000001 0,000015

]se aT = [0 0 1]

e testam-se as hipoteses relativas ao As

1. H10 : α4,1 = α5,1 = α7,1 = α9,1

2. H20 : α4,2 = α5,2 = α7,2 = α9,2

3. H30 : α4,3 = α5,3 = α7,3 = α9,3.

Os resultados dos testes F , para um nıvel de 5%, apresentam-se na tabela 9.7 e

indicam a existencia de diferencas significativas apenas entre os coeficientes de t. Os

resultados da aplicacao do metodo de Scheffe para o As (Tabela 9.8) nao indicam a


Tab. 9.7: Resultados dos testes F para o As

SQt g.l. F F0,05;3;48

H10 75.855 3 2.983 2.798

H20 65.075 3 2.559

H30 63.357 3 2.492

SSQE 257.269 48

Tab. 9.8: Resultados do metodo de Scheffe para o AsTratamentos 1omembro 2omembro Resultado

Coeficiente de t







existencia de diferencas significativas entre os coeficientes de t. Esta situacao deve-se

ao facto do metodo de Scheffe ser muito conservador, isto e, o metodo de Scheffe tem

mais tendencia para nao rejeitar a hipotese nula do que outros testes. Decidiu-se,

entao, aplicar um metodo de comparacoes multiplas menos conservador, como o de

Bonferroni [20]. Os resultados da aplicacao deste metodo apresentam-se na Tabela

9.9 e indicam a existencia de diferencas significativas apenas entre os tratamentos 4

e 9.

Tab. 9.9: Resultados do metodo de Boferroni para o AsTratamentos 1omembro 2omembro Resultado

Coeficiente de t







9.4. Interpretacao dos Resultados e Conclusoes 141

9.4 Interpretacao dos Resultados e Conclusoes

Em primeiro lugar, note-se que o coeficiente de grau mais baixo α1 tem uma im-

portancia especial, uma vez que e relevante na determinacao da velocidade inicial

de mobilizacao dos metais para os electrolitos. Atraves desta analise, pretendeu-se

saber qual o tratamento mais eficiente a remover os 3 metais, no tempo mais curto

possıvel, logo o coeficiente α1 tem, portanto, um papel central na escolha que foi

efectuada. Remete-se a interpretacao dos resultados da analise para as seccoes 3.2.1,

3.2.2, 3.2.3 e 3.3. do artigo “Regressional modeling of electrodialytic removal of Cu,

Cr and As from CCA treated timber waste: Application to wood chips”(Apendice

C). Nessas seccoes e explicado, em pormenor para os 3 metais em separado, o ra-

ciocınio que levou as conclusoes deste estudo, as quais indicam que o agente adju-

vante mais eficiente e o acido oxalico a 2,5% e a melhor corrente inicial a ser aplicada

estara situada entre os 20 e os 40 mA.

10. CONCLUSOES E TRABALHO FUTURO

Neste trabalho foi desenvolvida a teoria das famılias estruturadas de modelos (f.e.m),

a qual representa uma generalizacao e extensao dos delineamentos regressionais

multiplos introduzidos por [19]. Os modelos constituintes das f.e.m, isto e, os mo-

delos elementares para alem de poderem ser regressoes lineares multiplas podem

agora ser modelos log-lineares. Estes ultimos, nao sendo normais, atraves das suas

propriedades assimptoticas puderam ser enquadrados nesta teoria, a qual e baseada

na suposicao de normalidade dos modelos. As f.e.m. mostraram assim ser uma

ferramenta flexıvel que pode ser utilizada mesmo quando os modelos elementares

nao sao regressoes lineares multiplas.

Por outro lado, o enquadramento desta teoria na teoria dos modelos ortogonais

associados a uma algebra de Jordan comutativa, permitiu que para o modelo base

fosse considerado um modelo de cruzamento-encaixe de dois ou mais factores de

efeitos fixos. Sendo portanto, um modelo base bastante mais geral do que os que

ate ao momento tem sido considerados.

Continuam, no entanto, a existir diversas restricoes quanto ao modelo base e aos

modelos elementares. O modelo base deve ser um modelo completo e equilibrado e

para os modelos elementares considera-se o caso regular, ou seja, admite-se a homo-

cedasticidade e independencia entre os modelos individuais e no caso das regressoes,

as matrizes do modelo terao de ser todas iguais e ter vectores coluna linearmente

independentes (multicolinariedade).

144 10. Conclusoes e Trabalho Futuro

Com vista a ultrapassar a restricao das matrizes do modelo terem de ser todas

iguais, desenvolveu-se um outro tipo de modelos, designados de L-ortogonais. Estes

modelos permitem o estudo do caso nao equilibrado relativo as f.e.m. constituıdas

por regressoes multiplas, o que equivale a dizer que ja podem ser consideradas re-

gressoes com diferentes observacoes, mas do mesmo tipo.

Em termos de futuro trabalho a desenvolver nesta area ainda muito ha a fazer,

nomeadamente tentativas no sentido de ultrapassar algumas das restricoes como

a homocedasticidade entre os modelos elementares e a multicolinariedade nas re-

gressoes.

Os modelos L-ortogonais, podem ser utilizados em estudos de biometria em que

se comparam taxas de crescimento de seres vivos para varios conjuntos de condicoes

que correspondem aos tratamentos do modelo base.

Nas aplicacoes apresentadas, pos-se em pratica a teoria desenvolvida a duas areas

distintas: a hidrologia e a remediacao ambiental.

Na primeira das aplicacoes, o caso mais basico das f.e.m. foi utilizado. Neste,

os modelos elementares sao modelos log-lineares ajustados a tabelas de contingencia

representando contagens de transicoes mensais entre classes de seca no Alentejo

relativas a tres perıodos temporais distintos e para o modelo base considerou-se um

factor com tres tratamentos. Esta analise permitiu concluir acerca de diferencas

significativas entre os tres perıodos (tratamentos). Os resultados obtidos atraves da

analise utilizando as f.e.m, permitiram obter conclusoes similares a outras obtidas

utilizando o metodo apresentado em Moreira et al. (2006), dando assim credibilidade

a utilizacao das f.e.m..

Na segunda aplicacao, os modelos elementares tambem sao loglineares ajustados

a tabelas de contingencia representando contagens de transicoes mensais entre classes

de seca relativas a longo perıodo de tempo no Alentejo. Contudo, para o modelo base

145

considerou-se o cruzamento de dois factores com interaccao (latitude e longitude),

cada um com dois nıveis (norte e sul, oeste e leste). Esta analise permitiu concluir

acerca de diferencas significativas entre os nıveis dos dois factores envolvidos. Os

resultados obtidos sao indicativos de diferencas significativas entre oeste e leste ao

nıvel das diferentes classes de seca. Este estudo, revela bastante interesse na area da

hidrologia, uma vez que pode ser utilizado como metodo alternativo a outros para

detectar zonas homogeneas em termos ocorrencia de eventos de seca (severidade e

frequencia).

Na ultima aplicacao, o caso nao equilibrado das f.e.m. e utilizado para analisar os

dados resultantes de experiencias de remocao electrodialıtica de metais pesados. Os

modelos elementares neste caso sao regressoes polinomiais do 3o e 4o grau ajustados

a evolucao temporal das concentracoes dos metais pesados nos electrolitos. Para o

modelo base apenas foi possıvel considerar um factor com quatro tratamentos cor-

respondentes a diferentes condicoes experimentais. Na recolha dos dados para cada

um dos tratamentos, diferente numero de observacoes estavam disponıveis. Utili-

zando a teoria desenvolvida no capitulo 6 desta dissertacao, foi possıvel considerar

todas as observacoes recolhidas, pois os polinomios poderam ser ajustados com dife-

rentes matrizes de modelo e analisados conjuntamente. Esta e uma situacao muito

comum na recolha de dados para analise estatıstica, que fica assim resolvida gracas

aos modelos L-ortogonais.

146 10. Conclusoes e Trabalho Futuro

BIBLIOGRAFIA

[1] Agresti A. (1990) Categorical Data Analysis. J. Wiley & Sons. New York.

[2] Covas R. (2007) Orthogonal mixed models and commutative Jordan algebras.

Dissertacao de Doutoramento em Matematica Especialidade Estatıstica. Facul-

dade de Ciencias e Tecnologia, Universidade Nova de Lisboa.

[3] Cruz S.M. (2001) Delineamentos regressionais multiplos aplicados a quadrados

latinos. Tese de Licenciatura em Matematica Aplicada. Universidade da Evora.

[4] Domingues L.F. (1997) Delineamentos regressionais multiplos de base 2. Dis-

sertacao de Mestrado em Estatıstica e Optimizacao. Universidade Nova de Lis-

boa.

[5] Ferreira S. (2006) Inferencia para modelos ortogonais com segregacao. Dis-

sertacao de Doutoramento em Matematica Estatıstica. Universidade da Beira

Interior.

[6] Ferreira D. (1996) Delineamentos regressionais multiplos com planos completos

como delineamentos base. Tese de Licenciatura em Matematica Probabilidades

e Estatıstica. Universidade de Evora.

[7] Fonseca M. (2007) Estimation and hypothesis testing in mixed linear mo-

dels. Dissertacao de Doutoramento em Matematica, Estatıstica. Faculdade de

Ciencias e Tecnologia, Universidade Nova de Lisboa.

148 Bibliografia

[8] Fonseca M., Mexia J.T., Zmyslony R. (2007) Jordan algebras, generating pivot

variables and ortogonal normal models. Journal of Interdisciplinary Mathema-

tics, 2(10): 305-326.

[9] Fonseca M., Mexia J.T., Zmyslony R. (2006) Binary operations on Jordan alge-

bras and orthogonal normal models. Linear Algebra and its Applications, 417:

75-86.

[10] Fonseca M., Mexia J.T., Zmyslony R. (2003) Estimators and tests for variance

components in cross nested orthogonal models. Discussiones Mathematicae -

Probability and Statistics, 23: 173-201.

[11] Khuri A.I., Mathew T., Sinha B.K. (1998) Statistical Tests for Mixed Linear

Models. John Willey & Sons. New York.

[12] Lehmann E.L., Casella G. (1998) Theory of Point Estimation, Springer Texts

in Statistics. New York.

[13] Lehmann E.L.(1997) Testing Statistical Hypotheses. Reprint of the 2nd ed.

publ. by Wiley 1986. Springer. New York

[14] Mexia, J.T. (1995) Introducao a Inferencia Estatıstica Linear. Centro de Estu-

dos de Matematica Aplicada. Edicoes Universitarias Lusofonas. Lisboa.

[15] Mexia, J.T. (1990) Best linear unbiased estimates, duality of F tests and

Scheffe’s multiple comparison method in the presence of controlled Heteroce-

dasticity. Comp. Stat. & Data Analysis, 10(3): 271-281.

[16] Mexia, J.T. (1989) Simultaneous Confidence Intervals: Generalization of the

Scheffe Theorem. Trabalhos de Investigacao No2. Departamento de Matematica,

Faculdade de Ciencias e Tecnologia, Universidade Nova de Lisboa.

Bibliografia 149

[17] Mexia, J.T. (1988a) Estimable Functions, Duality of F Tests and Scheffe’s Mul-

tiple Comparison Method. Trabalhos de Investigacao No1. Departamento de

Matematica, Faculdade de Ciencias e Tecnologia, Universidade Nova de Lis-

boa.

[18] Mexia, J.T. (1988b) Standardized Orthogonal Matrices and Decomposition of

the Sum of Squares for Treatments. Trabalhos de Investigacao No2. Departa-

mento de Matematica, Faculdade de Ciencias e Tecnologia, Universidade Nova

de Lisboa.

[19] Mexia, J.T. (1987) Multi-Treatment Regression Designs. Trabalhos de Inves-

tigacao No1. Departamento de Matematica, Faculdade de Ciencias e Tecnologia,

Universidade Nova de Lisboa.

[20] Montgomery D.C. (1997) Design and Analysis of Experiments - 5th edition.

John Willey & Sons. New York.

[21] Moreira E.E., Coelho C.A., Paulo A.A., Pereira L.S., Mexia J.T. (2008) SPI-

based drought category prediction using loglinear models. J Hydrology, 354:

116-130.

[22] Moreira E.E., Paulo A.A., Pereira L.S. (2007a) Is drought occurrence and seve-

rity increasing due to climate change? Analyzing drought class transitions with

loglinear models. Methods and tools for drought analysis and management.

Water Science and Technology Library. Springer, 67-81.

[23] Moreira E.E., Mexia J. T. (2007b) Multiple regression models with cross nes-

ted orthogonal base model. Proceedings of the 56th Session of the ISI 2007 -

International Statistical Institute, Lisboa.

150 Bibliografia

[24] Moreira E.E., Paulo A.A., Pereira L.S., Mexia J.T. (2006) Analysis of SPI

drought class transitions using loglinear models. J Hydrology, 331: 349-359.

[25] Moreira E.E., Ribeiro A.B., Mateus E.P., Mexia J.T., Ottosen L.M. (2005a)

Regressional modeling of electrodialytic removal of Cu, Cr and As from CCA

timber waste: application to sawdust. Wood Science and Technology, 39(4):

291-309.

[26] Moreira E.E., Ribeiro A.B., Mateus E.P., Mexia J.T., Ottosen L.M. (2005b)

Regressional modeling of electrodialytic removal of Cu, Cr and As from CCA

timber waste: application to wood chips. Biometrical letters, 42(1): 11-25.

[27] Moreira E.E. (2004) Tratamento regressional da remocao electrodialıtica de me-

tais pesados de resıduos de madeira. Dissertacao de Mestrado em Estatıstica e

Optimizacao. Faculdade de Ciencias e Tecnologia, Universidade Nova de Lisboa.

[28] Nelder J.A. (1974) Loglinear models for contingency tables: a generalization of

classical least squares. Appl. Statistics, 23: 323-329.

[29] Oliveira S. (2005) Delineamentos regressionais com base factorial prima. Tese

de Mestrado em Estatıstica e Optimizacao. Universidade Nova de Lisboa. Fa-

culdade de Ciencias e Tecnologia.

[30] Pollock, D.S.G. (1975) The Algebra of Econometrics. John Willey & Sons. New

York.

[31] Rao, C.R. (1973) Linear Statistical Inference and Its Applications. 2nd edn.

John Willey & Sons. New York.

[32] Rohatgi, V.K. (1976) An Introduction to Probability Theory and Mathematical

Statistics. John Willey & Sons. New York.

Bibliografia 151

[33] Saraiva S. (1996) Delineamentos regressionais associados a quadrados latinos

e blocos casualizados. Tese de Licenciatura em Engenharia Biofısica. Universi-

dade da Evora.

[34] Scheffe, H. (1959) The Analysis of Variance. John Willey & Sons. New York.

[35] Schott, J.R. (1996) Matrix Analysis for Statistics. Wiley Series in Probability

and Statistics. New York.

[36] Seber, G.A.F. (1980) The Linear Hypoteses: A General Theory - 2nd ed. Char-

les Griffing and Co. Londres.

[37] Seely J. (1971) Quadratic subspaces and completeness. Ann. Math. Stat., 42(2):

710-721.

[38] Silvey, S.D. (1975) Statistical Inference. Chapman & Hall. New York.

152 Bibliografia

APENDICE

A. TABELAS ANEXAS AO CAPITULO 7

156 A. Tabelas Anexas ao Capitulo 7

Tab. A.1: Valores para os estimadores dos parametros dos modelos de quasi-associacao

ajustados as tabelas de contingencia e respectivos desvios residuais das 6

estacoes.

Portalegre Elvas Evora

1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo

λ 1.361 1.554 1.933 1.217 1.723 0.876 0.775 0.834 0.832

λA2 -1.633 -0.810 -2.375 -1.507 -1.060 -1.484 -1.685 -1.424 -2.811

λA3 -6.740 -4.170 -6.460 -5.200 -4.580 -5.490 -6.710 -5.780 -7.580

λA4 -10.980 -8.400 -11.440 -10.360 -8.120 -9.870 -11.790 -10.450 -12.040

λB2 -1.575 -0.890 -2.308 -1.588 -0.980 -1.491 -1.749 -1.325 -2.617

λB3 -6.590 -4.240 -6.290 -5.350 -4.520 -5.400 -6.770 -5.560 -7.250

λB4 -10.860 -8.470 -11.290 -10.500 -8.050 -9.800 -11.860 -10.260 -11.720

β 1.508 0.867 1.467 1.341 0.911 1.366 0.395 0.427 0.386

δ1 1.727 2.480 1.327 2.115 2.308 2.332 2.080 2.644 1.323

δ2 0.172 1.087 1.056 0.957 1.112 0.951 -0.310 0.861 1.348

δ3 0.472 1.240 0.708 0.553 0.561 0.851 0.963 0.924 0.895

δ4 -0.468 1.430 -0.724 -1.820 -0.130 -0.361 -1.018 -1.840 -1.228

G2 1.775 3.012 6.023 3.629 0.302 8.310 1.979 1.351 1.794

Beja Barrancos Almodovar

1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo 1o perıodo 2o perıodo 3o perıodo

λ 1.437 1.077 2.372 1.309 0.652 2.661 1.414 0.597 1.237

λA2 -2.540 0.440 -3.210 -1.335 -0.330 -3.561 -1.430 -1.004 -1.994

λA3 -7.580 -2.600 -7.480 -6.210 -4.710 -8.900 -6.090 -5.200 -6.800

λA4 -14.110 -5.840 -13.330 -10.110 -8.390 -13.330 -9.780 -10.000 -12.280

λB2 -2.540 0.500 -3.140 -1.332 -0.410 -3.561 -1.566 -1.009 -1.997

λB3 -7.580 -2.400 -7.290 -6.310 -4.790 -8.930 -6.440 -5.120 -6.730

λB4 -14.110 -5.060 -13.150 -10.180 -8.460 -13.260 -10.230 -9.660 -11.890

β 1.813 0.485 1.664 1.383 1.102 1.821 1.343 1.275 1.601

δ1 1.413 3.350 0.655 2.070 3.042 0.210 1.962 3.026 1.872

δ2 0.779 0.455 1.496 0.244 -0.070 1.167 0.677 0.685 0.628

δ3 0.497 0.940 -0.004 0.140 1.924 1.777 0.133 0.646 0.085

δ4 0.410 2.060 0.713 -0.753 -0.330 -2.212 0.330 -1.340 0.362

G2 2.942 8.432 4.591 1.906 1.555 1.867 1.435 1.544 1.774

157

Tab. A.2: Resultado das comparacoes multiplas de Scheffe para Portalegre, Elvas, EvoraPeriodos 1o membro sinal 2o membro conclusao

Portalegre

m33

1 e 2 0.112 < 1.286 nao ha diferencas significativas entre os periodos



m44

1 e 2 3.195 > 2.700 ha diferencas significativas entre os periodos



Elvas

m11




m33




m44




Evora

m11




m22




m34




m43




m44




158 A. Tabelas Anexas ao Capitulo 7

Tab. A.3: Resultado das comparacoes multiplas de Scheffe para Beja, Barrancos e Al-

modovarPeriodos 1o membro sinal 2o membro conclusao

Beja

m33




m44




Barrancos

m22




m33




m34




m43




m44




Almodovar

m33




m44




B. TABELAS ANEXAS AO CAPITULO 8

160 B. Tabelas Anexas ao Capitulo 8

Tab. B.1: Tabelas de contingencia para zona 1 e 2Classe seca mes t Classe seca mes t+1 Classe seca mes t Classe seca mes t+1

Chouto 1 2 3 4 Nisa 1 2 3 4

1 377 37 2 0 1 368 31 2 0

2 38 183 24 1 2 33 200 24 2

3 0 22 44 14 3 0 26 61 9

4 1 4 11 45 4 0 3 8 36

Lamarosa 1 2 3 4 Castelo de Vide 1 2 3 4

1 378 46 2 0 1 383 25 0 0

2 46 169 19 3 2 22 188 35 0

3 2 18 35 10 3 3 29 59 13

4 0 3 10 62 4 0 3 10 33

Lavre 1 2 3 4 Portalegre 1 2 3 4

1 364 39 3 0 1 346 39 3 0

2 42 187 24 2 2 41 226 21 4

3 0 26 48 11 3 1 22 39 13

4 0 3 10 44 4 0 4 13 31

Canha 1 2 3 4 Arronches 1 2 3 4

1 369 34 3 0 1 381 34 2 0

2 36 185 25 2 2 36 180 16 4

3 1 21 50 16 3 0 16 61 10

4 0 7 10 44 4 0 5 9 49

Reguengos 1 2 3 4 Avis 1 2 3 4

1 370 32 3 0 1 377 27 2 0

2 34 199 20 1 2 29 199 20 1

3 0 20 46 16 3 0 20 65 12

4 1 2 14 45 4 0 2 11 38

Montemor-o-Novo 1 2 3 4 Pavia 1 2 3 4

1 375 38 1 0 1 340 36 0 0

2 38 185 20 3 2 35 237 23 1

3 1 20 37 16 3 1 20 39 14

4 0 3 15 51 4 0 3 13 41

Aguas de Moura 1 2 3 4 Arraiolos 1 2 3 4

1 391 31 4 0 1 375 37 1 1

2 35 187 17 4 2 38 208 22 1

3 0 19 33 11 3 1 21 38 8

4 0 6 9 56 4 0 2 7 43

B. Pego do Altar 1 2 3 4 Vila Vicosa 1 2 3 4

1 349 49 1 0 1 363 28 1 0

2 50 212 15 2 2 28 229 21 1

3 0 13 33 16 3 1 20 47 12

4 0 5 12 46 4 0 2 11 39

Comporta 1 2 3 4 Evora 1 2 3 4

1 361 42 0 0 1 367 33 1 0

2 39 222 18 3 2 34 196 21 4

3 3 15 35 10 3 0 22 49 19

4 0 3 9 43 4 0 3 19 35

Torrao 1 2 3 4 Viana do Alentejo 1 2 3 4

1 365 40 0 0 1 364 35 2 0

2 37 187 33 1 2 35 196 30 2

3 3 26 37 15 3 2 30 38 15

4 0 5 11 43 4 0 2 15 37

161

Tab. B.2: Tabelas de contingencia para zona 3 e 4Classe seca mes t Classe seca mes t+1 Classe seca mes t Classe seca mes t+1

Grandola 1 2 3 4 Amareleja (D.G.R.N.) 1 2 3 4

1 366 39 0 0 1 348 36 1 0

2 35 195 25 3 2 36 214 23 4

3 4 20 41 11 3 1 22 56 9

4 0 4 9 51 4 0 4 9 40

Alvalade 1 2 3 4 Cuba 1 2 3 4

1 382 37 2 0 1 381 38 0 0

2 38 183 20 1 2 36 179 22 1

3 0 16 43 17 3 1 18 53 14

4 1 5 12 46 4 0 4 11 45

Cercal do Alentejo 1 2 3 4 Barrancos 1 2 3 4

1 381 36 2 0 1 347 44 0 0

2 37 175 27 2 2 42 207 20 6

3 1 26 38 17 3 2 18 44 17

4 0 4 14 43 4 0 6 16 34

Reliquias 1 2 3 4 Beja 1 2 3 4

1 374 40 1 0 1 351 37 2 0

2 39 187 21 3 2 38 228 22 1

3 1 20 26 15 3 0 23 39 11

4 1 2 15 58 4 1 1 10 39

Aldeia de Palheiros 1 2 3 4 Serpa 1 2 3 4

1 365 36 0 0 1 378 36 0 0

2 34 207 20 4 2 32 199 22 3

3 1 19 39 14 3 2 19 45 13

4 1 3 13 47 4 1 3 12 38

Saboia 1 2 3 4 Trindade 1 2 3 4

1 382 31 0 0 1 366 42 0 0

2 29 226 13 2 2 39 198 21 2

3 2 8 29 13 3 3 14 46 11

4 0 4 10 54 4 0 5 8 48

S. Marcos da Serra 1 2 3 4 Algodor 1 2 3 4

1 363 33 0 0 1 353 33 0 0

2 32 203 27 2 2 32 231 25 3

3 1 25 44 13 3 1 21 37 9

4 0 3 12 45 4 0 5 7 46

Aljezur 1 2 3 4 Martim Longo 1 2 3 4

1 371 38 1 1 1 353 35 1 1

2 40 215 16 1 2 35 216 24 3

3 0 13 32 15 3 1 23 48 12

4 0 5 11 44 4 1 3 12 35

Monchique 1 2 3 4 Almodovar 1 2 3 4

1 388 38 2 0 1 357 33 1 0

2 40 167 26 2 2 34 238 22 2

3 0 26 34 13 3 0 21 23 12

4 0 3 12 52 4 0 4 10 46

S. Bartol. Messines 1 2 3 4 Sao Bras de Alportel 1 2 3 4

1 378 31 0 0 1 353 34 0 0

2 29 201 23 3 2 32 222 22 4

3 1 20 51 14 3 2 19 53 15

4 1 3 12 36 4 0 4 15 28


Tab. B.3: Estimadores dos parametros dos modelos de quasi-associacao ajustados as ta-

belas de contingencia e respectivos desvios residuais das 40 estacoes.

Chouto Lamarosa Lavre Canha Reguengos Mont-o-Novo Ag.Moura B.P.Altar Comporta Torrao

λ 2.487 3.028 2.452 2.385 2.829 2.383 2.407 2.536 2.759 2.228

λA2 -1.887 -2.144 -1.933 -1.508 -2.446 -2.294 -1.336 -2.655 -2.075 -1.746

λA3 -6.581 -6.823 -6.850 -5.788 -6.744 -7.740 -5.455 -9.300 -6.920 -6.600

λA4 -11.610 -11.620 -12.350 -10.160 -12.110 -13.220 -9.210 -14.740 -11.720 -12.070

λB2 -1.890 -2.146 -1.933 -1.509 -2.501 -2.294 -1.336 -2.654 -2.074 -1.746

λB3 -6.517 -6.780 -6.850 -5.763 -6.836 -7.740 -5.455 -9.310 -6.940 -6.600

λB4 -11.500 -11.590 -12.350 -10.080 -12.200 -13.170 -9.210 -14.690 -11.650 -12.070

β 1.511 1.473 1.591 1.340 1.568 1.775 1.214 2.010 1.509 1.584

δ1 1.935 1.434 1.854 2.186 1.516 1.770 2.348 1.309 1.621 2.087

δ2 0.456 0.499 0.280 0.493 1.139 0.327 0.642 0.088 0.758 0.158

δ3 0.797 0.870 0.791 1.021 0.469 0.735 1.075 1.474 1.078 0.329

δ4 0.256 0.729 0.569 0.202 0.202 -0.449 0.618 -1.437 0.225 0.327

G2 8.378 0.294 4.719 6.149 5.891 0.105 7.128 3.477 4.789 8.761

Nisa Cast.Vide Portalegre Arronches Avis Pavia Arraiolos V.Vicosa Evora Via.Alen.

λ 1.795 1.690 2.675 2.167 2.119 1.856 2.516 2.094 1.697 2.467

λA2 -1.482 -1.742 -1.826 -1.546 -2.384 -2.415 -1.819 -2.359 -2.139 -2.186

λA3 -6.530 -6.140 -6.318 -6.680 -7.550 -8.760 -6.440 -7.510 -8.370 -6.700

λA4 -12.000 -12.500 -10.870 -10.890 -13.750 -15.230 -11.710 -13.730 -14.160 -12.700

λB2 -1.481 -1.745 -1.827 -1.548 -2.385 -2.415 -1.820 -2.359 -2.140 -2.186

λB3 -6.570 -6.090 -6.282 -6.630 -7.510 -8.750 -6.410 -7.510 -8.330 -6.700

λB4 -12.030 -12.300 -10.840 -10.860 -13.710 -15.290 -11.580 -13.730 -14.090 -12.700

β 1.576 1.605 1.421 1.468 1.799 2.064 1.462 1.799 1.977 1.637

δ1 2.536 2.653 1.751 2.308 2.014 1.909 1.949 2.002 2.231 1.793

δ2 0.162 0.612 0.716 0.248 0.747 0.185 0.613 0.863 -0.048 0.634

δ4 1.232 0.165 0.804 2.036 0.929 0.746 0.808 0.580 1.104 -0.160

δ5 0.604 0.923 -0.261 -0.008 0.198 -0.637 1.143 0.250 -1.523 0.354

G2 3.2390 5.503 1.450 3.219 3.254 2.684 6.057 0.4557 1.576 0.102

Grandola Alvalade Cerc.Alen. Reliquias Ald.Palhe. Saboia S.M.Serra Aljezur Monchique SBMessi.

λ 2.487 2.729 2.322 2.734 2.244 2.589 1.447 2.724 2.151 1.975

λA2 -1.576 -2.148 -1.976 -2.241 -1.785 -2.415 -1.836 -2.299 -2.023 -1.619

λA3 -5.890 -6.898 -6.820 -7.054 -6.780 -7.530 -7.960 -7.560 -7.490 -6.450

λA4 -10.520 -11.580 -12.290 -12.100 -11.440 -12.070 -14.180 -12.240 -13.380 -11.280

λB2 -1.575 -2.154 -1.976 -2.242 -1.784 -2.416 -1.836 -2.303 -2.024 -1.620

λB3 -5.899 -6.785 -6.830 -7.015 -6.790 -7.480 -7.960 -7.430 -7.460 -6.420

λB4 -10.450 -11.380 -12.240 -12.070 -11.390 -11.960 -14.180 -11.960 -13.350 -11.190

β 1.350 1.521 1.626 1.590 1.546 1.614 1.935 1.618 1.768 1.520

δ1 2.065 1.695 1.995 1.600 2.110 1.742 2.512 1.574 2.042 2.440

δ2 0.537 0.697 0.292 0.620 0.475 1.206 -0.203 0.775 -0.058 0.486

δ3 0.866 1.023 0.328 0.283 1.082 1.256 0.848 1.161 0.417 1.136

δ4 0.821 -0.281 -0.038 0.049 -0.296 -0.401 -0.244 -0.631 0.240 -0.246

G2 6.937 8.811 1.447 5.186 6.828 5.276 1.748 7.671 3.113 7.387

Amareleja Cuba Barrancos Beja Serpa Trindade Algodor M.Longo Almodovar SBAlpor.

λA2 1.904 1.879 2.357 2.677 2.414 2.643 1.248 2.474 1.567 2.053

λA2 -1.293 -2.242 -1.84 -2.349 -1.777 -1.861 -1.044 -1.457 -1.747 -1.809

λA2 -6.430 -8.550 -7.300 -7.100 -6.277 -6.700 -6.920 -5.507 -7.830 -7.000

λA2 -11.140 -14.590 -11.730 -13.020 -10.870 -11.250 -11.950 -9.720 -13.490 -11.90

λA2 -1.294 -2.216 -1.839 -2.397 -1.748 -1.863 -1.045 -1.459 -1.747 -1.810

λA2 -6.400 -8.520 -7.310 -7.220 -6.251 -6.650 -6.880 -5.473 -7.830 -6.960

λA2 -11.120 -14.570 -11.700 -13.130 -10.850 -11.220 -11.920 -9.700 -13.490 -11.870

β 1.487 1.980 1.622 1.658 1.435 1.460 1.639 1.265 1.846 1.627

δ1 2.461 2.083 1.87 1.526 2.086 1.799 2.980 2.127 2.465 2.187

δ2 0.102 -0.155 0.167 0.866 0.663 0.528 -0.273 0.755 0.016 0.461

δ3 1.572 1.340 1.433 0.386 1.003 1.398 1.415 0.989 0.609 1.241

δ4 0.258 -0.596 -1.353 0.611 -0.023 0.335 0.225 0.252 -0.287 -0.983

G2 0.1604 4.150 3.172 6.758 7.636 7.731 2.553 7.587 2.330 3.183

163

Tab. B.4: Valores para yi e V (yi)i yi V (yi)

1 3.809 0.022

2 4.115 0.016

3 3.777 0.023

4 3.787 0.023

5 3.809 0.022

6 3.944 0.020

7 4.029 0.018

8 3.829 0.022

9 3.758 0.023

10 3.759 0.023

11 3.585 0.028

12 3.493 0.030

13 3.44 0.032

14 3.897 0.020

15 3.641 0.026

16 3.723 0.024

17 3.761 0.023

18 3.668 0.026

19 3.556 0.029

20 3.613 0.027

21 3.938 0.020

22 3.824 0.022

23 3.77 0.023

24 4.053 0.017

25 3.854 0.021

26 3.982 0.019

27 3.803 0.022

28 3.781 0.023

29 3.949 0.019

30 3.579 0.028

31 3.694 0.025

32 3.803 0.022

33 3.526 0.029

34 3.666 0.026

35 3.631 0.026

36 3.868 0.021

37 3.827 0.022

38 3.546 0.029

39 3.836 0.022

40 3.332 0.036

C. ARTIGOS PUBLICADOS

fam ilias estruturadas de modelos com modelo …n! matriz nula de ordem n i n! matriz identidade de...

Documents