Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 1/26
A Análise de Componentes Principais sobredados dependentes.
Paulo Canas RodriguesFaculdade de Ciências e Tecnologia/Universidade Nova de Lisboa
João A. BrancoInstituto Superior Técnico/Universidade Técnica de Lisboa
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 2/26
1. Introdução
A Análise de Componentes Principais (ACP) é um dosmétodos estatísticos mais usados quando se pretendemanalisar dados multivariados.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 2/26
1. Introdução
A Análise de Componentes Principais (ACP) é um dosmétodos estatísticos mais usados quando se pretendemanalisar dados multivariados.
Ela permite transformar um conjunto de variáveis originais,intercorrelacionadas, num novo conjunto de variáveis nãocorrelacionadas, as componentes principais.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 2/26
1. Introdução
A Análise de Componentes Principais (ACP) é um dosmétodos estatísticos mais usados quando se pretendemanalisar dados multivariados.
Ela permite transformar um conjunto de variáveis originais,intercorrelacionadas, num novo conjunto de variáveis nãocorrelacionadas, as componentes principais.
O objectivo mais imediato da ACP é verificar se existe umpequeno número das primeiras componentes principais queseja responsável por explicar uma proporção elevada davariação total associada ao conjunto original.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 3/26
1. Exemplo da utilidade da ACP
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 3/26
1. Exemplo da utilidade da ACP
Conjunto de dados : apresentado por Jolicoeur e Mosimann(1960) e refere-se ao estudo das relações entre o tamanho ea forma das carapaças de 24 tartarugas pintadasmasculinas.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 3/26
1. Exemplo da utilidade da ACP
Conjunto de dados : apresentado por Jolicoeur e Mosimann(1960) e refere-se ao estudo das relações entre o tamanho ea forma das carapaças de 24 tartarugas pintadasmasculinas.
Variáveis : comprimento (X1), largura (X2) e altura (X3), emmilímetros, das carapaças.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 3/26
1. Exemplo da utilidade da ACP
Conjunto de dados : apresentado por Jolicoeur e Mosimann(1960) e refere-se ao estudo das relações entre o tamanho ea forma das carapaças de 24 tartarugas pintadasmasculinas.
Variáveis : comprimento (X1), largura (X2) e altura (X3), emmilímetros, das carapaças.
Componentes principais :Y1 = e
′1X = 0.681X1 + 0.512X2 + 0.524X3
Y2 = e′2X = −0.208X1 − 0.550X2 + 0.809X3
Y3 = e′3X = 0.702X1 − 0.659X2 − 0.268X3
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 4/26
Mas, e se as observações forem
dependentes?
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 5/26
2. Singular Spectrum Analysis
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 6/26
Singular Spectrum Analysis
O método SSA consiste na decomposição de uma sérietemporal em várias componentes, que usualmente podemser identificadas como tendências, sazonalidades e outrostipos de séries oscilatórias ou componentes de ruído.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 6/26
Singular Spectrum Analysis
O método SSA consiste na decomposição de uma sérietemporal em várias componentes, que usualmente podemser identificadas como tendências, sazonalidades e outrostipos de séries oscilatórias ou componentes de ruído.
Este método é uma ferramenta muito útil e potente quandose pretendem analisar séries temporais em áreas como ameteorologia, hidrologia, geofísica, climatologia, etc.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 6/26
Singular Spectrum Analysis
O método SSA consiste na decomposição de uma sérietemporal em várias componentes, que usualmente podemser identificadas como tendências, sazonalidades e outrostipos de séries oscilatórias ou componentes de ruído.
Este método é uma ferramenta muito útil e potente quandose pretendem analisar séries temporais em áreas como ameteorologia, hidrologia, geofísica, climatologia, etc.
A versão mais básica da SSA consiste em quatro passos,que podem ser descritos como se apresenta em seguida,ver Golyandina (2001).
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 7/26
Primeiro passo: Encaixe
O processo de encaixe permite representar a série temporaloriginal numa sequência retardada (lagged) de vectoresmultidimensionais.
26666664 37777775
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 7/26
Primeiro passo: Encaixe
O processo de encaixe permite representar a série temporaloriginal numa sequência retardada (lagged) de vectoresmultidimensionais.
Seja F = (f0, f1, . . . , fn−1) uma sequência numérica ousérie temporal de comprimento n, e L, 1 < L < n, um inteiroque será chamado de “comprimento da janela”.
Considere-se K = n − L + 1 e definam-se os K vectoresL-lagged Xj = (fj−1, . . . , fj+L−2)
T , j = 1, 2, . . . , K e amatriz de trajectórias
X = (fi+j−2)L,K
i,j=1= [X1 : · · · : XK ] =
26666664 x1 x2 · · · xK
x2 x3 · · · xK+1
......
. . ....
xL xL+1 · · · xn
37777775
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 8/26
Segundo passo: Decomposição em valores singulares
O segundo passo é a DVS da matriz X, que pode ser obtidaatravés dos valores e vectores próprios da matriz S = XX
T
de dimensão L × L.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 8/26
Segundo passo: Decomposição em valores singulares
O segundo passo é a DVS da matriz X, que pode ser obtidaatravés dos valores e vectores próprios da matriz S = XX
T
de dimensão L × L.
Assim, obtém-se uma representação de X como a soma dematrizes bi-ortogonais de ordem um, Xi (i = 1, . . . , d), emque d (d < L) é o número de valores singulares de X
diferentes de zero.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 8/26
Segundo passo: Decomposição em valores singulares
O segundo passo é a DVS da matriz X, que pode ser obtidaatravés dos valores e vectores próprios da matriz S = XX
T
de dimensão L × L.
Assim, obtém-se uma representação de X como a soma dematrizes bi-ortogonais de ordem um, Xi (i = 1, . . . , d), emque d (d < L) é o número de valores singulares de X
diferentes de zero.
Ao considerar Vi = XT Ui√λi
, i = 1, . . . , d, a DVS da matriz detrajectórias X pode ser escrita como
X = X1 + · · · + Xd, (1)
onde Xi =√
λiUiVTi . As matrizes Xi têm ordem 1 e o
conjunto (√
λi, Ui, Vi) é designado pelo i-ésimo “trio-próprio”(eigentriple) da DVS (1).
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 9/26
Terceiro passo: agrupar
Uma vez obtida a expansão (1), o processo de agrupamentoproduz partições do conjunto de índices {1, . . . , d} em m
subconjuntos disjuntos I1, . . . , Im.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 9/26
Terceiro passo: agrupar
Uma vez obtida a expansão (1), o processo de agrupamentoproduz partições do conjunto de índices {1, . . . , d} em m
subconjuntos disjuntos I1, . . . , Im.
Considere-se I = {i1, . . . , ip}. Assim, a matriz resultante XI
associada ao grupo I é definida como
XI = Xi1 + · · · + Xip.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 9/26
Terceiro passo: agrupar
Uma vez obtida a expansão (1), o processo de agrupamentoproduz partições do conjunto de índices {1, . . . , d} em m
subconjuntos disjuntos I1, . . . , Im.
Considere-se I = {i1, . . . , ip}. Assim, a matriz resultante XI
associada ao grupo I é definida como
XI = Xi1 + · · · + Xip.
Estas matrizes são determinadas para todos os conjuntosI1, . . . , Im e a expansão (1) pode ser reescrita como
X = XI1+ · · · + XIm
. (2)
Este processo de escolha dos conjuntos I1, . . . , Im édesignado de “agrupamento do triplo próprio” (eigentriplegrouping).
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 10/26
Quarto passo: Média diagonal
O último passo permite transformar cada matriz X do passoanterior, numa nova série de dimensão n.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 10/26
Quarto passo: Média diagonal
O último passo permite transformar cada matriz X do passoanterior, numa nova série de dimensão n.
Aplicando o procedimento “Média diagonal” às matrizes XIk
obtém-se a série
F̃ (k) =(f̃
(k)0 , . . . , f̃
(k)n−1
)
e a série inicial é decomposta na soma de m séries:
fn =m∑
k=1
f̃ (k)n , n = 0, . . . , n − 1; k = 1, . . . , K. (3)
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis❖ SSA❖ Primeiro passo :
Encaixe❖ Segundo passo :
DVS❖ Terceiro passo :
agrupar❖ Quarto passo :
Média diagonal
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 10/26
Quarto passo: Média diagonal
O último passo permite transformar cada matriz X do passoanterior, numa nova série de dimensão n.
Aplicando o procedimento “Média diagonal” às matrizes XIk
obtém-se a série
F̃ (k) =(f̃
(k)0 , . . . , f̃
(k)n−1
)
e a série inicial é decomposta na soma de m séries:
fn =m∑
k=1
f̃ (k)n , n = 0, . . . , n − 1; k = 1, . . . , K. (3)
Estas m séries representam as m primeiras componentesprincipais. A igualdade (3) apenas se verifica de m = L.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 11/26
3. Aplicação ilustrativa da SSA
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 12/26
Descrição dos dados
A série temporal utilizada foi obtida no site do Banco dePortugal e representa a taxa de desemprego nos indivíduosresidentes em Portugal medidas trimestralmente entre oprimeiro trimestre de 1992 e o primeiro trimestre de 2006,resultando numa série temporal com 57 observações.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 12/26
Descrição dos dados
A série temporal utilizada foi obtida no site do Banco dePortugal e representa a taxa de desemprego nos indivíduosresidentes em Portugal medidas trimestralmente entre oprimeiro trimestre de 1992 e o primeiro trimestre de 2006,resultando numa série temporal com 57 observações.
Software utilizado: “CatMV 1.00” e “CatSSA 1.00” obtidas napágina do GistaT Group, disponíveis emhttp://www.gistatgroup.com/cat/index.html
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 13/26
Série ajustada e resíduos
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 13/26
Série ajustada e resíduos
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 14/26
Componentes principais
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA❖ Dados❖ Série ajustada e
resíduos❖ Componentes
principais❖ Previsão
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 15/26
Previsão
A série prevista para um total de 50 períodos/trimestresapós o primeiro trimestre de 2006 é dada por:
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis❖ Matriz de dados❖ Matriz de
covariâncias S
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 16/26
4. Multichannel Singular SpectrumAnalysis
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis❖ Matriz de dados❖ Matriz de
covariâncias S
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 17/26
Matriz de dados
Para uma série temporal de dimensão p, {xt}t∈{1,...,n}, ondext = (x1,t, . . . , xp,t), de comprimento n, é possívelconsiderar, à semelhança do efectuado aquando da SSA, amatriz de dados “desfasados” (lagged) XK×p′ , ondeK = n − L + 1 e p′ = Lp, que pode ser escrita da forma:
26666664 37777775
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis❖ Matriz de dados❖ Matriz de
covariâncias S
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 17/26
Matriz de dados
Para uma série temporal de dimensão p, {xt}t∈{1,...,n}, ondext = (x1,t, . . . , xp,t), de comprimento n, é possívelconsiderar, à semelhança do efectuado aquando da SSA, amatriz de dados “desfasados” (lagged) XK×p′ , ondeK = n − L + 1 e p′ = Lp, que pode ser escrita da forma:
X =
26666664 x1,1 · · · x1,L x2,1 · · ·
x1,2 · · · x1,L+1 x2,2 · · ·
.... . .
......
...
x1,K · · · x1,n x2,K · · ·
· · · x2,L · · · xp,1 · · · xp,L
· · · x2,L+1 · · · xp,2 · · · xp,L+1
.... . .
.... . .
...
· · · x2,n · · · xp,K · · · xp,n
37777775
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis❖ Matriz de dados❖ Matriz de
covariâncias S
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 18/26
Matriz de covariâncias S
Considerando p séries temporais {xi,t}t∈{1,...,n}, i = 1, . . . , p
de comprimento n, a generalização da SSA para sériestemporais multivariadas requer a construção de uma“super-matriz” em blocos, SX para as covariâncias, da forma
SX =
S11 S12 · · · S1p
S21 S22 · · · S2p
......
. . ....
Sp1 Sp2 · · · Spp
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis❖ Matriz de dados❖ Matriz de
covariâncias S
5. Aplicaçãoilustrativa da MSSA
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 18/26
Matriz de covariâncias S
Considerando p séries temporais {xi,t}t∈{1,...,n}, i = 1, . . . , p
de comprimento n, a generalização da SSA para sériestemporais multivariadas requer a construção de uma“super-matriz” em blocos, SX para as covariâncias, da forma
SX =
S11 S12 · · · S1p
S21 S22 · · · S2p
......
. . ....
Sp1 Sp2 · · · Spp
onde Skl é a matriz de covariâncias entre as sub-variáveisdesfasadas no tempo das variáveis k e l. Esta matriz temuma dimensão (pL × pL).
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 19/26
5. Aplicação ilustrativa da MSSA
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 20/26
Descrição dos dados
O conjunto de dados em estudo prende-se com a produçãoe consumo de electricidade em Portugal, em GigaWatts,entre os meses de Janeiro de 1991 e Maio de 2006 (185observações).
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 20/26
Descrição dos dados
O conjunto de dados em estudo prende-se com a produçãoe consumo de electricidade em Portugal, em GigaWatts,entre os meses de Janeiro de 1991 e Maio de 2006 (185observações).
São apresentadas cinco variáveis:
✦ energia produzida por meios hidráulicos;✦ energia produzida por meios térmicos;✦ energia importada;✦ energia exportada;✦ consumo de energia.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 20/26
Descrição dos dados
O conjunto de dados em estudo prende-se com a produçãoe consumo de electricidade em Portugal, em GigaWatts,entre os meses de Janeiro de 1991 e Maio de 2006 (185observações).
São apresentadas cinco variáveis:
✦ energia produzida por meios hidráulicos;✦ energia produzida por meios térmicos;✦ energia importada;✦ energia exportada;✦ consumo de energia.
Software utilizado: Algumas rotinas implementados por EricBreitenberger, em MatLab.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 21/26
Séries iniciais
1991 1993 1995 1997 1999 2001 2003 2005 20070
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Ano
Gig
aWat
ts
HidraulicaTermicaImportadaExportadaConsumo
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 22/26
Componentes obtidas pelo método ACP
1991 1993 1995 1997 1999 2001 2003 2005 2007−5000
−4000
−3000
−2000
−1000
0
1000
2000
3000
4000
5000
Ano
Gig
aWat
ts
PC1PC2PC3PC4PC5
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 23/26
Loadings vs Matriz de correlações
PC1 PC2 PC3 PC4 PC5
Hidráulica -0.381 -0.665 -0.474 0.014 0.433
Térmica 0.699 0.244 -0.543 0.050 0.393
Importada 0.147 -0.087 0.504 -0.628 0.568
Exportada -0.004 -0.018 -0.427 -0.770 -0.474
Consumo 0.587 -0.700 0.210 0.101 -0.333
% de variância explicada 59.4 36.2 3.4 0.9 0.1
% acumulada de variância 59.4 95.6 99.0 99.9 100.0
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 23/26
Loadings vs Matriz de correlações
PC1 PC2 PC3 PC4 PC5
Hidráulica -0.381 -0.665 -0.474 0.014 0.433
Térmica 0.699 0.244 -0.543 0.050 0.393
Importada 0.147 -0.087 0.504 -0.628 0.568
Exportada -0.004 -0.018 -0.427 -0.770 -0.474
Consumo 0.587 -0.700 0.210 0.101 -0.333
% de variância explicada 59.4 36.2 3.4 0.9 0.1
% acumulada de variância 59.4 95.6 99.0 99.9 100.0
Hidráulica Térmica Importada Exportada Consumo
Hidráulica 1.000 -0.727 -0.239 0.215 0.104
Térmica -0.727 1.000 0.464 0.064 0.506
Importada -0.239 0.464 1.000 -0.174 0.733
Exportada 0.215 0.064 -0.174 1.000 -0.007
Consumo 0.104 0.506 0.733 -0.007 1.000
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 24/26
Componentes obtidas pelo método MSSA
1991 1993 1995 1997 1999 2001 2003 2005 2007−600
−500
−400
−300
−200
−100
0
100
200
300
400
Ano
Gig
aWat
ts
PC1PC2PC3PC4PC5
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 25/26
MSSA vs ACP
ACP PC1 PC2 PC3% de variância explicada 59.4 36.2 3.4% acumulada de variância 59.4 95.6 99.0
MSSA PC1 PC2 PC3% de variância explicada 87.6 7.9 4.4% acumulada de variância 87.6 95.5 99.9
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 25/26
MSSA vs ACP
ACP PC1 PC2 PC3% de variância explicada 59.4 36.2 3.4% acumulada de variância 59.4 95.6 99.0
MSSA PC1 PC2 PC3% de variância explicada 87.6 7.9 4.4% acumulada de variância 87.6 95.5 99.9
Formas mais suaves para as componentes mais importantesquando se utiliza o método MSSA em detrimento da ACP.
❖ 1. Introdução❖ 1. Exemplo da
utilidade da ACP❖
2. SingularSpectrum Analysis
3. Aplicaçãoilustrativa da SSA
4. MultichannelSingular SpectrumAnalysis
5. Aplicaçãoilustrativa da MSSA❖ Dados❖ Séries iniciais❖ ACP❖ Loadings vs
Matriz decorrelações
❖ MSSA❖ MSSA vs ACP❖ Referencias
Bibliográficas
Rodrigues, P.C. & Branco, J.A., 28 de Setembro de 2006 A Análise de Componentes Principais sobre dados dependentes. - p. 26/26
Referencias Bibliográficas
[1] Golyandina, N., Nekrutkin, V., Zhigljavsky, A. (2001). Analysis of TimeSéries Structure: SSA and Related Thechniques. Chapman & hall.
[2] Golyandina, N., Nekrutkin, V., Solntsev, V. “Caterpillar”-SSA Techniquefor Analysis of Time Series in Economics.
[3] Jolliffe, I.T. (2002). Principal Component Analysis. Springer Verlag - NewYork Inc.
[4] Kim, K., Wu, Q. (1998). A comparation study of EOF techniques:analysis of nonstationary data with periodic statistics. Journal of Climate,Vol.12, p.185-199.
[5] Oliveira, I. (2003). Correlated Data in Multivariate Analysis. Ph.D Thesis,University of Aberdeen.
[6] Vautard, R., Yiou, P., Ghil, M. (1992). Singular spectrum analysis: Atoolkit for short noisy chaotic signals. Physica D, Vol.58, p.95-126.