procedimentos automÁticos e semi-automÁticos de regionalizaÇÃo por Árvore geradora mÍnima...
Post on 07-Apr-2016
224 Views
Preview:
TRANSCRIPT
PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO
POR ÁRVORE GERADORA MÍNIMA
Marcos Corrêa NevesGilberto Câmara
Renato M. AssunçãoCorina da Costa Freitas
Objetivos
• Desenvolvimento de um método de regionalização eficiente.– Teoria de Grafo.– Técnicas de otimização.
• Abordagem de regionalização semi-automática:– dirigida pelo usuário.
Regionalização
• Agrupamento de objetos-área em regiões homogêneas e espacialmente contíguas.
Regionalização
• Utilidade do procedimento:– facilitar a análise dos dados.– melhorar a representatividade dos valores dos atributos
e taxas associados aos objetos.– Redução dos efeitos de imprecisão dos atributos e do
posicionamento geográfico dos eventos.
Regionalização via AGM
• Grafo representa a estrutura de vizinhança.• Cada objeto é um vértice.• Objetos vizinhos são ligados por uma aresta.• Custos associados às aresta (medida de
similaridade entre os objetos). • Grafo dá origem a Árvore Geradora Mínima
(árvore de custo mínimo).
Regionalização via AGM
Algoritmo de Prim
Regionalização via AGM
• Fase de “poda” da AGM:– Escolha da aresta que forme dois grupos de objetos
homogêneos.– São retiradas k-1 arestas sucessivamente, formando k
árvores disjuntas. • Medida utilizada:
– Baseada na Soma dos Quadrados dos Desvios (SSD) entre os atributos dos objetos e os valores médios.
Regionalização via AGM
• Soma dos quadrados dos desvios:
m
j
n
ijijT xxSSD
1 1
2
sendo:
n, o número total de objetos (nós) em T;
ijx, o atributo j do objeto i ;m, o número de atributos considerados na análise;jx, o valor médio do atributo j, dado por:
Regionalização via AGM
• Custo da aresta na fase de poda:
ll
TbTaT SSDSSDSSDlarestadacusto
TT
TaTa TbTb
Regionalização via AGM
• Busca exaustiva pela aresta que melhor divide a árvore.
• Para k regiões, k-1 buscas são conduzidas.
Otimização
• Utilização de técnicas de otimização visando a melhorar a eficiência na fase de poda.
• Como um problema de otimização:
Sf :
lTbTa SSDSSDSSDf
},,,{ 121 nSSSS
Otimização
• Elementos de Busca Local (Expansão da Vizinhança e Busca Tabu).
• Duas soluções são vizinhas se suas arestas correspondentes são incidentes em um mesmo vértice.
SS11SS44SS22
SS33
Estratégia de busca
• Passo1: escolher a solução inicial Si em S. Fazer S* = Si ; k* = k = 0; e incluir Si na lista de soluções analisadas (T).
• Passo 2: Fazer k = k + 1. Escolher na lista T a solução que terá a vizinhança expandida, gerando o conjunto de soluções promissoras (V*).
• Passo 3: Avaliar as soluções em V*; escolher a melhor solução, Sj, em V*; Armazenar soluções avaliadas em T.
• Passo 4: Se f(Sj) < f(S*), então: S* = Sj; k* = k.• Passo 5: Verificar condição de parada (k - k* > 8). Senão
satisfeita, voltar ao passo 2.
Estratégia de busca
• Solução que terá a vizinhança expandida:– Solução que apresentar um menor valor para f’ .
– f’ evita busca em ramos da árvore com poucos vértices.
),max(' TbTa SSDSSDf
Estratégia de Busca
Estratégia de Busca
valores de f
0
5
10
15
20
25
30
iteração
f
Estratégia de Busca
• Próximas podas:– Laço de controle externo executado k-1 vezes
• Ponto de partida mais apropriado:– vértice “central”.
• Tende a ter valores de atributos médios;• próximos a solução ótima.
Estratégia de Busca
Vértice central
Regionalização semi-automática
• Os grupos “naturais”:– dependentes de uma série de escolhas:
• relacionadas ao objetivo da classificação.• atributos, medidas de similaridade, algoritmos,
métricas de avaliação, “correção das variáveis”.– Requisitos adicionais para as regiões (número de
objetos, população mínima, extensão da área, ...).
Observações sobre a AGM
• A AGM contém informações que não são visíveis em resultados de classificação:– ramos de similaridade em diferentes níveis, nós-folhas
e vértices centrais (global e locais).– hierarquia entre os objetos.– Possibilidades de fusão (ou subdivisão) de Regiões.
Observações sobre a AGM
Regionalização semi-automática
• O uso da AGM:– Não somente como um passo intermediário e escondido
dentro do processo de regionalização.– Como ferramenta de exploração dos dados.– Como suporte à regionalização guiada pelo usuário:
• Representando o status do processo de regionalização.
• Verificação de ligação válida na fusão de regiões.• Seleção de subconjuntos de objetos similares.
Regionalização semi-automática
• Seleção de regiões:– comparações;– gráficos;– sumários estatísticos;– outras informações.
• Edição das regiões.
Conclusões
• É possível melhorar a eficiência da regionalização via AGM utilizando técnicas de otimização
• A AGM explicita a similaridade entre os objetos;• A AGM torna algumas informações visíveis podendo ser
utilizada como ferramenta em análise exploratória dos dados espaciais.
• A AGM pode funcionar como suporte à regionalização guiada pelo usuário.
top related