extraÇÃo de atributos de forma e seleÇÃo de atributos...
TRANSCRIPT
INPE-14671-TDI/1224
EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS USANDO ALGORITMOS GENÉTICOS PARA
CLASSIFICAÇÃO DE REGIÕES
Joelma Carla Santos
Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. João Ricardo de Freitas Oliveira e Luciano Vieira Dutra, aprovada
em 2 de fevereiro de 2007.
INPE São José dos Campos
2007
Publicado por: esta página é responsabilidade do SID Instituto Nacional de Pesquisas Espaciais (INPE) Gabinete do Diretor – (GB) Serviço de Informação e Documentação (SID) Caixa Postal 515 – CEP 12.245-970 São José dos Campos – SP – Brasil Tel.: (012) 3945-6911 Fax: (012) 3945-6919 E-mail: [email protected] Solicita-se intercâmbio We ask for exchange Publicação Externa – É permitida sua reprodução para interessados.
INPE-14671-TDI/1224
EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS USANDO ALGORITMOS GENÉTICOS PARA
CLASSIFICAÇÃO DE REGIÕES
Joelma Carla Santos
Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. João Ricardo de Freitas Oliveira e Luciano Vieira Dutra, aprovada
em 2 de fevereiro de 2007.
INPE São José dos Campos
2007
519.712 Santos, J. C. Extração de atributos de forma e seleção de atributos usando algoritmos genéticos para classificação de regiões / Joelma Carla Santos. – São José dos Campos: INPE, 2007. 99p. ; (INPE-14671-TDI/1224) 1.Algoritmos genéticos. 2.Extração de atributos. 3.Sensoriamento remoto. 4.Reconhecimento de padrões. 5.Processamento de imagens. 6.Seleção de atributos. 7.Atributos de forma. 8.Classificação de regiões. I.Título
O Senhor é meu pastor, nada me faltará. Em verdes prados ele me faz repousar. Conduz-me junto às águas refrescantes,
restaura as forças de minha alma. Pelos caminhos retos ele me leva,
por amor do seu nome. Ainda que eu atravesse o vale escuro,
nada temerei, pois estais comigo. Vosso bordão e vosso báculo
são o meu amparo. Preparais para mim a mesa
à vista de meus inimigos. Derramais o perfume sobre minha cabeça,
e transborda minha taça. A vossa bondade e misericórdia hão de seguir-me
por todos os dias de minha vida. E habitarei na casa do Senhor
por longos dias.
Salmo 22 (Heb. 23)
A meus pais, Antônio Paschoalito dos Santos e
Florinda Costa Santos. A meu marido,
Oberdan Martins Silva.
AGRADECIMENTOS
Agradeço a Deus, por estar sempre comigo, sendo o alicerce de minha vida. Agradeço aos meus pais por tudo que me ensinaram principalmente nunca fraquejar nos momentos difíceis. Agradeço em especial a minha mãe pelo exemplo de força e perseverança para realizar os sonhos. Ao meu marido Oberdan pelo amor, compreensão, e fundamental apoio. Agradeço aos meus irmãos Luciana e Marcelo e a Tia Deija pelo carinho e por nossa união. Aos meus orientadores Dr. João Ricardo de Freitas Oliveira e Dr. Luciano Vieira Dutra pela serenidade e confiança com que orientaram este trabalho e principalmente pela disponibilidade que tiveram em me atender sempre que necessário. Aos colegas de curso Danilo, Serginho, Adair, Olga, Eva, Karla e Joice Mota pela amizade. Ao meu amigo Sidnei Sant’Anna, pelas boas conversas, brincadeiras e apoio na realização deste trabalho. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq, pelo auxílio financeiro de bolsa de mestrado. Ao Instituto Nacional de Pesquisas Espaciais – INPE, pela oportunidade de realizar este sonho. Ao Departamento de Processamento de Imagens – DPI, pelo ótimo ambiente de trabalho e excelente estrutura física. Aos meus colegas de senzala pelos bons momentos que vivemos e pela grande amizade. Alessandra, Érica, Flavinha, Vantier, Orlando, Annete, Joanito, Marckleuber, Ricardo, Fernanda e Graziela. Valeu pelo companheirismo e as boas rizadas! Obrigada a todos que torceram por mim na realização deste trabalho.
RESUMO
O crescente avanço tecnológico dos sensores remotos tem gerado imagens com alto poder de discriminação de alvos terrestres. Com esta possibilidade, é cada vez maior o número de estudos do sistema urbano usando dados de sensoriamento remoto. Imagens do ambiente urbano apresentam uma alta diversidade espacial e espectral de objetos. Para casos como este, a extração de atributos de forma é necessária para se reconhecer objetos com geometrias diferentes de mesma assinatura espectral. Neste trabalho foram propostos cinco atributos de forma que apresentaram ótimo desempenho no reconhecimento de tais objetos. Uma grande dimensionalidade do espaço de atributos pode causar degradação na classificação, devido à redundância de informações, e um alto custo de processamento. Este trabalho propõe o uso de algoritmos genéticos (AG) para a seleção de atributos. Estes algoritmos se baseiam nos mecanismos de evolução dos seres vivos. Para a busca da melhor solução é utilizada a distância Jeffrerys-Matusita (JM), ou seja, considera-se como melhor solução a que apresenta a maior distância média JM entre os pares de classe. Foram propostos dois algoritmos genéticos distintos: AG binário e AG permutação. A fim de se verificar a eficiência da metodologia proposta, foram realizados testes com uma imagem sintética e uma imagem Quickbird com 0,6m de resolução espacial. Em tais testes foram extraídos 46 atributos das amostras de treinamento. Foram selecionados subconjuntos de atributos de tamanhos 1, 2, 3 e 4, e para todos eles o AG permutação se mostrou um método mais eficiente e robusto do que o AG binário na solução do problema. Com os atributos selecionados foram alcançados coeficientes kappa de 0,8647 a 0,9927. Também foi constatado por esta pesquisa que uma boa classificação não depende apenas dos métodos de seleção de atributos, mas também do classificador utilizado. Este trabalho apresentou a importância da extração de atributos de forma e a necessidade da aplicação dos métodos de seleção de atributos nos sistemas de processamento de imagem.
SHAPE FEATURE EXTRACTION AND FEATURE SELECTION USING GENETIC ALGORITHM FOR REGION CLASSIFICATION
ABSTRACT
Discrimination power of earth surface targets has been continuously bettered with the increasing remote sensors technological advances. Urban systems applications are one of the areas that recently took benefit of these advances, particularly when using high resolution remote sensing data. In this scale, however, it is often necessary to take into account the shape of the objects to achieve a proper identification when separating objects with the same spectral signature. In this work five new shape features have been considered, in addition to those already existing in a system being developed for region classification. In such system, high feature space dimensionality can be readily achieved, which can jeopardize the image classification, due to information redundancy and high processing costs. This work also uses genetic algorithms (GA) as search strategy for feature selection and dimensionality reduction. These algorithms are based on living creatures evolution mechanisms. In order to reach the best solution, the Jeffrerys-Matusita (JM) distance is used as quality criterion. It is considered the best solution the one which presents the greatest JM average distance between pairs of classes. Two distinct genetic algorithms were tested: binary GA and permutation GA. In order to check the efficiency of the proposed methodology, tests were performed with a synthetic image and a Quickbird image with 0,6m of spatial resolution. In such tests 46 features were obtained from training samples. Feature subsets of size 1, 2, 3 and 4, were selected and in all of them the permutation AG showed a better performance than binary GA. With these selected features, kappa coefficient from 0,8647 to 0,9927 were reached. This research showed the importance of shape features for intra-urban classification; also showed an excellent performance of GA algorithms as search strategy, once, using it, a similar quality as exhaustive search was reached, at a fraction of the cost. This work, in a broad perspective, presented the importance of shape feature extraction and the need of an adequate feature selection procedure in image processing systems devoted to region classification.
SUMÁRIO Pág.
LISTA DE FIGURAS
LISTA DE TABELAS
LISTA DE SÍMBOLOS
CAPÍTULO 1 ................................................................................................................ 25
INTRODUÇÃO ............................................................................................................ 25 1.1 Contextualização ...................................................................................................... 25 1.2 Objetivo do trabalho ................................................................................................. 26 1.3 Organização do documento ...................................................................................... 26
CAPÍTULO 2 ................................................................................................................ 29
FUNDAMENTAÇÃO TEÓRICA............................................................................... 29 2.1 Sistema de Processamento de Imagens Texture ....................................................... 29 2.1.1 Pré-Processamento ................................................................................................ 30 2.1.2 Segmentação.......................................................................................................... 31 2.1.3 Extração e Seleção de Atributos............................................................................ 31 2.1.4 Classificação.......................................................................................................... 31 2.2 Extração de Atributos ............................................................................................... 34 2.2.1 Deficiência Convexa ............................................................................................. 34 2.2.2 Assimetria.............................................................................................................. 35 2.2.3 Densidade .............................................................................................................. 36 2.2.4 Direção Principal ................................................................................................... 36 2.2.5 Comprimento da fibra............................................................................................ 37 2.3 Seleção de Atributos................................................................................................. 38 2.3.1 Critérios de Qualidade Sub-Ótimos....................................................................... 39 2.3.2 Algoritmos Genéticos (AG) .................................................................................. 41 2.3.2.1 Representação..................................................................................................... 43 2.3.2.2 Seleção dos Indivíduos ....................................................................................... 44 2.3.2.3 Cruzamento e Mutação....................................................................................... 45 2.3.2.4 Função de Avaliação .......................................................................................... 47
CAPÍTULO 3 ................................................................................................................ 49
MATERIAIS E MÉTODOS........................................................................................ 49 3.1 Extração de Atributos e Imagens de Teste ............................................................... 49 3.1.1 Deficiência Convexa ............................................................................................. 51 3.1.2 Assimetria.............................................................................................................. 53 3.1.3 Densidade .............................................................................................................. 56 3.1.4 Direção Principal ................................................................................................... 58 3.1.5 Comprimento da fibra............................................................................................ 58 3.2 Seleção de Atributos e Imagens de Teste ................................................................. 60 3.3 Classificação das Imagens ........................................................................................ 66
CAPÍTULO 4 ................................................................................................................ 69
RESULTADOS E DISCUSSÕES ............................................................................... 69 4.1 Testes de Extração de Atributos ............................................................................... 69 4.1.1 Deficiência Convexa ............................................................................................. 69 4.1.2 Assimetria.............................................................................................................. 70 4.1.3 Densidade .............................................................................................................. 72 4.1.4 Direção Principal ................................................................................................... 75 4.1.5 Comprimento da fibra............................................................................................ 76 4.2 Testes de Seleção de Atributos................................................................................. 77 4.2.1 Imagem Sintética ................................................................................................... 77 4.2.2 Imagem Quickbird................................................................................................. 84
CAPÍTULO 5 ................................................................................................................ 87
CONCLUSÕES............................................................................................................. 87 5.1 Conclusões................................................................................................................ 87 5.2 Recomendações ........................................................................................................ 88 5.3 Trabalhos Futuros ..................................................................................................... 89
REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................... 91
APÊNDICE A ............................................................................................................... 97
LISTA DE FIGURAS
2.1 Etapas para o processamento de Imagens no Texture ............................................. 30 2.2 – Deficiência convexa do objeto “O”...................................................................... 35 2.3 - Eixo menor e maior da elipse................................................................................ 35 2.4 - Direção principal de um objeto ............................................................................. 37 2.5 Comprimento da fibra de um objeto........................................................................ 37 2.6 Estratégia de Dutra e Huber (1999) para seleção de atributos ................................ 39 2.7 Roleta de cromossomos alocados em fatias proporcionais à aptidão...................... 44 2.8 Crossover de Um-ponto........................................................................................... 45 2.9 Mutação para representação binária ........................................................................ 46 3.1 Atributos do sistema Texture................................................................................... 50 3.2 Conjunto de Pontos do Objeto S.............................................................................. 51 3.3 Região triangular D ................................................................................................. 52 3.4 Círculos para triangulação de dalaunay................................................................... 52 3.5 Triangulação de delaunay........................................................................................ 52 3.6 Imagem Teste Deficiência Convexa........................................................................ 53 3.7 Imagem Teste Deficiência Convexa Rotacionada................................................... 53 3.8 Imagem Teste Assimetria ........................................................................................ 56 3.9 Imagem Teste Assimetria Rotacionada ................................................................... 56 3.10 Imagem Teste Densidade A................................................................................... 57 3.11 Imagem Teste Densidade B................................................................................... 57 3.12 Imagem Teste Densidade A Rotacionada.............................................................. 57 3.13 Imagem Teste Densidade B Rotacionada.............................................................. 57 3.14 Imagem Teste Direção Principal ........................................................................... 58 3.15 (a) Fronteira digital com uma grade de reamostragem sobreposta; (b) resultado da
eamostragem; (c) código da cadeia direcional de vizinhança 4 e (d) do código da cadeia direcional de vizinhança 8........................................................................... 59
3.16 Imagem Teste Comprimento da fibra.................................................................... 60 3.17 Imagem Teste Comprimento da fibra Rotacionada............................................... 60 3.18 Interface de seleção de atributos............................................................................ 63 3.19 Imagem sintética teste AG..................................................................................... 65 3.20 Imagem Quickbird teste AG.................................................................................. 65 3.21 Segmentação da imagem Quickbird ...................................................................... 65 4.1 Distribuição das amostras de treinamento para o atributo deficiência convexa...... 70 4.2 Imagem Teste Deficiência Convexa Classificada ................................................... 70 4.3 Imagem Teste Deficiência Convexa Rotacionada Classificada .............................. 70 4.4 Distribuição das amostras de treinamento para o atributo assimetria ..................... 71 4.5 Imagem Teste Assimetria Classificada.................................................................... 71 4.6 Imagem Teste Assimetria Rotacionada Classificada .............................................. 71 4.7 Distribuição das amostras de treinamento para a imagem teste densidade A ......... 72 4.8 Distribuição das amostras de treinamento para a imagem teste densidade B ......... 73 4.9 Imagem Teste Densidade A Classificada ................................................................ 73 4.10 Imagem Teste Densidade B Classificada .............................................................. 73
4.11 Imagem Teste Densidade A Rotacionada Classificada ......................................... 74 4.12 Imagem Teste Densidade B Rotacionada Classificada ......................................... 74 4.13 Imagem Teste Densidade A Classificada com Circularidade ............................... 74 4.14 Imagem Teste Densidade B Classificada com Circularidade................................ 74 4.15 Distribuição das amostras de treinamento para o atributo direção principal......... 75 4.16 Classificação Imagem Teste Direção Principal ..................................................... 75 4.17 Distribuição das amostras de treinamento para o atributo comprimento da fibra . 76 4.18 Imagem Teste Comprimento da fibra Classificada ............................................... 76 4.19 Imagem Teste Comprimento da fibra Rotacionada Classificada .......................... 76 4.20 Dispersão da adaptação dos indivíduos ................................................................. 80 4.21 Adaptação dos indivíduos AG Binário.................................................................. 81 4.22 Adaptação dos indivíduos AG Pemutação ............................................................ 82 4.23 Evolução da população para os AG binário e permutação.................................... 83 4.24 Imagem sintética teste AG classificada................................................................. 84 4.25 Classificação com atributos selecionados pelo AG Permutação........................... 85 4.26 Imagem Quickbird classificada com 46 atributos ................................................. 85
LISTA DE TABELAS
2.1 Exemplo de matriz de classificação (pixels)............................................................ 33 3.1 Descrição interface de seleção de atributos............................................................. 64 3.2 Atributos extraídos das regiões de treinamento....................................................... 66 4.1 Valores máximos e mínimos para o atributo direção principal ............................... 75 4.2 Resultado busca exaustiva de escolha fixa .............................................................. 77 4.3 Atributos selecionados pelos AG permutação e binário.......................................... 78
LISTA DE SIGLAS E ABREVIATURAS
AG - Algoritmo genético
ENVI - Enviroment for Visualizing Images
GIS - Sistema de Informação Geográfica
IDL - Interactive Data Language
JM - Jeffreys-Matusita
PMX - Partially matched crossover
ROI - Region of interest
SBS - Sequential Backward Feature Selection
SFS - Sequential Forward Feature Selection
LISTA DE SÍMBOLOS
π - Número PI
℮ - Exponencial
25
CAPÍTULO 1
INTRODUÇÃO
1.1 Contextualização
Os avanços tecnológicos cada vez maiores na área de sensores remotos têm gerado
imagens com maior poder de discriminação de alvos da superfície terrestre. Com a
possibilidade de discriminação de alvos urbanos, torna-se maior o número de aplicações
dos dados de sensoriamento remoto para estudos relativos ao sistema urbano (Donnay et
al., 2001) e aumenta-se a precisão das informações obtidas a partir deles (Souza et al.,
2003).
Para tratamento e obtenção de informações das imagens são usados sistemas de
processamento de imagens que abrangem operações como aquisição, armazenamento,
processamento e visualização. A operação de processamento pode envolver várias
etapas como pré-processamento, segmentação, extração de atributos, seleção de
atributos e classificação (Marques Filho; Vieira Neto, 1999). O foco deste trabalho é
direcionado às etapas de extração e seleção de atributos.
Extrair atributos significa extrair medidas associadas ao objeto que se deseja
reconhecer, de forma que essas medidas sejam semelhantes para objetos semelhantes e
diferentes para objetos distintos. Extrair medidas de forma dos objetos é uma importante
ferramenta para discriminar objetos de uma cena que possuem a mesma aparência
espectral com geometrias diferentes. No caso de cenas urbanas, a análise da forma se
torna ainda mais significativa uma vez que os objetos construídos pelo homem possuem
em geral formas geométricas bem definidas.
Uma grande dimensionalidade do espaço de atributos pode causar degradação na
classificação e um alto custo de processamento. O objetivo dos algoritmos de seleção de
atributos é escolher o menor subconjunto que ofereça a melhor classificação em
conformidade com custos computacionais razoáveis.
26
O método de classificação utilizado neste trabalho é a classificação por regiões.
Região é um conjunto de pixels contíguos pertencentes a um objeto. Os classificadores
de região utilizam, além da informação espectral de cada pixel, a informação espacial
que envolve a relação entre os pixels e seus vizinhos (Andrade et al., 2003a) (Gonzales;
Woods, 2000).
1.2 Objetivo do trabalho
O objetivo deste trabalho é aplicar métodos de extração e seleção de atributos para
classificação de regiões.
Pretende-se extrair medidas de forma das regiões da imagem, a fim de reconhecer
objetos intra-urbanos, principalmente arruamentos em imagens de sensoriamento
remoto de alta resolução espacial. Para isto são propostos cinco atributos: deficiência
convexa, assimetria, densidade, direção principal e comprimento da fibra.
Pretende-se selecionar atributos usando algoritmos genéticos. Os algoritmos
genéticos são métodos de busca e otimização baseados na evolução dos seres vivos
(Goldberg, 1989). Estes algoritmos partem do princípio que os indivíduos mais
adaptados ao seu ambiente são os que possuem maior chance de sobreviver e gerar
descendentes.
1.3 Organização do documento
Esta dissertação possui mais quatro capítulos, conforme descrito abaixo:
Capítulo 2: apresenta o conceito do sistema de processamento de imagens utilizado
neste trabalho e as técnicas desenvolvidas para extração e seleção de atributos.
Capítulo 3: descreve os materiais e métodos utilizados para o desenvolvimento das
técnicas de extração e seleção de atributos.
Capítulo 4: mostra os resultados e discussões dos testes realizados para verificação da
eficiência das técnicas propostas.
27
Capítulo 5: expõe as conclusões da aplicação das técnicas e sugere trabalhos futuros.
28
29
CAPÍTULO 2
FUNDAMENTAÇÃO TEÓRICA
Os métodos de extração e seleção de atributos utilizados na classificação de imagens
digitais constituem os pontos principais neste trabalho. Os métodos de extração são
direcionados a imagens urbanas de alta resolução. Para uma melhor compreensão
teórica destes métodos, uma breve descrição de imagens do espaço intra-urbano e as
etapas de seu processamento são apresentadas a seguir.
2.1 Sistema de Processamento de Imagens Texture
O ambiente urbano representa uma das áreas mais desafiadoras para o sensoriamento
remoto devido à alta diversidade espacial e espectral dos objetos presentes na superfície
da Terra (Herold et al., 2003). Áreas urbanas são compostas por numerosos materiais
(concreto, asfalto, metal, plástico, vidro, telhas, água, grama, árvores, arbustos e solo)
arranjados por seres humanos de diversas maneiras para construção de casas, sistemas
de transporte, indústrias, edifícios, áreas de recreação (Welch, 1982). A riqueza de
detalhes de uma imagem urbana de alta resolução torna o processamento dessas
imagens algo complexo e custoso.
O sistema de processamento de imagens Texture – A region classifier using
textural measures fornece um ambiente amigável ao usuário para extração e análise de
medidas texturais de imagens, e realiza a classificação de regiões baseada na pré-
seleção de medidas (Rennó et al., 1998) (www.dpi.inpe.br/texture). No trabalho
desenvolvido por Oliveira (2005) foram acrescentadas ao sistema funções de extração e
análise de medidas de formas tais como área, perímetro, complexidade e circularidade
além de alguns algoritmos para seleção de atributos. Na Figura 2.1 são mostradas etapas
típicas para análises de imagens neste sistema, onde as caixas brancas significam
resultados e entradas, as caixas azuis funções existentes hoje no sistema e as caixas
amarelas são funções realizadas fora do sistema Texture.
30
FIGURA 2.1 Etapas para o processamento de Imagens no Texture
2.1.1 Pré-Processamento
Uma imagem digital pode apresentar diversas imperfeições, tais como: presença de
pixels ruidosos, contraste e/ou brilho inadequados. As imagens podem ser corrompidas
por ruídos durante a aquisição ou durante a transmissão da imagem. A função da etapa
de pré-processamento é aprimorar a qualidade da imagem para etapas posteriores
(Marques Filho et al., 1999). O processo de correção das imperfeições nas imagens é
construído a partir do conhecimento a priori do fenômeno que causou a degradação.
Assim, técnicas de restauração são orientadas para a modelagem da degradação e
31
aplicação do processo inverso no sentido de recuperar a imagem original (Gonzales et
al., 2000).
2.1.2 Segmentação
A segmentação é um processo em que uma imagem é subdividida em partes ou objetos
constituintes (Andrade et al., 2003a). Estas partes ou objetos constituintes são regiões
conexas e homogêneas (Salembier; Marqués, 1999). Técnicas para segmentação de uma
imagem são encontradas em (Gonzales et al., 2000) e (Souza Júnior, 2005).
É importante ressaltar que a segmentação possui um papel muito importante na
classificação de regiões. O bom resultado de uma classificação de regiões é altamente
dependente de um bom resultado de segmentação.
2.1.3 Extração e Seleção de Atributos
O objetivo da extração de atributos é caracterizar medidas associadas com o objeto que
se deseja extrair, de forma que as medidas sejam similares para objetos similares e
diferentes para objetos distintos (Duda et al., 2001). O processo de extração de atributos
é fundamental para a obtenção de bons resultados na classificação, pois nesta fase é
criado o conjunto de características usado para a realização de treinamento e
classificação.
A seleção de atributos pode ser vista como um processo de busca onde o algoritmo
usado deve encontrar o menor subconjunto de atributos com a melhor acurácia de
classificação (Pappa, 2002). Uma grande dimensionalidade do espaço de atributos pode
causar degradação na classificação e um alto custo de processamento. Uma descrição
mais detalhada dos métodos de extração e seleção de atributos é apresentada nas seções
2.3 e 2.4.
2.1.4 Classificação
A classificação de imagens de sensoriamento remoto é um importante processo para
a produção de mapas temáticos, e uma das principais fontes de dados para os sistemas
32
de informações geográficas (Andrade et al., 2002). O sensoriamento remoto urbano não
é somente um ponto de encontro para ciências sociais e físicas, mas sim um campo de
pesquisa que forma uma ponte entre o sensoriamento remoto e o GIS – Sistema de
Informação Geográfica (Donnay et al., 2001).
O processo de classificação de uma imagem digital consiste na associação de
cada um dos seus pixels a um “rótulo” que descreve um objeto da superfície terrestre
gerando uma nova imagem onde é associada uma cor para cada classe, e todos os pixels
pertencentes a esta classe possuem a mesma cor. O resultado desta operação é um mapa
temático mostrando a distribuição geográfica das classes que compõem a cena
classificada.
Os métodos de classificação se dividem em duas categorias: a classificação
supervisionada e a não-supervisionada. A supervisionada, adotada pelo sistema Texture,
refere-se ao processo de classificação que usa um conjunto de amostras de treinamento
para classificar a imagem, enquanto que na classificação não-supervisionada o processo
de classificação não requer conhecimento a priori das classes em estudo. Alguns
exemplos de algoritmos de classificação supervisionada são: método da máxima
verossimilhança, planos discriminantes de Fisher, redes neurais. Na classificação não-
supervisionada as técnicas geralmente ad hoc, são baseadas na procura de agrupamentos
naturais no corpo de dados usando medidas de similaridade no processo de classificação
(Webb, 2002). Alguns exemplos são: isodata e k-médias.
No sistema Texture a classificação é aplicada a regiões previamente
identificadas. Os classificadores por regiões utilizam, além da informação espectral de
cada pixel, a informação espacial que envolve a relação entre os pixels e seus vizinhos.
Estes classificadores procuram simular o comportamento de um foto-intérprete ao
reconhecer áreas homogêneas de imagens, baseadas nas propriedades espectrais e
espaciais das imagens. Classificar regiões permite calcular medidas morfológicas das
feições que são essenciais na classificação de áreas de transporte e edificações (Carleer;
Wolff, 2006). A grande vantagem de classificar regiões é que o número de parâmetros
considerados na classificação pode aumentar, pois, além dos dados espectrais, é possível
33
descrever cada região usando parâmetros de forma, textura e associação entre objetos.
Com isto, os objetos podem ser mais adequadamente descritos. A grande desvantagem é
que o resultado, um mapa temático, é altamente dependente da segmentação, e os erros
de segmentação não podem ser corrigidos na classificação (Miqueles et al., 2003).
Um dos métodos existentes para avaliação de uma classificação é o cálculo do
coeficiente Kappa. Este coeficiente foi introduzido por (Cohen, 1960), sendo obtido a
partir da matriz de classificação, também conhecida como matriz de confusão ou matriz
de erros, que fornece a distribuição de pixels classificados correta e erroneamente. A
matriz de classificação é uma matriz quadrada capaz de mostrar a exatidão do resultado
de uma classificação, comparando este resultado com a verdade de campo, sendo esta
verdade dada por uma imagem ou por amostras que tomamos como representação da
realidade. Um exemplo de matriz de classificação dos pixels de uma imagem 400x400 é
ilustrado na Tabela 2.1.
TABELA 2.1 Exemplo de matriz de classificação (pixels) Verdade terrestre (Pixels)
Classe Vegetação Rua Construção Total
Vegetação 105690 0 0 105690 Rua 0 22875 0 22875 Construção 0 54 31381 31435 Total 105690 22929 31381 160000
O coeficiente Kappa k̂ é calculado pela Equação 2.1, onde n é o número de
pontos amostrados e r é o número de classes. O sinal de mais, representa a soma dos
elementos na linha/coluna correspondente.
∑
∑∑
=++
=++
=
−
−= r
iii
r
iii
r
iii
xxn
xxxnk
1
2
11ˆ (2.1)
34
Para a matriz de classificação apresentada na Tabela 2.1, n = 160000 e r = 3,
logo k̂ = 0,9993.
Quando todos os elementos da matriz de classificação, fora da diagonal principal,
possuem valor nulo, o coeficiente Kappa alcançará o seu maior valor possível, no caso
1, o que significa um desempenho excelente. Quando nenhum dos pontos for
classificado corretamente, teremos o valor de Kappa igual a -1. Quanto menor o valor
do índice Kappa, pior é o desempenho do classificador.
Esse coeficiente foi desenvolvido para classificações ponto a ponto e não regiões,
embora utilizado neste trabalho vale ressaltar que existem questões a serem superadas
em relação ao uso deste coeficiente para classificações de regiões.
2.2 Extração de Atributos
Os atributos de forma são ferramentas poderosas para a discriminação de objetos que
possuem a mesma aparência espectral (Andrade et al., 2002). A análise da forma do
objeto é de fundamental importância para estudos relacionados com o espaço urbano.
Construções e asfalto na maioria das vezes apresentam aparência espectral muito
similar, o que dificulta a discriminação entre esses objetos. Essa dificuldade pode ser
menor se for levado em consideração que construções possuem uma forma retangular,
ao contrário do asfalto que possui uma forma mais alongada.
2.2.1 Deficiência Convexa
O fecho convexo “H” de um objeto “O” de uma imagem é o menor conjunto
convexo que contiver “O”. A diferença entre os conjuntos “H” e “O” é chamada
deficiência convexa “D” do objeto “O”. A área achurada na Figura 2.2 ilustra a
deficiência convexa do objeto “O”.
35
FIGURA 2.2 – Deficiência convexa do objeto “O”
A descrição de uma região pode basear-se na área de sua deficiência convexa, no
número de componentes de sua deficiência convexa, na posição relativa desses
componentes e assim por diante.
2.2.2 Assimetria
O atributo assimetria k (Asymmetry no eCongnition1) descreve o grau de alongamento
de um objeto a partir da relação entre o eixo menor n e o eixo maior m da elipse que
envolve este objeto. Quanto maior o comprimento de um objeto da imagem, maior é
essa relação (assimetria). Para o cálculo deste atributo usa-se a elipse que melhor se
ajusta ao objeto ou elemento analisado. O valor de k permanece no intervalo de 0 a 1.
mnk −= 1 (2.2)
FIGURA 2.3 - Eixo menor e maior da elipse
1 eCognition – Object Oriented Image Analysis é um software utilizado para classificação de imagens. Informações sobre esse software podem ser encontradas em sua homepage no endereço: http://www.definiens-imaging.com/
36
Os eixos desta elipse podem ser obtidos através da análise por componentes
principais (Richards, 1998). A partir dos valores das coordenadas dos pixels de uma
região é possível calcular a média e a matriz de covariância para cada região. A partir da
matriz de covariância (de dimensão igual a 2), podem ser estimados os dois autovalores
e os respectivos autovetores. Os autovetores estimam a direção dos dois eixos da elipse
gaussiana que descreve a distribuição dos dados e os autovalores o comprimento destes
eixos (variância nestas direções) (Andrade; Centeno, 2003b).
2.2.3 Densidade
Um outro atributo de forma utilizado no eCognition é o density d. A densidade
pode ser calculada segundo Equação 2.3,
)()(1 yVarxVarnd
++= (2.3)
onde n é o número de pixels que forma o objeto e Var(x) e Var(y) são as variâncias das
coordenadas x e y respectivamente. Quanto mais um objeto possui a forma arredondada,
maior a sua densidade.
2.2.4 Direção Principal
O atributo de direção principal de um objeto, também existente no eCognition, é
a direção do autovetor pertencente ao maior dos autovalores derivados da matriz de
covariância das coordenadas do objeto (Gonzales et al., 2000). Na Figura 2.4 a direção
do objeto pertence ao autovetor de cor vermelha.
37
FIGURA 2.4 - Direção principal de um objeto
2.2.5 Comprimento da fibra
Uma maneira de medir o comprimento aproximado de um objeto é através do parâmetro
conhecido como comprimento da fibra (Fiber Length). A Figura 2.5 ilustra esta medida.
FIGURA 2.5 Comprimento da fibra de um objeto
Segundo (Russ, 1991) uma das maneiras de se estimar é utilizando a Equação
2.4:
PerímetroÁreaPerímetrofibradaocompriment ∗−∗= 25,0 (2.4)
A demonstração do comportamento desta equação para as formas de círculo, quadrado e
retângulo encontra-se no Apêndice A.
38
2.3 Seleção de Atributos
Quando a dimensionalidade do espaço de atributos é grande, isso pode resultar em dois
tipos de problema (Bishop, 1995):
• Alto custo de processamento
• Geração do fenômeno conhecido como maldição da dimensionalidade
A maldição da dimensionalidade (ou fenômeno de Hughes) está ligada à
degradação na acurácia dos resultados da classificação com o aumento da
dimensionalidade dos dados, mantendo constante o número de amostras de treinamento
(Tadjudin; Landgrebe, 1998).
Em um maior nível de abstração, a seleção de atributos pode ser dividida em duas
partes: o método de busca e a função de avaliação usada para medir a qualidade dos
subconjuntos de atributos (Pappa, 2002). Os algoritmos de busca para seleção de
atributos são divididos em três grupos: exponenciais (busca exaustiva), seqüenciais e
randômicos (algoritmos genéticos) (Boz, 2002).
A busca exaustiva é o melhor critério de busca, pois são geradas todas as
combinações possíveis de atributos. Normalmente é um método inviável
computacionalmente devido ao seu tempo de processamento crescer exponencialmente
com o aumento do número de atributos disponíveis (Pappa et al., 2002).
Segundo Dutra e Huber (1999), os métodos seqüenciais de seleção de atributos
mais proeminentes são: Sequential Forward Feature Selection (SFS) e Sequential
Backward Feature Selection (SBS). No trabalho desenvolvido por (Oliveira, 2005),
foram implementados os métodos SFS, SBS e um algoritmo de escolha fixa do
subconjunto de atributos. Para todos esses métodos, o critério de qualidade adotado para
avaliação do melhor subconjunto foi a distância média Jeffreys-Matusita. Mais detalhes
em (Oliveira, 2005; Oliveira et al., 2005). Os algoritmos genéticos (método randômico)
será descrito no item 2.4.2.
39
O melhor critério de qualidade para avaliação dos subconjuntos de atributos é o
mínimo erro, onde as imagens são classificadas segundo os subconjuntos selecionados e
considera-se como o melhor subconjunto, aquele que apresenta a maior exatidão na
classificação. Adotar os critérios ótimos de busca e qualidade simultaneamente são
métodos “caros” computacionalmente devido ao tempo de processamento crescer
exponencialmente com o aumento do número de atributos. Possíveis soluções são adotar
critérios de busca “baratos (sub-ótimos)” com critérios de qualidade “caros (ótimos)”,
ou critérios de busca ótimos e qualidade sub-ótimos, ou ainda critérios de busca e
qualidade sub-ótimos. Dutra e Huber (1999) mencionam a estratégia a ser usada para
seleção de atributos, quando a dimensionalidade é muito alta, segundo a seguinte
seqüência da Figura 2.6.
FIGURA 2.6 Estratégia de Dutra e Huber (1999) para seleção de atributos
O objetivo dos algoritmos de seleção de atributos é escolher o menor subconjunto
que ofereça a melhor classificação em conformidade com custos computacionais
razoáveis.
2.3.1 Critérios de Qualidade Sub-Ótimos
Visando otimizar o conjunto de atributos para minimizar a probabilidade de erro na
classificação, deve-se maximizar a distância entre padrões ou atributos de classes
diferentes em tempo de escolha do atributo. Os critérios de qualidade são utilizados para
medir esta distância entre as classes no espaço de atributos. Abaixo são citados alguns
possíveis critérios de qualidade sub-ótimos.
40
• Distância Euclidiana: distância no espaço de atributos n-dimensional entre dois
pontos x = (x1, x2, ..., xn) e y = (y1, y2, ..., yn) definida por:
∑ =−=
n
i iie xyyxD1
2)(),( (2.5)
onde n representa o número de atributos.
• Distância de Mahalanobis: medida de similaridade entre o ponto (X) e o
centróide de uma distribuição. Essa medida depende da matriz de covariância
)(][)()( 1ii
tii XXxM µµ −−= −∑ (2.6)
onde µi é o vetor de média, centro da distribuição (Duda et al., 2001). e [Σi]-1
representa a inversa da matriz de covariância.
A distância de Mahalanobis entre duas classes é expressa de forma similar como
(Bow, 1984, , 1992):
)(][)( 1ji
tjiijM µµµµ −−= −∑ (2.7)
onde µi e µj são os vetores de média e [Σ]-1 é a inversa da matriz de média
ponderada das matrizes de covariância Σi e Σj (Chernoff, 1972).
• Distância de Bhattacharyya: medida de divergência entre duas populações
estatísticas definida por suas distribuições de probabilidade. Para o caso
Gaussiano a distância é dada por:
(2.8)
onde Σk e Σi são as matrizes de covariância das classes k e i, µk e µi são os
respectivos vetores de média (Bhattacharyya, 1943).
Para selecionar os atributos com base em distância entre classes, é necessário
definir uma função critério que possa avaliar a separabilidade entre todas as classes de
uma maneira global. A função critério para a maioria das distâncias citadas acima pode
ik
ik
ikikt
ikkiB∑∑
∑+∑
+−⎥⎦⎤
⎢⎣⎡ ∑+∑
−=−
2ln21)(
2)(
81 1
µµµµ
41
ser efetuada por uma simples operação de soma, média, desvio padrão e outras
características estatísticas entre os pares de classes existentes (Dutra; Huber, 1999). É
desejável que a função critério seja maior quanto menor for a redundância entre os
atributos e quanto maior for a facilidade de discriminar padrões de classes diferentes.
A distância Jeffreys-Matusita (JM) é uma transformação da distância de
Bhattacharyya de forma a limitar a influência da distância entre classes totalmente
separáveis, que no caso da distância de Bhattacharyya pode chegar a infinito (Dutra et
al., 1999). A distância JM entre as classes k e i é dada por:
)2,0[)1(2 ∈−= − JMeJM kiBki (2.9)
onde Bki representa a distância de Bhattacharyya entre as classes k e i. Segundo a
equação 2.9 a distância JM é limitada para o intervalo entre 0 e √2 sendo √2 para classes
totalmente separáveis. Para a seleção do subconjunto de atributos com maior
separabilidade entre as classes, pode-se usar a maior distância média JM entre os pares
de classes como função critério.
2.3.2 Algoritmos Genéticos (AG)
Algoritmos genéticos são métodos de busca e otimização baseados nos mecanismos de
evolução dos seres vivos. Foram desenvolvidos por John Holland, seus colegas e alunos
da Universidade de Michigan (Goldberg, 1989) , e popularizados por um de seus alunos,
David Goldberg. Estes algoritmos baseiam-se no processo da seleção natural e
sobrevivência dos mais aptos. Segundo o naturalista Charles Darwin, os indivíduos mais
adaptados ao seu ambiente são os que possuem maior chance de sobreviver e gerar
descendentes.
A otimização é um processo de busca visando a solução ótima ou sub-ótima de
problemas. Muitas vezes a otimização consiste em procurar várias soluções possíveis e
utilizar a informação obtida neste processo a fim de encontrar soluções cada vez
melhores (Lacerda; Carvalho, 1999a).
42
Os algoritmos genéticos iniciam seu processamento sobre uma população inicial de
candidatos explorando de forma paralela diferentes áreas do espaço de solução
(Goldberg, 1989). Como resultado, tais técnicas têm maior chance de atingir as áreas
mais promissoras do espaço de busca. Os AG têm se mostrado muito eficientes para
busca de soluções ótimas, ou aproximadamente ótimas, em diversos problemas das mais
variadas áreas (Carvalho et al., 2003).
Como foi dito anteriormente, o primeiro passo de um AG é a geração de uma
população inicial de indivíduos caracterizados por seus cromossomos que codificam as
possíveis soluções do problema. Durante o processo evolutivo, esta população é
avaliada e cada cromossomo recebe um valor, calculado pela função de aptidão,
refletindo sua habilidade de adaptação a determinado ambiente. Os cromossomos mais
aptos são selecionados e os menos aptos são descartados (Darwinismo). Os indivíduos
selecionados sofrem cruzamentos e mutações, gerando descendentes para a população
da próxima geração. Este processo é repetido até que uma solução satisfatória seja
encontrada (Goldberg, 1989) (Lacerda; Carvalho, 1999b). O Algoritmo 2.1 ilustra esse
procedimento.
Algoritmo 2.1: Algoritmo Genético
1: t = 0;
2: gerar população inicial P(t);
3: enquanto critério de parada não for satisfeito faça
4: para todo indivíduo i da população atual P(t) faça
5: Avaliar aptidão do indivíduo i;
6: fim para
7: t = t + 1;
8: Seleção, cruzamento e mutação a partir de P(t-1) para gerar nova população P(t);
9: fim enquanto
43
2.3.2.1 Representação
Um AG processa populações de indivíduos ou cromossomos. Um cromossomo é uma
estrutura de dados, geralmente um vetor ou uma cadeia de bits que representa uma
possível solução do problema a ser otimizado (Carvalho et al., 2003; Goldberg, 1989;
Lacerda et al., 1999b). O cromossomo representa o conjunto de parâmetros da função
de avaliação, também conhecida como função-objetivo, cuja resposta será maximizada
(ou minimizada). Se o cromossomo representa n parâmetros da função-objetivo, então o
espaço de busca possui n dimensões. O conjunto de todas as configurações que um
cromossomo pode adotar forma o espaço de busca (Lacerda et al., 1999a).
Quando o genótipo de um cromossomo é representado por um vetor binário,
cada elemento do vetor é um dígito binário (0 ou 1). Uma vez escolhida a representação
do cromossomo em vetores binários, os operadores genéticos são aplicados de forma
independente do problema, facilitando o uso dos AG em diferentes classes de
problemas. Essa característica de independer de parâmetros específicos do domínio do
problema determina a qualidade de robustez do algoritmo. Para facilitar a compreensão,
ao longo do texto esta forma de codificação será chamada de AG binário. Um exemplo
de cromossomo com esta representação é:
Cromossomo = 10111010011111011
Outra maneira de representar um cromossomo é através de uma lista de
elementos. Fazendo-se permutações em uma lista de elementos é possível criar vários
cromossomos. Permutações de n elementos são seqüências desses n elementos sem que
nenhum seja repetido. Para facilitar a compreensão em todo o texto esta forma de
codificação será chamada de AG permutação. Exemplos de dois cromossomos com os
elementos 1, 2, 3, 4 e 5 são:
Cromossomo A: 35142
Cromossomo B: 42351
44
2.3.2.2 Seleção dos Indivíduos
O AG começa com uma população inicial de n cromossomos. Quando não existe
nenhum conhecimento prévio sobre a região do espaço de busca onde se encontra a
solução do problema, na maioria das vezes, a população inicial é gerada de forma
aleatória. A cada cromossomo desta população é atribuído um valor dado pela função de
aptidão. Esta função recebe como entrada a codificação do cromossomo e fornece como
resultado sua aptidão (Carvalho et al., 2003). A partir dessa avaliação são selecionados
os indivíduos que serão submetidos ao cruzamento.
O método de seleção da roleta é o mais simples e também o mais utilizado
(Carvalho et al., 2003). Segundo Goldberg (1989), cada indivíduo possui uma fatia da
roleta proporcional à sua adaptação, que também representa a sua probabilidade de
seleção (Grefenstett, 1997). Este processo pondera as chances de seleção pelo valor da
adaptação, como ilustra a Figura 2.7 que por simplicidade considera uma população de
apenas quatro indivíduos de codificação binária.
11000 49,20%
01000 5,50%
10011 30,90%
01101 14,40%
FIGURA 2.7 Roleta de cromossomos alocados em fatias proporcionais à aptidão
Para a seleção dos indivíduos, a roleta é girada um determinado número de
vezes, definido pelo tamanho da população. A cada giro da roleta um indivíduo é
selecionado, tendo maior chance aqueles que possuem as maiores fatias.
45
2.3.2.3 Cruzamento e Mutação
Os operadores de cruzamento (crossover) e mutação são os principais mecanismos
dos AG para explorar regiões desconhecidas do espaço de busca. O crossover consiste
basicamente em misturar o material genético de dois indivíduos da população (pais),
produzindo dois novos indivíduos (filhos) que herdam características dos pais. O
crossover é aplicado com uma dada probabilidade a cada par de cromossomos
selecionados. Esta probabilidade, denominada de taxa de crossover, varia entre 60% e
90%. Não ocorrendo o crossover, os filhos serão iguais aos pais (isto permite que
algumas soluções sejam preservadas).
No cruzamento de Um-ponto, cada um dos cromossomos pais tem sua cadeia de
bits cortada em um ponto aleatório, produzindo duas partes cada cromossomo. As partes
são trocadas, gerando dois novos cromossomos (Goldberg, 1989).
FIGURA 2.8 Crossover de Um-ponto
Existem vários operadores genéticos para o AG permutação (Goldberg, 1989),
sendo um deles o crossover PMX. O crossover PMX se inicia com a escolha aleatória
de dois pontos de corte que definem uma sublista entre estes pontos. São realizadas
trocas no sentido de pai1 para pai2 e depois no sentido inverso para evitar cromossomos
inválidos. Este procedimento é ilustrado no exemplo seguinte. Considere os seguintes
pais e os dois cortes:
pai1 1 2 3 4 6 5 7 pai2 3 5 7 1 4 6 2
46
A primeira troca é feita no início da sublista, no sentido pai1, para pai2: 3 de pai1 é
trocado por 7 de pai2. Esta troca gera elementos duplicados, logo ao mesmo tempo 3 de
pai2 é trocado com 7 de pai1.
pai1 1 2 7 4 6 5 3 pai2 7 5 3 1 4 6 2
O procedimento também ocorre na segunda posição da sublista: 4 de pai1 é trocado com
1 de pai2. Simultaneamente 4 de pai2 é trocado com 1 de pai1.
pai1 4 2 7 1 6 5 3 pai2 7 5 3 4 1 6 2
Seguindo o mesmo processo, 6 de pai1 é trocado com 1 de pai2, e 6 de pai2 é trocado
com 1 de pai1. O resultado final é dado por:
pai1 4 2 7 6 1 5 3 pai2 7 5 3 4 6 1 2
A operação de mutação evita a convergência prematura do algoritmo, in-
troduzindo na busca novas regiões do espaço de soluções (Oliveira, 1998). Desta
maneira, assegura-se que a probabilidade de se chegar a qualquer ponto do espaço de
busca nunca será zero (Carvalho et al., 2003). Para o AG binário, o operador de
mutação inverte os valores de bits, ou seja, muda o valor de um dado bit de 1 para 0 ou
de 0 para 1.
FIGURA 2.9 Mutação para representação binária
Um dos métodos de mutação para o AG permutação consiste na escolha de dois
elementos do cromossomo de forma aleatória trocando suas posições.
Cromossomo: 1 2 3 4 6 5 7 Após a mutação: 1 6 3 4 2 5 7
47
A operação de mutação é feita com probabilidade baixa para cada gene do
cromossomo, algo em torno de um para mil, para não descaracterizar as boas soluções
encontradas até aquele momento (Goldberg, 1989; Oliveira, 1998). Nos AG, cada gene
representa um dos parâmetros codificados no cromossomo.
Não há um critério único para terminar a execução de um algoritmo genético.
Portanto podem ser usadas diferentes estratégias de parada, como por exemplo: após um
dado número de gerações; ou quando a aptidão média ou a do melhor indivíduo não
apresentar mais melhoras significativas; ou quando as aptidões dos indivíduos de uma
população se tornarem muito parecidas. Quando se conhece a resposta máxima da
função objetivo, é possível utilizar este valor como critério de parada (Carvalho et al.,
2003), porém muitas vezes não é garantido que se atinja tal valor.
Como os AG são de natureza estocástica, boas soluções podem deixar de ser
selecionadas para gerar descendência (Bittencourt, 1998) . Uma maneira de se evitar
isto é usar o conceito de elitismo, onde as n melhores soluções de uma geração passarão
automaticamente para a próxima. É importante observar que o melhor cromossomo
pode ser perdido de uma geração para outra devido ao corte do crossover ou à aplicação
da mutação. Por isso, pode ser interessante transportar os melhores cromossomos de
uma geração para outra, sem alterações (Lacerda et al., 1999b).
2.3.2.4 Função de Avaliação
A função de avaliação é utilizada para determinar o quão boa é uma solução
candidata para a resolução efetiva de um problema (Pappa, 2002). A escolha de uma
função de avaliação apropriada é um passo essencial para o sucesso de uma aplicação de
AG (Oliveira, 1998; Vafaie; De Jong, 1992, , 1993). Esta deve ser escolhida para cada
problema a ser resolvido (Beasley et al., 1993). A função de avaliação oferece ao AG
uma resposta sobre a aptidão de cada indivíduo da população (Goldberg, 1989) . O AG
usa esta informação para direcionar o processo de busca para a melhor solução (Vafaie
et al., 1993). O desempenho de um AG está condicionado à qualidade da avaliação da
adaptação dos indivíduos (Oliveira, 1998).
48
No caso deste trabalho, a função de avaliação usada é a distância média Jeffreys-
Matusita dada pela equação 2.9.
49
CAPÍTULO 3
MATERIAIS E MÉTODOS
Este capítulo apresenta a descrição dos algoritmos e interfaces criadas no sistema
Texture para o desenvolvimento deste trabalho. O sistema Texture foi desenvolvido na
linguagem IDL (Interactive Data Language) com o uso de funções do ENVI
(Enviroment for Visualizing Images). Este capítulo também ilustra as imagens sintéticas
e de sensoriamento remoto utilizadas na validação dos métodos de extração e seleção
dos atributos propostos. As imagens sintéticas foram usadas a fim de se obter um
completo controle sobre as regiões existentes na mesma, tanto na análise geométrica
como nos valores espectrais.
3.1 Extração de Atributos e Imagens de Teste
Os classificadores de regiões permitem considerar variantes geométricas e topológicas
como distância, perímetro, área, forma, conexão e textura para a realização das
classificações. O sistema Texture possui métodos de extração de atributos de textura e
forma divididos em quatro grupos: Distribucional, Co-ocorrência, Autocorrelação e
Forma (Oliveira, 2005). O sistema Texture foi desenvolvido para a linha de pesquisa de
processamento de imagens podendo ser utilizado em imagens de diferentes sensores
para diversas aplicações, como nas áreas médica e metalúrgica. Na Figura 3.1 é
apresentado um diagrama com todos os atributos existentes no sistema. As caixas em
vermelho destacam os atributos implementados neste trabalho.
50
FIGURA 3.1 Atributos do sistema Texture
As medidas extraídas de regiões das imagens são registradas em estruturas de dados
do tipo vetor. Utilizam-se esses vetores na seleção de atributos e na etapa de
classificação, examinando-se as distribuições estatísticas de cada atributo na distinção
das classes. Em conseqüência, a eficiência dos resultados apresentados pelo sistema está
diretamente ligada à delimitação das regiões através do processo de segmentação e da
aquisição dos ROIs (Region of interest) a partir do ENVI. A seguir serão descritos os
atributos de forma implementados neste trabalho.
51
3.1.1 Deficiência Convexa
Para cálculo da deficiência convexa usou-se o algoritmo quidkhull para determinar os
pontos pertencentes ao fecho convexo do objeto (Barber et al., 1996). Após isso foi feita
a triangulação de delaunay a partir dos pontos do fecho convexo. A área convexa foi
calculada somando-se a área de cada triângulo encontrado pela triangulação de
delaunay. Subtraiu-se a área convexa da área do objeto obtendo-se desta forma a área da
deficiência convexa do objeto. A área do objeto, que corresponde à quantidade de pixels
do objeto, foi calculada pela função já existente no sistema Texture (Oliveira, 2005).
O primeiro passo do quickhull é determinar quatro pontos extremos do conjunto
de pontos que forma o objeto S, esquerda, direita, acima e abaixo, ou seja, os quatro
pontos com máximas e mínimas ordenadas e abscissas. Posteriormente estes quatro
pontos são conectados formando um quadrilátero. Todos os pontos no interior deste
quadrilátero são descartados. Também é definido um retângulo envolvente mínimo para
o conjunto de pontos. Neste momento deve-se encontrar os pontos extremos nos quatro
triângulos definidos entre o quadrilátero inicial e o retângulo envolvente.
FIGURA 3.2 Conjunto de Pontos do Objeto S
Sabendo que para cada triângulo existem dois pontos pertencentes ao fecho
convexo, deve-se encontrar qual ponto contido no triângulo está mais distante do
segmento formado por estes pontos extremos, formando um novo triângulo. Na Figura
3.3, a região triangular D construída pelo passo inicial contém quatro pontos. Um
triângulo é formado entre os extremos já conhecidos e o mais distante deles, que é
naturalmente pertencente ao fecho convexo. Os pontos internos do triângulo D são
52
descartados, e as novas arestas do triângulo servem de base para a construção de novos
triângulos, recursivamente, até que nenhum ponto seja mais encontrado no interior ou
exterior (Barber et al., 1996) (Davis Jr.; Carvalho, 1999).
FIGURA 3.3 Região triangular D
Na triangulação de delaunay para uma dada distribuição de pontos deve-se
encontrar todos os triângulos definidos por três pontos da distribuição, de tal forma que
um círculo passando por estes três pontos não inclua nenhum outro ponto, conforme
Figura 3.4 (Davis Jr. et al., 1999).
FIGURA 3.4 Círculos para triangulação de dalaunay
Para cada conjunto de três pontos, deve-se gerar-se um triângulo conforme
Figura 3.5.
FIGURA 3.5 Triangulação de delaunay
53
Para realização dos testes deste atributo foi usada uma imagem de 500x500
pixels ilustrada na Figura 3.6 com três amostras para cada classe. A imagem foi
rotacionada conforme Figura 3.7 e processada com as mesmas amostras da Figura 3.6 a
fim de se verificar se o atributo é invariante em rotação.
Amostras: Rua = * Não-Rua = * FIGURA 3.6 Imagem Teste Deficiência
Convexa
FIGURA 3.7 Imagem Teste Deficiência Convexa Rotacionada
3.1.2 Assimetria
Implementou-se o atributo assimetria conforme Equação 2.2. Como dito anteriormente,
para o cálculo dos eixos da elipse foi usada a análise por componentes principais. A
análise por componentes principais é uma maneira de identificar padrões em dados. Os
passos seguidos para o cálculo foram:
1. Obter os dados das coordenadas x e y do objeto
2. Calcular a matriz de covariância entre as coordenadas. A covariância é
medida entre duas dimensões. A covariância entre uma dimensão e ela
mesma é chamada de variância.
54
)1())((
),cov( 1
−
−−= ∑ =
nyyxx
yxn
i ii
(3.1)
onde,
cov(x,y) = covariância entre duas dimensões =x média das coordenadas da dimensão x =y média das coordenadas da dimensão y n = número total de coordenadas logo, a matriz de covariância M é dada por:
⎥⎦
⎤⎢⎣
⎡=
),cov(),cov(),cov(),cov(
yyxyyxxx
M (3.2)
3. Calcular os autovetores e autovalores da matriz de covariância. Os
autovetores possuem comprimento igual a 1 e são ortogonais. O autovetor
de maior autovalor associado corresponde à componente principal do
conjunto de dados. Dizemos que um vetor y0 é um autovetor de uma matriz
quadrada M se M * y0 resulta num múltiplo de y0, ou seja, em λ * y0.
Dada a matriz de covariância ⎥⎦
⎤⎢⎣
⎡=
dcba
M e considerando λ um autovalor
de M, deve existir um vetor não nulo ⎥⎦
⎤⎢⎣
⎡=
0
00 y
xy , tal que M * y0 = λ * y0
Esta equação pode ser reescrita como:
⎩⎨⎧
=+=+
000
000
yydxcxybxa
λλ
(3.3)
que é equivalente ao sistema:
55
( )
( )⎩⎨⎧
=−+=+−
00
00
00
ydxcybxa
λλ
(3.4)
Uma vez que x0 e y0 não podem ser iguais a zero simultaneamente, então o
determinante do sistema é igual a zero. Isto é,
( )
( ) ( )( ) 0det =−−−=⎟⎟⎠
⎞⎜⎜⎝
⎛−
−bcda
dcba
λλλ
λ (3.5)
que se reduz à equação algébrica,
( ) 02 =−++− cbdada λλ (3.6)
A Equação 3.6 é uma equação de segundo grau cujas raízes são os
autovalores da matriz M. Para encontrar os autovetores correspondentes
substituem-se os autovalores assim encontrados, no sistema de equações
dado por 3.4.
Para realização dos testes deste atributo foi usada uma imagem de 400x400
pixels ilustrada na Figura 3.8 com nove amostras para cada classe. A imagem foi
rotacionada conforme Figura 3.9 e processada com as mesmas amostras da Figura 3.8 a
fim de verificar se o atributo é invariante em rotação.
56
Amostras: Rua = * Não-Rua = * FIGURA 3.8 Imagem Teste Assimetria
FIGURA 3.9 Imagem Teste Assimetria Rotacionada
3.1.3 Densidade
Implementou-se o atributo densidade conforme Equação 2.3, calculando as variâncias
das coordenadas x e y conforme Equação 3.1.
Para a realização dos testes deste atributo foram usadas duas imagens de
900x900 pixels ilustradas na Figuras 3.10 e 3.11 com três amostras para cada classe
(círculo, quadrado, retângulo e elipse). As imagens foram rotacionadas conforme
Figuras 3.12 e 3.13 e processadas com as mesmas amostras das Figuras 3.10 e 3.11
respectivamente a fim de verificar se o atributo é invariante em rotação.
57
Amostras: Círculo = * Quadrado = * Retângulo = * Elipse = *
FIGURA 3.10 Imagem Teste Densidade A
Amostras: Círculo = * Quadrado = * Retângulo = * Elipse = *
FIGURA 3.11 Imagem Teste Densidade B
FIGURA 3.12 Imagem Teste Densidade A Rotacionada
FIGURA 3.13 Imagem Teste Densidade B Rotacionada
58
3.1.4 Direção Principal
Implementou-se o atributo direção principal conforme equações 3.4 e 3.6. Para
realização dos testes deste atributo foi usada uma imagem de 500x500 pixels ilustrada
na Figuras 3.14 com cinco amostras para cada classe.
Amostras: Norte sul = * Leste oeste = * Sudoeste nordeste = * Sudeste noroeste = *
FIGURA 3.14 - Imagem Teste Direção Principal
3.1.5 Comprimento da fibra
Implementou-se o atributo comprimento da fibra conforme Equação 2.4. Para esta
equação foi usado o perímetro externo do objeto e a área correspondente a este
perímetro. Para estes cálculos foi utilizado o algoritmo find_boundary, um programa
open source desenvolvido por David Fanning (2006). Este algoritmo encontra os pixels
de borda de uma região para o cálculo do perímetro e calcula a área correspondente
(Fanning, 2006) (Russ, 1995). Para encontrar os pixels de borda este algoritmo se baseia
no algoritmo código de cadeia (Gonzales et al., 2000).
O algoritmo código de cadeia é usado para representar as fronteiras de regiões
através de segmentos de retas de tamanho e direção específicos. Esta representação
baseia-se tipicamente na 4- ou 8-conectividade, e a direção de cada segmento é
codificada usando-se um esquema de numeração chamado código de Freeman. Imagens
digitais são adquiridas e processadas em um formato de grade, com espaçamento
59
uniforme nas direções x e y. Desta forma, um código de cadeia pode ser gerado pela
perseguição no sentido horário dos segmentos que ligam cada par de pixels e atribuindo
o código de direção a cada segmento.
FIGURA 3.15 (a) Fronteira digital com uma grade de reamostragem sobreposta; (b)
resultado da reamostragem; (c) código da cadeia direcional de vizinhança 4 e (d) do código da cadeia direcional de vizinhança 8
Na Figura 3.15 (c) o código de cadeia é representado por 0033. . . 01 e em (d)
por 0766. . . 12. Evidentemente a precisão da representação depende do espaçamento da
grade utilizada.
Encontrados os pixels de borda, que são os pixels pertencentes ao perímetro, o
algoritmo find_boundary utiliza o método de Russ (1995) para encontrar a área
correspondente. Este método retorna a área de um polígono sendo dadas as coordenadas
de seus vértices. Considera-se o primeiro ponto do polígono conectado ao último ponto,
logo:
60
Área = 1/2 * [ x1y2 + x2y3 + x3y4 +...+x(n-1)yn + xny1 - y1x2 - y2x3 -...-y(n-1)xn -
ynx1) (3.7)
Para realização dos testes deste atributo foi usada uma imagem de 400x400
pixels, ilustrada na Figura 3.16 com nove amostras para cada classe. A imagem foi
rotacionada conforme a Figura 3.17 e processada com as mesmas amostras da Figura
3.16 a fim de verificar se o atributo é invariante em rotação.
Amostras: Rua = * Não-Rua = * FIGURA 3.16 Imagem Teste
Comprimento da fibra
FIGURA 3.17 Imagem Teste Comprimento da fibra
Rotacionada
3.2 Seleção de Atributos e Imagens de Teste
Para a realização da seleção de atributos neste trabalho foram usados dois algoritmos
genéticos diferentes: AG binário e AG permutação.
Como dito anteriormente, no AG binário o genótipo de um cromossomo é
representado por um vetor binário onde cada elemento do vetor é um dígito binário (0
ou 1). Um cromossomo de tamanho l corresponde a um vetor binário de atributos, onde
cada bit representa a presença ou ausência do atributo associado. Logo Xi = 0 representa
a ausência e Xi = 1 representa a presença do i-ésimo atributo (Vafaie et al., 1992, ,
1993). Para este AG foi usado o cruzamento de um ponto e mutação conforme descrito
na seção 2.4.2.3.
61
Conforme seção 2.4.2.1, para o AG permutação a representação do cromossomo
é feita através de uma lista de elementos que representam todos os atributos
considerados. Cada permutação em uma lista de elementos gera um cromossomo
diferente. Permutações de n elementos são seqüências desses n elementos sem que
nenhum seja repetido. Para este AG foi usado o cruzamento PMX e mutação conforme
descrito na seção 2.4.2.3.
Para situações, como a deste trabalho, onde foi necessário restringir o tamanho S
do subconjunto que se deseja encontrar, no AG permutação considerou-se apenas as S
primeiras posições para o cálculo da aptidão do cromossomo:
No caso do AG binário aplica-se um fator de penalização na expressão da função de
aptidão quando o número de atributos presentes no cromossomo não corresponde ao
tamanho S do subconjunto de atributos desejado. A função adotada neste trabalho foi:
openalizaçãsSd
openalizaçãc aptidaobaptidao // *−= (3.8)
onde b = constante de penalização dada pelo usuário; d = número de bits acesos; S =
tamanho do subconjunto de atributos desejado.
Não há um critério único para terminar a execução de um algoritmo genético; os
critérios utilizados neste trabalho foram: determinação do número de gerações ou
melhoras não significativas após C gerações, através da condição:
NCNN XKXX <− − (3.9)
onde XN = média da aptidão da população N; C = constante dada pelo usuário; K =
percentual de adaptação com valores entre 0 e 1, dado pelo usuário.
62
Nos dois AG implementados, para a avaliação de um indivíduo, como dito
anteriormente, foi usada a distância média Jeffreys-Matusita (JM) entre os pares de
classes; logo, para seleção dos indivíduos a roleta, método de seleção adotado, é alocada
com as respectivas distâncias, tendo mais chances de serem selecionados os indivíduos
que possuem os maiores valores. É considerado como melhor, o indivíduo que possui a
maior distância média Jeffreys-Matusita (JM) entre os pares de classes. Também para os
dois AG foi implementado o elitismo, onde o melhor indivíduo de uma geração é
passado para geração seguinte sem qualquer modificação.
A interface para seleção de atributos no sistema Texture é mostrada na Figura 3.18
e descrita na Tabela 3.1.
63
FIGURA 3.18 Interface de seleção de atributos
64
TABELA 3.1 Descrição interface de seleção de atributos 1 Conjunto de atributos 2 Tamanho do subconjunto 3 Métodos de seleção de atributos desenvolvidos por (Oliveira, 2005) 4 Tipo de AG 5 Constante de penalização para o AG binário (b da Equação 3.8) 6 Tamanho da população 7 Critétio da parada 8 Número de gerações para o critério de parada generation number ou constante C
(Equação 3.9) para critério de parada no improvements 9 Percentual de adaptação. Variável K da Equação 3.9 10 Taxas de crossover e mutação 11 Botão de execução do AG 12 Botão Limpar 13 Apresentação do subconjunto selecionado 14 Botão de Ok 15 Botão para cancelar
Um aspecto relevante nas interfaces do sistema Texture é a possibilidade da
aplicação dos métodos de seleção de atributos de forma iterativa, ou seja, podem-se usar
os métodos seqüenciais existentes ou os AG na seleção de um subconjunto de atributos,
e posteriormente usar o método de busca exaustiva de escolha fixa (Oliveira, 2005). Isso
se torna importante pois a complexidade dos métodos de busca exaustiva cresce
exponencialmente, impossibilitando o seu uso para um número alto de atributos.
Para avaliação dos resultados dos AG foram realizados testes em uma imagem
sintética e em uma imagem Quickbird de São José dos Campos com 0,6 m de resolução
espacial. Para as duas imagens foram colhidas amostras das classes “Rua” e “Não-Rua”.
A imagem sintética de 400x400 pixels é ilustrada na Figura 3.19 com nove amostras
para cada classe. A imagem Quickbird 280x280 pixels é ilustrada na Figura 3.20 com as
cinco amostras usadas para cada classe. O teste foi realizado com a banda G da imagem.
A segmentação da imagem Quickbird na Figura 3.21 foi feita manualmente dada a
necessidade de se ter uma segmentação com formas bem definidas. O bom desempenho
de um classificador de regiões é altamente dependente de uma boa segmentação.
65
Amostras: Rua = * Não-Rua = * FIGURA 3.19 Imagem sintética teste AG
Amostras: Rua = * Não-Rua = * FIGURA 3.20 Imagem Quickbird teste
AG
FIGURA 3.21 Segmentação da imagem Quickbird
Utilizou-se para a seleção de atributos todos os atributos disponíveis no sistema
conforme Figura 3.1. Para os atributos de co-ocorrência (Oliveira, 2005) utilizou-se uma
matriz 3x3. A Tabela 3.2 ilustra todos os atributos extraídos das regiões de treinamento.
66
TABELA 3.2 Atributos extraídos das regiões de treinamento F1 média (dist) F24 cluster prominense (cooc) F2 variância (dist) F25 média do vetor soma (cooc) F3 desvio padrão (dist) F26 variância do vetor soma (cooc) F4 desvio absoluto da média (dist) F27 entropia do vetor soma (cooc) F5 assimetria (dist) F28 energia do vetor soma (cooc) F6 curtose (dist) F29 média do vetor diferença (cooc) F7 coeficiente de variação (dist) F30 variância do vetor diferença (cooc) F8 mediana (dist) F31 entropia do vetor diferença (cooc) F9 entropia (dist) F32 energia do vetor diferença (cooc) F10 energia (dist) F33 contraste do vetor diferença (cooc) F11 média da log-normal (dist) F34 área (shape) F12 variância da log-normal (dist) F35 perímetro (shape) F13 desvio padrão da log-normal (dist) F36 complexidade (shape) F14 alpha da k-intensidade (dist) F37 circularidade (shape) F15 alpha da k-amplitude (dist) F38 direção principal (shape) F16 contraste (cooc) F39 assimetria (shape) F17 entropia (cooc) F40 densidade (shape) F18 energia (cooc) F41 comprimento da fibra (shape) F19 homogeniedade (cooc) F42 deficiência convexa (shape) F20 correlação (cooc) F43 lag 1,-1 (auto) F21 dissimilariadade (cooc) F44 lag 1, 0 (auto) F22 chi-quadrado (cooc) F45 lag 1, 1 (auto) F23 cluster shade (cooc) F46 lag 0, 1 (auto)
3.3 Classificação das Imagens
Todas as classificações realizadas nos testes deste trabalho foram feitas com o
classificador de distância euclidiana já disponível no sistema Texture. Para avaliação
dessas classificações foi usado o coeficiente kappa conforme seção 2.2.4. Para o cálculo
do coeficiente kappa da classificação de todas as imagens sintéticas usadas neste
trabalho foram usadas imagens de referência. Já para a imagem Quickbird foram usadas
amostras de referência conforme Figura 3.22.
67
Amostras: Rua = * Não-Rua = * FIGURA 3.22 Amostras de referência
68
69
CAPÍTULO 4
RESULTADOS E DISCUSSÕES
O objetivo deste capítulo é avaliar e discutir os resultados encontrados na aplicação dos
métodos de extração e seleção de atributos propostos neste trabalho.
4.1 Testes de Extração de Atributos
Os resultados encontrados nos experimentos realizados utilizando imagens sintéticas
para a avaliação dos atributos de forma propostos são apresentados a seguir.
4.1.1 Deficiência Convexa
O atributo deficiência convexa apresentou bom resultado na separabilidade das classes:
Rua *; Não-Rua *; conforme Figura 4.1. Esta figura ilustra uma interface do sistema
Texture que, utilizando os dados das amostras de treinamento, é capaz de apresentar
visualmente a separabilidade entre classes para um determinado atributo. O eixo x do
gráfico (groups) representa as classes, e o eixo y os valores encontrados para as
amostras de treinamento segundo o atributo que está sendo analisado. No caso da Figura
4.1 Groups: 1 = Rua; 2 = Não-Rua. Vale ressaltar que os valores mínimos e máximos
extraídos das amostras de treinamento para as classes foram: Rua: 9399,50 e 19710,0
respectivamente; Não-Rua: 0 e 0.
O valor do coeficiente kappa encontrado para a classificação (Figura 4.2),
usando a imagem de referência, foi igual a 1. O teste realizado na imagem rotacionada
verificou que este atributo é invariante em rotação conforme Figura 4.3.
70
1 = Rua 2 = Não-Rua
FIGURA 4.1 Distribuição das amostras de treinamento para o atributo deficiência convexa
FIGURA 4.2 Imagem Teste Deficiência Convexa Classificada
FIGURA 4.3 Imagem Teste Deficiência Convexa Rotacionada
Classificada
4.1.2 Assimetria
O atributo assimetria apresentou bom resultado na separabilidade das classes: Rua *;
Não-Rua *; conforme Figura 4.4, onde Groups: 1 = Rua; 2 = Não-Rua.
71
O valor do coeficiente kappa encontrado para a classificação (Figura 4.5),
usando a imagem de referência, foi igual a 0,9853. O teste realizado na imagem
rotacionada verificou que este atributo é invariante em rotação conforme Figura 4.6.
1 = Rua 2 = Não-Rua
FIGURA 4.4 Distribuição das amostras de treinamento para o atributo assimetria
FIGURA 4.5 Imagem Teste Assimetria Classificada
FIGURA 4.6 Imagem Teste Assimetria Rotacionada Classificada
72
4.1.3 Densidade
A classificação da imagem da Figura 3.10 apresentou um coeficiente kappa, calculado a
partir da imagem de referência, de 0,8177. A separabilidade entre as classes pode ser
vista na Figura 4.7, onde Groups: 1 = Quadrado; 2 = Retângulo; 3 = Círculo; 4 = Elipse.
1 = Quadrado 2 = Retângulo 3 = Círculo 4 = Elipse
FIGURA 4.7 Distribuição das amostras de treinamento para a imagem teste densidade A
Observa-se nas Figuras 4.7 e 4.9 que houve uma confusão entre as elipses e
retângulos. A classificação da imagem da Figura 3.11 apresentou um coeficiente kappa,
também calculado a partir da imagem de referência, de 0,7938. A separabilidade entre
as classes para a Figura 3.11 pode ser vista na Figura 4.8, onde Groups: 1 = Quadrado;
2 = Retângulo; 3 = Círculo; 4 = Elipse. Observa-se na Figura 4.10 que houve uma
confusão entre as elipses e retângulos; círculos e quadrados.
Com estes testes verifica-se que o atributo densidade é bom para distinguir objetos
redondos dos demais objetos, mas para isso a área de todos esses objetos precisa ter
valores próximos. Isso pode ser visto na Figura 4.9. Quando formas iguais possuem
áreas diferentes acontece uma confusão (Figura 4.10). Logo, verifica-se que o bom
desempenho deste atributo está ligado à área dos objetos considerados.
Nas Figuras 4.13 e 4.14 são mostradas as mesmas imagens teste classificadas com o
atributo circularidade (compactness) já existente no sistema Texture (Oliveira, 2005). O
73
atributo circularidade consegue separar os círculos dos demais objetos,
independentemente da área. Logo, para se reconhecer objetos redondos em imagens, o
atributo circularidade se apresenta mais apropriado.
Os testes realizados com o atributo densidade nas imagens rotacionadas mostraram
que este atributo é invariante em rotação conforme Figuras 4.11 e 4.12 .
1 = Quadrado 2 = Retângulo 3 = Círculo 4 = Elipse
FIGURA 4.8 Distribuição das amostras de treinamento para a imagem teste densidade B
FIGURA 4.9 Imagem Teste Densidade A Classificada
FIGURA 4.10 Imagem Teste Densidade B Classificada
74
FIGURA 4.11 Imagem Teste Densidade A Rotacionada Classificada
FIGURA 4.12 Imagem Teste Densidade B Rotacionada Classificada
FIGURA 4.13 Imagem Teste Densidade A Classificada com Circularidade
FIGURA 4.14 Imagem Teste Densidade B Classificada com Circularidade
75
4.1.4 Direção Principal
O atributo direção principal apresentou ótimo resultado na separabilidade das classes:
Norte sul *; Leste oeste *; Sudoeste nordeste *; Sudeste noroeste *; conforme Figura
4.15. Os valores mínimos e máximos extraídos das amostras de treinamento para as
classes estão na Tabela 4.1. O valor do coeficiente kappa encontrado para a
classificação (Figura 4.16), usando a imagem de referência, foi igual a 1.
TABELA 4.1 Valores máximos e mínimos para o atributo direção principal Classe Mínimo Máximo Norte sul (Groups: 1) 1,57080 1,570802 Leste oeste (Groups: 2) 0 0 Sudoeste nordeste (Groups: 3) 0,987170 1,19999 Sudeste noroeste (Groups: 4) 2,17496 2,35619
1 = Norte sul 2 = Leste oeste 3 = Sudoeste
nordeste 4 = Sudeste noroeste
FIGURA 4.15 Distribuição das amostras de treinamento para o atributo direção principal
FIGURA 4.16 Classificação Imagem Teste Direção Principal
2 Trabalhou-se com até oito casas decimais para checar a evolução do AG. Deve-se notar que o pequeno número de amostras disponíveis para o cálculo da distância JM não permite a confiança na existência de um grande número de algarismos significativos.
76
4.1.5 Comprimento da fibra
O atributo comprimento da fibra apresentou ótimo resultado na separabilidade das
classes: Rua *; Não Rua *; conforme Figura 4.17, onde Groups: 1 = Rua; 2 = Não-Rua.
O valor do coeficiente kappa encontrado para a classificação (Figura 4.18), usando a
imagem de referência, foi igual a 1. O teste realizado na imagem rotacionada verificou
que este atributo é invariante em rotação conforme Figura 4.19.
1 = Rua 2 = Não-Rua
FIGURA 4.17 Distribuição das amostras de treinamento para o atributo comprimento da fibra
FIGURA 4.18 Imagem Teste Comprimento da fibra Classificada
FIGURA 4.19 Imagem Teste omprimento da fibra Rotacionada Classificada
77
4.2 Testes de Seleção de Atributos
Os resultados encontrados nos experimentos realizados utilizando uma imagem sintética
e uma imagem de sensoriamento remoto para a avaliação dos métodos de seleção de
atributos propostos são apresentados a seguir.
4.2.1 Imagem Sintética
A Tabela 4.2 apresenta os resultados alcançados na seleção de atributos, usando o
método de busca exaustiva de escolha fixa (Oliveira, 2005) existente no sistema
Texture, e da classificação da imagem da Figura 3.19 usando os respectivos atributos
selecionados. A fim de se facilitar o entendimento, no decorrer do texto os atributos
selecionados por este método serão chamados de solução ideal.
TABELA 4.2 Resultado busca exaustiva de escolha fixa Qtd Atributos Atributos Selecionados * Média JM Kappa
1 F37 1,3238615 0,9993 2 F37, F40 1,41414986 0,9996 3 F36, F37, F39 1,41421334 0,9794 4 F1, F37, F40, F43 1,41421356 0,9927
* As siglas referem-se aos atributos descritos na Tabela 3.2
A Tabela 4.3 ilustra os resultados alcançados na seleção de atributos usando os AG
permutação e binário. Os parâmetros usados para os AG foram: população = 900
indivíduos; taxa de crossover = 0,6; taxa de mutação = 0,0333; critério de parada =
melhoras não significativas com C = 5 e K = 0,01 (Equação 3.9); constante de
penalização = 0,7 (Equação 3.8).
Para a seleção de um atributo, com o AG permutação foi possível chegar à solução
ideal com um número menor de gerações.
Na seleção de dois atributos, o AG permutação alcançou a solução com a
quantidade de atributos desejada pelo usuário em 10 gerações. Com os mesmos
parâmetros o AG binário não encontrou a solução com a quantidade de atributos
desejada pelo usuário gastando ainda para isto 16 gerações. Vale ressaltar que o método
do AG permutação sempre apresentará ao usuário, independente dos parâmetros
78
utilizados, uma solução com a quantidade de atributos escolhida por ele. Com o método
do AG binário isto não acontece, tal como a seleção de dois atributos deste teste, mas
uma vez ajustados novos parâmetros o AG binário convergirá eficientemente para a
solução desejada. Os diversos parâmetros que envolvem a implementação de um AG
precisam ser ajustados de modo a otimizar o desempenho do algoritmo . Em geral este
ajuste é feito por tentativa-e-erro através da realização de testes (Oliveira, 1998).
TABELA 4.3 Atributos selecionados pelos AG permutação e binário
AG Qtd Atributos
Atributos Selecionados *
Número de Gerações
Alcançado Média JM Kappa
Binário F37 42 1,3238615 0,9993 Permutação 1 F37 9 1,3238615 0,9993
Binário F37 16 1,85340604 0,9993 Permutação 2 F37, F40 10 1,41414986 0,9996
Binário F35, F37, F36 16 1,41420174 0,9993 Permutação 3 F36, F37, F39 8 1,41421334 0,9794
Binário F25, F35, F37, F40 14 1,41421334 0,9966 Permutação 4 F1, F37, F40, F43 9 1,41421356 0,9927
* As siglas referem-se aos atributos descritos na Tabela 3.2
Para a seleção de três atributos, o AG permutação alcançou a solução ideal com um
número menor de gerações. É importante observar nesse exemplo que o subconjunto
que apresentou a maior distância média JM não foi o que apresentou o maior coeficiente
kappa na classificação. Isso se deve ao fato de que métodos de seleção que utilizam
distâncias estatísticas garantem uma boa separabilidade entre as classes, mas uma boa
classificação depende também do classificador utilizado.
Na seleção de quatro atributos, o AG permutação encontrou a solução com um
número menor de gerações, sendo esta a solução ideal. Para encontrar a solução ideal,
no método da busca exaustiva de escolha fixa, foram analisadas 163.185 combinações
possíveis de atributos, enquanto o AG permutação encontrou a solução analisando 8.100
(tamanho da população x número de gerações alcançado). Para a seleção de quatro
atributos com o AG permutação, gráficos de dispersão da adaptação entre os indivíduos
79
da população inicial, e das populações da 5a e da 9a geração são apresentados na Figura
4.20.
Para uma noção mais clara a respeito da convergência dos AG, as Figuras 4.21 e
4.22 mostram o comportamento da adaptação do melhor indivíduo (máximo) e da média
da população em função da geração para os AG binário e permutação respectivamente.
Os gráficos da Figura 4.23 mostram de modo conjunto, para os AG permutação e
binário, a evolução da média da adaptação dos indivíduos, e a evolução do máximo
indivíduo da população, respectivamente.
É importante observar que no caso do AG permutação a população inicial, ainda
que formada de modo aleatório, possui todos os indivíduos com excelente aptidão uma
vez que seus cromossomos já satisfazem o critério do tamanho do subconjunto de
atributos. No caso do AG binário, a sua população inicial, também gerada de forma
aleatória, possui cromossomos com todos os tamanhos de subconjuntos de atributos,
fazendo com que a aptidão média seja muito baixa. No entanto, dirigido pelas
penalizações aos cromossomos inadequados, o AG binário evolui eficientemente para a
solução desejada.
80
Dispersão da Adaptação da População Inicial
0
0,2
0,4
0,60,8
1
1,2
1,4
1,6
0 100 200 300 400 500 600 700 800 900
Índice do Indivíduo
Aptid
ão
Dispersão da Adaptação da População na 5a geração
00,2
0,40,60,8
11,2
1,41,6
0 100 200 300 400 500 600 700 800 900
Índice do Indivíduo
Apt
idão
Dispersão da Adaptação da População na 9a Geração
00,2
0,40,60,8
11,2
1,41,6
0 100 200 300 400 500 600 700 800 900
Índice do Indivíduo
Apt
idão
FIGURA 4.20 Dispersão da adaptação dos indivíduos
81
Evolução do Máximo no AG Binário
00,2
0,40,6
0,81
1,21,4
1,6
1 2 3 4 5 6 7 8 9 10 11 12 13 14Geração
Apt
idão
Evolução da Média da População no AG Binário
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1 2 3 4 5 6 7 8 9 10 11 12 13 14Geração
Apt
idão
FIGURA 4.21 Adaptação dos indivíduos AG Binário
82
Evolução do Máximo no AG Permutação
1,41421281,41421291,414213
1,41421311,41421321,41421331,41421341,41421351,4142136
1 2 3 4 5 6 7 8 9
Geração
Apt
idão
Evolução da Média da População no AG Permutação
1,26
1,27
1,28
1,29
1,3
1,31
1,32
1 2 3 4 5 6 7 8 9
Geração
Apt
idão
FIGURA 4.22 Adaptação dos indivíduos AG Pemutação
83
Evolução do Máximo da População
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Geração
Apt
idão
PermutaçãoBinário
Evolução da Média da População
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Geração
Apt
idão
PermutaçãoBinário
FIGURA 4.23 Evolução da população para os AG binário e permutação
Baseado nos resultados dos testes realizados verifica-se que o AG permutação se
mostrou um método mais eficiente e robusto do que o AG binário na solução do
problema.
A imagem classificada (Figura 4.24) com os quatro atributos selecionados pelo AG
permutação alcançou um coeficiente kappa de 0,9927.
84
FIGURA 4.24 Imagem sintética teste AG classificada
4.2.2 Imagem Quickbird
No teste da imagem Quickbird, para a seleção de três atributos foi utilizado o AG
permutação com os seguintes parâmetros: população = 1.000 indivíduos; taxa de
crossover = 0,6; taxa de mutação = 0,0333; critério de parada = melhoras não
significativas com C = 5 e K = 0,01. O subconjunto selecionado (Perímetro, cluster
prominence e média do vetor soma) possui aptidão de 1,41421356.
A classificação realizada com os atributos encontrados pelo AG permutação é
mostrada na Figura 4.25. O coeficiente kappa encontrado para esta classificação foi de
0,9663. Como dito anteriormente, para o cálculo deste coeficiente foram usadas
amostras de referência ilustradas na Figura 3.22.
Para comparação com o resultado do AG permutação também foi feita uma
classificação com três atributos que foram selecionados pela busca exaustiva de escolha
fixa (Oliveira, 2005). Os atributos selecionados, segundo Tabela 3.2, foram F40, F41 e
F45. Esta classificação obteve um coeficiente Kappa de 0,8647 calculado também com
as amostras de referência da Figura 3.22.
Na Figura 4.26 é mostrada a classificação da imagem Quickbird usando todos os
quarenta e seis atributos extraídos das regiões de treinamento (Tabela 3.2). Observa-se
85
nesta classificação uma degradação muito grande, ou seja, o número de regiões
classificadas corretamente é menor do que na Figura 4.25.
FIGURA 4.25 Classificação com atributos selecionados pelo AG Permutação
FIGURA 4.26 Imagem Quickbird Classificada com 46 atributos
86
87
CAPÍTULO 5
CONCLUSÕES
5.1 Conclusões
Os objetivos propostos neste trabalho foram alcançados uma vez que os algoritmos de
extração de atributos de forma e seleção de atributos obtiveram resultados bastante
eficientes.
Os atributos de forma desenvolvidos obtiveram resultados eficientes nos testes
realizados com imagens sintéticas. Estes testes comprovam a viabilidade da utilização
desses atributos em análise de imagens. O atributo densidade se apresentou menos
eficiente que o atributo circularidade no reconhecimento de objetos arredondados de
tamanhos diferentes. Exceto o atributo de direção principal, todos os demais se
mostraram invariantes em rotação.
No processo de classificação, uma quantidade alta de atributos pode não aumentar a
precisão do classificador; isso acontece devido à redundância das informações. Os
resultados obtidos neste trabalho mostram a viabilidade em se utilizar métodos de
seleção de atributos, objetivando a redução da dimensionalidade sem haver perda no
poder discriminatório entre as classes. Os AG binário e permutação, propostos neste
trabalho, mostraram seu poder ao encontrar boas soluções, porém como dito
anteriormente, o AG permutação se mostrou um método mais eficiente e robusto do que
o AG binário na solução deste problema.
Também é importante dizer que se obter uma boa classificação não depende apenas
dos métodos de seleção de atributos, mas também do classificador utilizado. Um dos
exemplos foi a classificação feita na imagem Quickbird de São José dos Campos, onde
foi selecionada pela busca exaustiva a combinação de atributos, entre todas as possíveis,
que oferecia a maior distância média JM entre as classes; porém a classificação obtida
88
com os atributos selecionados pelo AG permutação, que possuem um distância média
JM menor, obteve um coeficiente kappa maior.
As principais contribuições deste trabalho foram:
• Adição de novos atributos de forma ao sistema Texture.
• Desenvolvimento e testes de algoritmos genéticos como método de busca
em problemas de seleção de atributos.
• Demonstração de eficiência do método proposto para estudos intra-urbanos.
• Disponibilização de métodos automáticos de seleção de atributos para
classificação de regiões não existente em softwares comerciais ou livres
disponíveis atualmente.
5.2 Recomendações
Dos métodos implementados neste trabalho, para a realização da seleção automática de
atributos no sistema Texture recomenda-se a utilização do AG permutação, uma vez que
este algoritmo, como dito anteriormente, sempre apresentará ao usuário, independente
dos parâmetros utilizados, uma solução com a quantidade de atributos escolhida por ele.
Como critério de parada recomenda-se utilizar o de melhoras não-significativas
alterando os parâmetros K e C conforme equação 3.9. O resultado do AG pode ser
melhorado aumentando-se o tamanho da população. O sistema apresenta sugestões de
taxa de cruzamento e mutação baseado na literatura utilizada. Estas taxas podem ser
variadas, mas é importante citar que uma probabilidade de mutação muito alta não
favorece o AG (Oliveira, 1998).
89
5.3 Trabalhos Futuros
Como evolução natural do sistema Texture, recomenda-se:
• Ampliar o conjunto de atributos de forma do sistema, uma vez que a utilização
destes atributos, como comprovado por este trabalho, é de fundamental
importância na separabilidade de regiões que possuem respostas espectrais
similares e geometrias diferentes.
• Agregar ao sistema um processo robusto de segmentação de imagens, sabendo
que o bom desempenho de um classificador de regiões está diretamente ligado a
uma segmentação que defina eficientemente a forma dos objetos.
• Adicionar ao sistema medidas de avaliação da classificação através de análise
estatística.
• Desenvolver novos critérios de parada para os algoritmos genéticos propostos
neste trabalho a fim de se obter resultados ainda melhores.
Considerando a possibilidade do desenvolvimento de um sistema de processamento de
imagens de acesso livre, algumas questões do sistema Texture precisam ser resolvidas.
Deve-se elaborar um estudo para a modificação das funções ENVI para funções
específicas do IDL. Isto se deve ao fato do IDL possuir um utilitário (IDL Virtual
Machine) multi-plataforma de distribuição gratuita para executar aplicações compiladas
em código IDL. O IDL Virtual Machine proporciona aos desenvolvedores a
possibilidade de distribuir suas aplicações IDL sem a necessidade de uma licença.
90
91
REFERÊNCIAS BIBLIOGRÁFICAS
Andrade, A. F.; Botelho, M. F.; Centeno, J. A. S. Classificação de imagens de alta resolução integrando variáveis espectrais e forma utilizando redes neurais artificiais. In: Simpósio Brasileiro de Sensoriamento Remoto, 2003a, Belo Horizonte. Anais...São José dos Campos: INPE, 2003, p. 265-272. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2002/11.14.14.55> Acesso em: 7 mar. 2005. Andrade, A. F.; Centeno, J. A. S. Integração de informações espectrais e de forma na classificação de imagens com redes neurais. Boletim de Ciências Geodésicas, v. 9. n. 2, p. 217-231, jul-dez 2003. Disponível em: http://calvados.c3sl.ufpr.br/bcg/viewarticle.php?id=91. Acesso em: 16 abr. 2005. Andrade, A. F.; Centeno, J. A. S.; Araki, H. Utilização de parâmetros de forma como dado auxiliar na classificação de imagens Ikonos através de redes neurais artificiais. In: Simpósio Brasileiro de Geomática, 2002, Presidente Prudente, SP. Anais... Presidente Prudente: Unesp, 2002. p. 342-349. Disponível em: http://www.geomatica.ufpr.br/docentes/centeno/pessoal/download/2002/andreaf_unesp_A_091.pdf Acesso em: 15 dez. 2004. Barber, C. B.; Dobkin, D. P.; Huhdanpaa, H. The quickhull algorithm for convex Hulls. ACM Transactions on Mathematical Software, v. 22, n. 4, p. 469-483. Disponível em: http://portal.acm.org/citation.cfm?id=235821&coll=ACM&dl=ACM&CFID=6489668&CFTOKEN=40908650. Acesso em: 27 abr 2007. Beasley, D.; Bull, D. R.; Martin, R. R. An overview of genetic algorithms: part 1, fundamentals. 1993, p. 58-69. Disponível em: http://www.geocities.com/egmlacerda/curso_ag.html. Acesso em: 7 mar. 2005. Bhattacharyya, A. On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the Calcutta Mathematics Society v. 35, p. 99–110, 1943. Bishop, C. M. Neural networks for pattern recognition. New York: Oxford University Press, 1995. 482 p. Bittencourt, G. Inteligência artificial ferramentas e teorias. Florianópolis - SC: Editora da UFSC, 1998. 319 p. Bow, S. Pattern recognition applications to large data-set problems. New York: Marcel Dekker, Inc, 1984. 323 p.
92
___. Pattern recognition and image preprocessing. New York: Marcel Dekker, Inc, 1992. 558 p. Boz, O. Feature Subset Selection by Using Sorted Feature Relevance. In: International Conference on Machine Learning and Applications (ICMLA' 02), 2002, Las Vegas, Nevada, USA. Proceedings…Las Vegas: CSREA Press, 2002. p. 147-153. ISBN 1-892512-29-7. Disponível em: http://www.doc.ic.ac.uk/~xh1/Referece/feature-selection/Feature-Subset-Selection-by-Using-Sorted-Feature-Relevance.pdf Acesso em: 7 jul. 2005. Carleer, A. P.; Wolff, E. Urban land cove multi-level region-based classification of VHR data by selecting relevant features. International Journal of Remote Sensing, v. 27, n. 6, p. 1035-1051, 20 mar 2006. Carvalho, A. C. P. L. F.; Braga, A. P.; Ludermir, T. B. Computação evolutiva. In: Rezende, S. O. (org.).Sistemas inteligentes fundamentos e aplicações. Barueri: Manole, 2003, p. 225-248. Chernoff, H. The selection of effective attributes for deciding between hypotheses using Linear discriminant functions. In: Watanabe, S. (Ed.). Frontiers of pattern recognition. New York: Academic Press, Inc, 1972, p. 55-60. Cohen, J. Coefficient of agreement for nominal scales. Educational and Psychological Measurement, v. 20, n. 1, p. 37-46, 1960. Davis Jr., C. A.; Carvalho, P. C. P. Geometria computacional para SIG. In: Câmara, G.; Davis Jr., C. A.; Monteiro, A. M. V.; Paiva, J. A.; d'Alge, J. C. (Ed.). Geoprocessamento: teoria e aplicações. São José dos Campos: Instituto Nacional de Pesquisas Espaciais, 1999. Donnay, J. P.; Barnsley, M. J.; Longley, P. A. Remote sensing and urban analysis. In: Donnay, J. P.; Barnsley, M. J.; Longlay, P. A. (orgs.). Remote sensing and urban analysis. London: Taylor & Francis, 2001, p. 7-12. Duda, R. O.; Hart, P. E.; Stork, D. G. Pattern classification. New York: Wiley, 2001. 654 p. Dutra, L. V.; Huber, R. Feature extraction and selection for ERS-1/2 InSAR classification. International Journal of Remote Sensing, v. 20, n. 5, p. 993-1016, 1999. Fanning, D. Find_Boundary. Fort Collins: Fanning Software Consulting, 2006. Disponível em: http://www.dfanning.com/programs/find_boundary.pro. Acesso em 27 abr 2007.
93
Goldberg, D. E. Genetic algorithms in search, optimization, and machine learning. New York: Addison-Wesley, 1989. 412 p. ISBSN 0-201-15767-5. Gonzales, R. C.; Woods, R. E. Processamento de imagens digitais. São Paulo: Editora Edgard Blucher Ltda, 2000. 509 p. Grefenstett, J. Proportional selection and sampling algorithms. In: Back., T.; Fogel, D. B.; Michalewies, Z. (Eds.). Handbook of evolucionary computation. New York: Oxford University Press, 1997. Acesso em: 1 mar. 2005. Herold, M.; Gardner, M. E.; Roberts, D. A. Spectral resolution requirement for mapping urban areas. IEEE Transactions on Geoscience and Remote Sensing, v. 41, n. 9, p. 1907-1019. 2003, Lacerda, E. G. M.; Carvalho, A. C. P. L. F. Introdução aos algoritmos genéticos. In: Hídricos., E. U. U. A. B. d. R. (Eds.). Sistemas inteligentes: aplicações a recursos hídricos e ciências ambientais. Porto Alegre, 1999a, p. 99-150. ___. Introdução aos algoritmos genéticos. In: Congresso Nacional da Sociedade Brasileira de Computação, 19., 1999b, Rio de Janeiro. Anais... Rio de Janeiro: [S.l], 1999. Marques Filho, O.; Vieira Neto, H. Processamento digital de imagens. Rio de Janeiro: Brasport, 1999. 406 p. Miqueles, M. A.; Cavassim Jr, I.; Centeno, J. A. S. Classificação de imagens obtidas do laser scanner baseada em atributos espectrais e epaciais. In: Simpósio Brasileiro de Sensoriamento Remoto, 11, 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 1883-1890. Acesso em: 26 abr. 2005. OLIVEIRA, Joanito de Andrade. Classificação de regiões usando atributos de forma e seleção de atributos. 2005-04-01. 104 p. (INPE-13746-TDI/1050). Dissertação (Mestrado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos. 2005. Disponível em: <http://mtc-m16.sid.inpe.br/rep-/sid.inpe.br/iris@1913/2005/05.05.13.41>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/iris@1913/2005/05.05.13.41. OLIVEIRA, Joanito de Andrade; DUTRA, Luciano Vieira; RENNÓ, Camilo Daleles. Aplicação de métodos de extração e seleção de atributos para classificação de regiões. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 12. (SBSR), 16-21 abr. 2005, Goiânia. Anais... São José dos Campos: INPE, 2005. Artigos, p. 4201-4208. CD-ROM, On-line. ISBN 85-17-00018-8. Publicado como: INPE-12766-PRE/8056. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2004/11.20.21.24>. Acesso em: 27 abr. 2007. rep: ltid.inpe.br/sbsr/2004/11.20.21.24.
94
OLIVEIRA, João Ricardo de Freitas. O uso de algoritmos genéticos na decomposição morfológica de operadores invariantes em translação aplicados a imagens digitais. 1998-12-17. 110 p. (INPE-7513-TDI/726). Tese (Doutorado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos. 1998. Disponível em: <http://mtc-m16.sid.inpe.br/rep-/sid.inpe.br/jeferson/2005/03.04.15.16>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/jeferson/2005/03.04.15.16. Pappa, G. L. Seleção de atributos usando algoritmos genéticos multiobjetivos. 85 p.(Mestrado em Informática Aplicada) – Pontifícia Universidade Católica do Paraná, Curitiba, 2002. Disponível em: http://www.ppgia.pucpr.br/ensino/defesas/Gisele_Lobo_2002.PDF Acesso em: 15 fev. 2005. Pappa, G. L.; Freitas, A. A.; Kaestner, C. A. A. A multiobjective genetic algorithm for attribute selection. In: Conf. on Recent Advances in Soft Computing (RASC - 2002), 4., 2002, Nottingham. Proceedings… Nottingham: Nottingham Trent University, p. 116-121. RENNO, C. D.; FREITAS, C. C.; SANT'ANNA, S. J. S. A system for region image classification based on textural measures. In: SIMPOSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 9., 11-18 set. 1998, Santos, BR. Anais... São José dos Campso: INPE, 1998. Sessão Especial II Jornada de Radar, p. 1195-1202. CD-ROM. Publicado como: INPE-6952-PRE/2914. Disponível em: <http://marte.dpi.inpe.br/rep-/sid.inpe.br/deise/1999/02.11.14.26>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/deise/1999/02.11.14.26. Richards, J. A. Remote sensing digital image analysis an introduction. London: Springer, 1998. 281p. Russ, J. C. Computer-assisted microscopy the measurement and analysis of images. New York: Plenum Press, 1991. 453 p. _____. The image processing handbook. 2. Boca Raton, FL: CRC Press, 1995. 674 p. ISBSN 0-8493-2516-1. Salembier, P.; Marqués, F. Region-based representations of image and video: Segmentation tools for multimedia services. IEEE Transactions on Circuits and Systems for Video Technology, v. 9, n. 8, p. 1147-1667, 8 Dec 1999. Disponível em: http://gps-tsc.upc.es/imatge/pub/ps/IEEE_CSVT99_Salembier_Marques.pdf. Acesso em: 08 out 2006.
95
SOUZA, I. M.; PEREIRA, M. N.; FONSECA, L. M. G.; KURKDJIAN, M. L. N. O. Mapeamento do uso do solo urbano através da classificação por regiões baseada em medidas texturais. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 11., 5-10 abr. 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 1967 - 1968. CD-ROM. Publicado como: INPE--PRE/. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2002/11.14.15.20>. Acesso em: 27 abr. 2007. rep: ltid.inpe.br/sbsr/2002/11.14.15.20. Souza Júnior, M. A. Segmentação multi-níveis e multi-modelos para imagens de radar e òpticas. 2005. 131 p.(INPE-14466-TDI/1147). Dissertação (Mestrado em Computação Aplicada) – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2007. Tadjudin, S.; Landgrebe, D. A. Classification of high dimensional data with limited training samples. West Lafayette: School of Elec. and Comp. Eng. Purdue University. 1998. (TRECE 98-8). Vafaie, H.; De Jong, K. Genetic algorithms as a tool for feature selection in machine learning. In: International Conference on Tools with Artificial Intelligence, 4., 1992, Arlington, VA. Proceedings… Arlington: GMU, 200-204. Disponível em: http: //cs.gmu.edu/~eclab/papers/TAI92.pdf. Acesso em: 15 dez. 2004. _____.Improving the Performance of a rule induction system using genetic algorithms. In: Michalski, R. S.; Tecuci, G. (Ed.). Machine learning: a multistrategy approach,. v. IV. San Mateo, CA: Morgan Kaufmann, 1993. Disponível em: http://cs.gmu.edu/~eclab/papers/msl91.pdf. Acesso em: 22 feb. 2005. Webb, A. R. Statistical pattern recognition. 2. Malvern, UK: John Wiley and Sons Ltd, 2002. 534 p. ISBSN 978-0-470-84513-4. Welch, R. Spatial resolution requirements for urban studies. International Journal of Remote Sensing, v. 3. n.2, p. 138-146, May 1982.
96
97
APÊNDICE A
Demonstração do comportamento da equação de comprimento da fibra para as formas
de círculo, quadrado e retângulo.
PerimeterAreaPerimeterlengthfiber ∗−∗= 25,0
P = Perímetro
S = Área
F = Fiber length
Logo,
PSPF 2
2−= (A.1)
Círculo:
2
2RS
RPπ
π
=
=
Substituindo P e S na Equação A.1:
DiâmetroRR
RRR
RRRF
=≅≅
−=−=
−=
214,2
)1(
22
22 2
ππ
πππ
Logo, para o círculo o valor de F é aproximadamente o seu diâmetro.
Quadrado:
L = Lado
98
2
4LS
LP=
=
Substituindo P e S na Equação A.1:
L
L
LL
LLLF
5,12
32
2
42
24 2
=
=
−=
−=
Logo, para o quadrado o valor de F é 1,5 de seu lado.
Retângulo:
L = lado maior do retângulo
W = Lado menor do retângulo
WLSWLP
=+= 22
Substituindo P e S na Equação A.1:
WLWLWL
WLWLWLF
+−+=
+−
+=
222
222
LWWL
LWLWLFLWLWLSe
=−+=
−+=⇒≅+>> ,
99
L
LL
LLL
LLLL
LLLL
LL
LLL
L
LLLLF
LWSe
01,1
09,01,1
1110
1110
1110
1010
1010
1010
10
1010
10
2
2
2
=
−=
−+=
−+=
⎟⎟⎠
⎞⎜⎜⎝
⎛×−+=
+−+=
+−+=
=
L
Logo, se L for maior que W a ponto de quase desprezar o valor de W, o valor de F será
o próprio L.
PUBLICAÇÕES TÉCNICO-CIENTÍFICAS EDITADAS PELO INPE
Teses e Dissertações (TDI)
Manuais Técnicos (MAN)
Teses e Dissertações apresentadas nos Cursos de Pós-Graduação do INPE.
São publicações de caráter técnico que incluem normas, procedimentos, instruções e orientações.
Notas Técnico-Científicas (NTC)
Relatórios de Pesquisa (RPQ)
Incluem resultados preliminares de pesquisa, descrição de equipamentos, descrição e ou documentação de programa de computador, descrição de sistemas e experimentos, apresenta- ção de testes, dados, atlas, e docu- mentação de projetos de engenharia.
Reportam resultados ou progressos de pesquisas tanto de natureza técnica quanto científica, cujo nível seja compatível com o de uma publicação em periódico nacional ou internacional.
Propostas e Relatórios de Projetos (PRP)
Publicações Didáticas (PUD)
São propostas de projetos técnico-científicos e relatórios de acompanha-mento de projetos, atividades e convê- nios.
Incluem apostilas, notas de aula e manuais didáticos.
Publicações Seriadas
Programas de Computador (PDC)
São os seriados técnico-científicos: boletins, periódicos, anuários e anais de eventos (simpósios e congressos). Constam destas publicações o Internacional Standard Serial Number (ISSN), que é um código único e definitivo para identificação de títulos de seriados.
São a seqüência de instruções ou códigos, expressos em uma linguagem de programação compilada ou inter- pretada, a ser executada por um computador para alcançar um determi- nado objetivo. São aceitos tanto programas fonte quanto executáveis.
Pré-publicações (PRE)
Todos os artigos publicados em periódicos, anais e como capítulos de livros.