classificaÇÃo de regiÕes usando atributos de...
TRANSCRIPT
INPE-13746-TDI/1050
CLASSIFICAÇÃO DE REGIÕES USANDO ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS
Joanito de Andrade Oliveira
Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. Luciano Vieira Dutra e Camilo Daleles Rennó, aprovada em 1º de
abril de 2005.
INPE São José dos Campos
2006
621.376.5 OLIVEIRA, J. A. Classificação de regiões usando atributos de forma e
seleção de atributos/ J. A. Oliveira. – São José dos Campos: INPE, 2005.
104p. – (INPE-13746-TDI/1050). 1.Extração de atributos. 2.Seleção de atributos.
3.Classificação por região. 4.Processamento de Imagens. 5.Reconhecimento de padrões. I.Título.
Aprovado (a) pela Banca Examinadora em cumprimento ao
requisito exigido para obtenção do Título de Mestre em
Computação Aplicada
Aluno (a): Joanito de Andrade Oliveira
São José dos Campos, 01 de abril de 2005
1) Ó Senhor, Deus da vida, que cuidas de toda criação, dá-nos a paz!
- Dá-nos, Senhor, a tua paz!
2) Que a nossa segurança não venha das armas, mas do respeito!
- Senhor, ensina-nos a respeitar o diferente!
3) Que nossa força não seja a violência, mas o amor!
- Senhor, ensina-nos a amar!
4) Que nossa riqueza não seja o dinheiro, mas a partilha!
- Senhor,ensina-nos a partilhar!
5) Que nosso caminho não seja a ambição, mas a justiça!
- Senhor, ensina-nos a ser justos!
6) Que nossa vitória não seja a vingança, mas o perdão!
- Senhor ensina-nos a perdoar!
Desarmados e confiantes, queremos defender a dignidade de toda criação, partilhando, hoje e sempre, o pão da solidariedade e da paz. Por Jesus Cristo teu Filho divino, nosso irmão, que, feito vítima da nossa violência, ainda do alto da cruz, deu a todos o teu perdão. Amém!
Campanha da Fraternidade Ecumênica 2005
A meus pais,
Nilton Fernandes e Licía Raquel de Andrade.
AGRADECIMENTOS
Agradeço a Deus, Pai de misericórdia e ao Senhor Jesus Cristo, modelo de oração e de vida, espírito de sabedoria e fortaleza, que me sustenta contra o mal e fez-me vitorioso em mais uma etapa da vida. Agradeço a meus familiares pelas orações e apoio na realização deste sonho. Também não poderia deixar de agradecer a meus pais em especial, por terem me ensinado a respeitar o próximo, a acreditar nos nossos sonhos, a não desistir nos momentos de fraqueza, a ser caridoso e apresentar sempre o amor verdadeiro. Agradeço a meus irmãos Joselito e Nilcia por sempre acreditarem na importância do estudo e por oferecerem o amor necessário ao fortalecimento da união familiar. A minha Tia Gisélia, por me ensinar a respeitar todas as pessoas, oferecendo sempre o amor e por incentivar a realização deste trabalho. Aos amigos de Itabuna Dionísio, Jabison, Antônio Batista, Mário, George, Juninho, Maurício e Reginaldo. Estendo os meus agradecimentos aos meus amigos e simpatizantes da República Orion: Felipe, Moacyr, Jefersson, Aditya. Agradeço também a minha namorada Thaise Calazans, pelo companheirismo e compreensão. Agradeço aos meus orientadores, Dr. Luciano Vieira Dutra e Dr. Camilo Daleles Rennó, pelo encorajamento, apoio e, principalmente, serenidade e confiança com que orientaram este trabalho. Aos Professores. Doutores. Carlos Antônio O. Vieira e Elpídio Inácio Fernandes Filho, por terem me incentivado a ingressar no curso de mestrado. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), pelo auxílio financeiro de dois anos de bolsa de mestrado. Ao Instituto Nacional de Pesquisas Espaciais (INPE), pela oportunidade de estudos e utilização de suas instalações. Ao Departamento de Processamento de Imagem (DPI), pela utilização da sua excelente estrutura física. Aos meus colegas de trabalho da DPI, pela amizade e o excelente ambiente de trabalho. Em especial, agradeço a Alessandra, Manoel, Sidnei, Silvia, Ricardo, Pierre, Vantier e Joelma, pela amizade sincera e valiosas trocas de idéias. Aos professores do INPE, pelo conhecimento compartilhado.
RESUMO
Com o aumento da disponibilidade no número de atributos extraídos dos dados de sensoriamento remoto, existe uma necessidade crescente de reduzir a complexidade da etapa de classificação. Quando a dimensionalidade dos dados é muito alta, uma estratégia de busca deveria ser utilizada para selecionar um subconjunto de atributos que forneçam o mínimo erro de classificação, considerando o tamanho limitado dos dados de treinamento. Particularmente, quando se trabalha com ambiente muito complexo como é a cena urbana, a extração do atributo de forma é necessária para distinguir diferentes classes de objetos que possuem assinaturas espectrais similares. Um grande número de atributos e o número limitado de amostra de treinamento é uma situação comum nos estudos urbanos no qual implica a aplicação dos métodos de seleção de atributos adaptados para a classificação de regiões. Este trabalho propõe a utilização de métodos de extração de atributos de forma e seleção de atributos em sistemas de processamento de imagens. Primeiramente, extraíram-se 38 atributos de forma e textura de cada amostra de treinamento. A seleção dos subconjuntos para cada método de seleção foi baseada na distância média Jeffrerys-Matusita (JM). A fim de determinar a eficiência da metodologia proposta, foram realizados testes em imagens sintéticas e de sensoriamento remoto (Landsat/TM). Os métodos de seleção de atributos Sequential Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) e NEXKSB (Next ksubset of an n-Set) foram aplicados na redução da dimensionalidade. Esses três métodos de seleção de atributos foram aplicados e uma acurácia de 100% foi alcançada usando dois atributos em ambas as imagens. Como não existe uma relação determinística entre os métodos de seleção de atributos e o erro de classificação é possível concluir que todas as estratégias de busca deveriam ser usadas para diminuir o número de avaliações baseadas no erro de classificação. Este trabalho apresentou a importância da extração do atributo de forma e a necessidade da aplicação dos métodos de seleção de atributos nos sistemas de processamento de imagens.
CLASSIFICATION OF REGION USING SHAPE FEATURE AND FEATURE SELECTION
ABSTRACT
With the steady increase in the number of features available from remote sensing sources, there is a growing necessity to reduce the complexity of the classification task. When data dimensionality is very high, a search strategy should be used to select the subset of features that gives the minimum classification error, considering the limited size of training data. Particularly when one deals with the very complex environment that is the urban scene, shape feature extraction is necessary to distinguish different classes of objects which have similar spectral signature. Large number of features and limited number of training samples is the common situation in urban studies which implies the application of feature selection methods adapted to region classification. This work proposes shape feature extraction and application of feature selection methods in systems of image processing. Firstly, we extracted 38 shape and texture features for each training sample. The selected feature subset by each criterion was classified based on greater average Jeffrerys-Matusita (JM) distance. In order to determine the efficiency of the methodology, tests were developed in synthetic and Landsat-TM images. The Sequential Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) and NEXKSB (Next subset of an n-Set) were tested to reduce the data dimensionality. These three different feature selection methods were used and an accuracy of 100% was achieved by using 2 features in both synthetic and Landsat-TM images. As there is no a deterministic relation between feature selection methods and classification error, it is possible to conclude that all search strategies should be used to narrow the number of choices assessments based on classification error. This work showed the importance of the shape feature extraction and the necessity of the application feature selection methods in systems of image processing.
SUMÁRIO
Pág.
LISTA DE FIGURAS
LISTA DE TABELAS
CAPÍTULO 1 - INTRODUÇÃO................................................................................. 19 1.1 Contextualização ...................................................................................................... 19 1.2 Objetivos................................................................................................................... 21 1.3 Organização da Dissertação...................................................................................... 22
CAPÍTULO 2 - FUNDAMENTAÇÃO TEÓRICA ................................................... 25 2.1 Imagens de Sensores Remotos ................................................................................. 25 2.2 Sistemas de Processamento de Imagens................................................................... 27 2.2.1 Aquisição............................................................................................................... 28 2.2.2 Armazenamento..................................................................................................... 28 2.2.3 Processamento ....................................................................................................... 28 2.2.3.1 Pré-Processamento ............................................................................................. 30 2.2.3.2 Segmentação....................................................................................................... 30 2.2.3.3 Extração e Seleção de Atributos......................................................................... 32 2.2.3.4 Treinamento........................................................................................................ 32 2.2.3.5 Classificação....................................................................................................... 33 2.2.4 Saída ...................................................................................................................... 35 2.3 Extração de Atributos ............................................................................................... 35 2.3.1 Atributos de Textura.............................................................................................. 37 2.3.2 Atributos de Distribucionais.................................................................................. 37 2.3.3 Atributos de Co-Ocorrência .................................................................................. 39 2.3.4 Atributos de Autocorrelação Espacial ................................................................... 43 2.3.5 Atributos de Forma................................................................................................ 44 2.4 Seleção de Atributos................................................................................................. 49 2.4.1 Seleção de Atributos em Redes Neurais Artificiais............................................... 54 2.4.2 Seleção de Atributos em Reconhecimento Estatístico de Padrões ........................ 54 2.4.2.1 Algoritmo Genético (AG)................................................................................... 55 2.4.2.2 Simulated Annealing .......................................................................................... 56 2.4.2.3 Algoritmos Sequenciais de Seleção de Atributos............................................... 57
CAPÍTULO 3 - MATERIAIS E MÉTODOS ............................................................ 61 3.1 Sistema Texture ........................................................................................................ 61 3.1.1 Extração de Atributos ............................................................................................ 61 3.1.1.1 Área .................................................................................................................... 64 3.1.1.2 Perímetro ............................................................................................................ 65 3.1.1.3 Complexidade..................................................................................................... 67 3.1.1.4 Circularidade ...................................................................................................... 67 3.1.2 Seleção deAtributos............................................................................................... 68 3.1.3 Classificação.......................................................................................................... 70
3.2 Avaliação dos Métodos de Seleção e dos Atributos de Forma................................. 71 3.2.1 Imagens para Teste ................................................................................................ 71 3.2.2 Definição dos Experimentos.................................................................................. 73 3.2.2.1 Experimento Utilizando a Imagem Sintética...................................................... 74 3.2.2.2 Imagem de Sensoriamento Remoto.................................................................... 76
CAPÍTULO 4 - RESULTADOS E DISCUSSÕES .................................................... 79 4.1 Teste com Imagens Sintéticas .................................................................................. 79 4.1.1 Experimento 1 ....................................................................................................... 79 4.1.2 Experimento 2 ....................................................................................................... 86 4.1.3 Experimento 3 ....................................................................................................... 89 4.2 Imagens de Sensoriamento Remoto ......................................................................... 91 4.2.1 Experimento 1 ....................................................................................................... 92 4.2.2 Experimento 2 ....................................................................................................... 93
CAPÍTULO 5 - CONCLUSÕES E RECOMENDAÇÕES....................................... 97 5.1 Conclusões................................................................................................................ 97 5.2 Recomendações ........................................................................................................ 99
REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 101
LISTA DE FIGURAS
Pág.
2.1 – Componentes de um Sistema de Processamento de Imagens........................... 27 2.2 - Componentes do processamento de imagem .................................................... 29 2.3 - Representação de atributos em uma, duas (2D) e três dimensões (3D) ............ 36 2.4 - Diferentes valores do perímetro para um mesmo objeto................................... 45 2.5 - Operadores de detecção. As setas indicam a direção de movimentação dos
operadores. Os pixels escuros identificam aqueles pertencentes ao objeto....... 46 2.6 - Exemplos de cálculo de perímetro por operados de detecção........................... 47 2.7 - Distância Euclidiana no espaço de atributos ..................................................... 50 2.8 - Distância de Mahalanobis no espaço de atributos............................................. 51 2.9 - Distância de Bhattacharyya no espaço de atributos .......................................... 52 2.10 - Taxonomia dos métodos de seleção de atributos ............................................ 53 2.11 - Algoritmo SFS................................................................................................. 58 2.12 - Algoritmo SBS ................................................................................................ 59 3.1 - Fluxograma dos atributos existentes no sistema. O retângulo em vermelho
destaca os atributos implementados neste trabalho........................................... 63 3.2 - Definição dos pixels vizinhos (em cinza) ao pixel k (em preto) considerados
na análise de borda ............................................................................................ 65 3.3 - Detecção dos pixels de borda Definição dos pixels vizinhos (em cinza) ao
pixel k (em preto) considerados na análise de borda......................................... 65 3.4 - Exemplos de configurações de vizinhança 8 para os pixels de borda............... 66 3.5 - Delimitação do perímetro. Em detalhe, duas configurações (A e B) de
vizinhança para cada pixels de borda. A linha azul marca o perímetro estimado ............................................................................................................ 67
3.6 - Análise dos atributos em duas dimensões para cada classe .............................. 69 3.7 - Imagem sintética com as duas texturas do álbum de Brodatz........................... 72 3.8 - Imagem Landsat/TM banda 5 ........................................................................... 73 3.9 - Imagem original. O retângulo envolvente a cada forma geométrica indica as
classes em estudo. As regiões em destaque representam as amostras de treinamento........................................................................................................ 75
3.10 - Imagem original. O retângulo envolvente a cada forma geométrica indica as classes em estudo. As regiões em destaque representam as amostras de treinamento....................................................................................................... 75
3.11 - Imagem original. A linha tracejada representa o limite entre as duas classes de textura. As regiões em destaque representam as amostras de treinamento. 76
3.12 - Imagem de SR. (a) As regiões em destaque representam as amostras de treinamento; (b) Imagem segmentada e (c) imagem de referência.................. 78
4.1 - Interface de extração de atributos...................................................................... 80 4.2 - Interface de extração dos atributos de forma .................................................... 80 4.3 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo,
2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade ................................. 81
4.4 - Interface de classificação .................................................................................. 82
4.5 - Resultado da classificação utilizando todos os 38 atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana...........................
83
4.6 - Interface de seleção de atributos ....................................................................... 83 4.7 - Distribuição em duas dimensões dos subconjuntos de dois atributos
selecionados pelos métodos propostos:a) pelos métodos SFS e FIXO, b) pelo método SBS....................................................................................................... 85
4.8 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade ................................. 86
4.9 - Resultado da classificação com o conjunto global de atributos ........................ 87 4.10 - Acurácia total da classificação para cada subconjunto de atributos
selecionado .................................................................................................... 91 4.11 - Imagem de SR. (a) Imagem segmentada; (b) imagem de referência; (c)
Imagem classificada utilizando um subconjunto de 2 atributos e (d) Imagem classificada com o conjunto global de atributos .............................................. 95
LISTA DE TABELAS
Pág.
2.1 - Características dos Satélites IKONOS, SPOT e QuickBird.............................. 26 3.1 - Atributos extraídos das regiões de treinamento ................................................ 73 4.1 - Atributos selecionados através dos métodos de seleção propostos................... 84 4.2 - Resultado dos métodos de extração de atributos, seleção de atributos e
classificação das amostra de teste no Experimento 2........................................ 88 4.3 - Resultado dos métodos de extração de atributos, seleção de atributos e
classificação das amostra de teste no Experimento 3........................................ 89 4.4 - Resultado dos métodos de extração de atributos, seleção de atributos e
classificação das amostra de teste em imagens de SR ...................................... 92 4.5 - Resultado dos métodos de extração de atributos, seleção de atributos e
classificação da imagem segmentada................................................................ 93
19
CAPÍTULO 1
INTRODUÇÃO
1.1 Contextualização
A evolução da tecnologia de computação, em termos de hardware, bem como o
desenvolvimento de algoritmos mais eficientes para manipulação de imagens digitais,
têm permitido um número crescente de aplicações de reconhecimento de padrões. Um
sistema de reconhecimento de padrões pode ser aplicado em diversas áreas de
pesquisas: reconhecimento de voz, data mining, classificação de documentos, análise
de imagens, automação indústrial, sensoriamento remoto, bioinformática, etc.
O desenvolvimento de um sistema de reconhecimento de padrões requer a definição do
padrão das classes e de um ambiente de aquisição dos dados, a representação do padrão,
a extração e seleção de atributos, a análise de agrupamento, o desenvolvimento e
aprendizado do classificador, a seleção das amostras de treinamento e teste, e a
avaliação do desempenho do classificador. As quatro melhores abordagens de
reconhecimento de padrões são os casamentos de modelos, a abordagem estatística, a
abordagem estrutural e as redes neurais (Jain et al., 2000).
Segundo Duda et al. (2001), um sistema de reconhecimento de padrões que usa uma
abordagem estatística pode ser composto pelas seguintes partes: um sistema de
aquisição de dados (sensores ou câmeras); um sistema de pré-processamento, para
suprimir ruídos; um extrator de atributos (características), utilizado para criar um vetor
de atributos extraídos dos objetos em análise; um seletor de atributos, que analisa o
conjunto de atributos que melhor discrimina os objetos em estudo, eliminando os
atributos mais redundantes e menos relevantes na separabilidade; e um classificador,
que analisa as características de um padrão e aplica um modelo na decisão, atribuindo o
padrão a uma determinada classe.
20
A abordagem estatística é amplamente utilizada nos sistemas de processamento de
imagens. Esses sistemas abrangem operações de aquisição, armazenamento,
processamento e exibição da imagem (Marques Filho e Vieira Neto, 1999). Nos últimos
anos, a necessidade de se obter informações decorrentes do processamento de imagem
está fazendo crescer paralelamente a esse processo, os estudos relacionados com os
métodos de extração e seleção de atributos em imagens, procurando encontrar um
subconjunto de atributos mais relevantes na separabilidade das classes. Com uma
extração e seleção de atributos eficaz, o algoritmo de classificação implementado pode
obter resultados mais satisfatórios, independente da sua complexidade. Isso ocorre
devido à redução da dimensão do espaço de atributos, onde as superfícies de decisão se
tornam mais simples.
Nos métodos de extração baseados em atributos visuais, que representam as
informações dos objetos, os critérios de similaridade devem ser suficientemente
robustos para evitar que o resultado da classificação de um padrão seja muito diferente
do padrão de referência (treinamento). Portanto, os modelos de similaridade devem, de
alguma forma, processar e reproduzir o modo como os seres humanos avaliam as
similaridades entre os objetos.
O grande número de atributos encontrados na literatura que podem caracterizar um
objeto em particular e as dificuldades em se identificar previamente qual ou quais deles
são importantes na separabilidade das classes, levou os pesquisadores a intensificar os
estudos nas pesquisas aplicadas a redução da dimensionalidade. Essa redução pode ser
feita pela seleção empírica de alguns atributos, de acordo com os resultados
encontrados, ou pela aplicação de algoritmos de seleção de atributos (métodos de
busca). Segundo Boz (2002), os algoritmos de seleção de atributos são divididos em três
grupos: exponenciais (busca exaustiva), randômicos (algoritmo genético) e seqüenciais.
A seleção de atributos pode envolver processo de otimização de mais de um critério ou
objetivo. Intuitivamente, no caso da seleção de atributos objetivando a classificação de
imagens, taxas de erros menores podem ser geradas a partir da uma simples aplicação
de métodos de seleção de atributos. Os métodos determinísticos de seleção de atributos
21
têm sido estudados em trabalhos aplicados aos sistemas de processamento de imagens
(Jain e Zongker, 1997; Dutra e Huber, 1999). Com o intuito de solucionar problemas
com mais de um objetivo, surgiu o conceito de otimização multiobjetiva (múltiplos
caminhos). Esse conceito permite que, para um determinado problema, um conjunto de
soluções seja apresentado sem privilegiar um ou outro objetivo, fornecendo ao usuário a
escolha da solução que mais se ajusta às suas necessidades.
Apesar dos avanços obtidos no desenvolvimento de novos métodos de extração e
seleção de atributos, os resultados podem ser diferentes dependendo do método adotado.
Isso ocorre, pois cada método possui características intrínsecas ao problema que se
deseja solucionar, além dos diferentes critérios matemáticos utilizados em cada método.
1.2 Objetivos
Este trabalho tem como principal objetivo, o desenvolvimento e implementação de
algoritmos computacionais para extração de atributos de forma e seleção de atributos,
que agregados a um sistema de extração de atributos de textura e classificação por
região, possam auxiliar no processo de classificação semi-automática de imagens
digitais. Os algoritmos de seleção de atributos estão fundamentados em princípios
estatísticos.
Procurou-se validar a utilização de atributos de forma na classificação por região através
da avaliação dos resultados obtidos e apresentar a eficiência da aplicação dos métodos
de seleção de atributos em sistemas de processamentos de imagens.
Ao longo da elaboração deste trabalho foi necessário implementar algoritmos que
efetuassem tarefas combinatoriais e desenvolver mecanismos que possibilitassem a
análise dos atributos utilizados no processo de classificação.
22
Dentre as atividades destacam-se:
1) Implementação do método de extração de atributos de forma, significativos na
separabilidade das classes em estudo.
2) Desenvolvimento de algoritmos de seleção de atributos, manipulando funções
matemáticas e obtendo soluções sub-ótimas.
3) Utilização do algoritmo NEXKSB (Next ksubset of an n-Set) para obter as
combinações de k atributos a partir de um conjunto de n atributos (Nijenhuis e
Wilf, 1978).
4) Implementação e adaptação de interfaces gráficas
Realizou-se as atividades a fim de determinar a eficiência da metodologia proposta para
um sistema de classificação por região, utilizando atributos de textura e de forma.
1.3 Organização da Dissertação
Esta dissertação está organizada em cinco capítulos. Ao longo de todo o texto tem-se
sempre em foco, o estudo da extração e seleção de atributos. Abaixo, a estrutura de cada
um dos capítulos.
No Capítulo 1, é apresentada uma breve introdução do trabalho através de uma
contextualização do problema da extração e seleção de atributos e os objetivos que se
deseja alcançar.
Apresentam-se no Capítulo 2 os conceitos dos sistemas de processamento de imagens
que sustentam a definição de seus componentes. Destes conceitos, serão estabelecidas
as ligações entre os universos conceituais dos métodos de extração e seleção de
atributos e suas aplicações em sistema de processamento de imagens.
O Capítulo 3 apresenta os materiais e os métodos de extração de atributos de forma e
seleção de atributos utilizados neste trabalho. A implementação e adaptação das
interfaces gráficas no sistema para a extração de atributos de textura, de forma e as
23
interfaces dos métodos de seleção de atributos e classificação também são descritas
neste capítulo.
O Capítulo 4 apresenta os resultados e discussões dos testes para o sistema de extração e
seleção de atributos aplicados à classificação de regiões de imagens sintéticas e de
sensoriamento remoto. Analisa-se nesse capítulo, a viabilidade da aplicação dos
atributos de forma na extração de informações geométricas das regiões. A análise dos
métodos de seleção de atributos é discutida, observando a acurácia total da classificação
e a eficiência para um conjunto alto de atributo.
Ao final, o Capítulo 5 expõe as conclusões da aplicação dos métodos implementados em
um sistema de processamento de imagens, proporcionando uma dedução possitiva do
emprego dos métodos nesse tipo de sistema. Com o intutito de aperfeiçoar o sistema,
algumas recomendações são propostas como sugestões de trabalhos futuros.
24
25
CAPÍTULO 2
FUNDAMENTAÇÃO TEÓRICA
Como os métodos de extração e seleção de atributos utilizados na classificação de
imagens digitais constituem uma das principais ferramentas neste trabalho, um resumo
de sua teoria é apresentado neste capítulo. Além disso, para uma melhor compreensão
das imagens geradas por sensores remotos e as etapas do sistema de processamento de
imagens são apresentadas a seguir.
2.1 Imagens de Sensores Remotos
O objetivo principal do desenvolvimento de sensores espaciais é a geração de imagens
que possam auxiliar na classificação do uso da terra, no planejamento e monitoramento
do ambiente rural e urbano. A geração de mapas cresceu paralelamente com a
disponibilidade das imagens de satélites e com o desenvolvimento e aprimoramento das
técnicas de manipulação de imagens, constituindo um ponto de partida para muitas
aplicações em diferentes domínios de planejamento do espaço (Donnay, 1999).
Com os avanços tecnológicos, tanto para as imagens geradas por satélite como para as
adquiridas por sensores aerotransportados, está sendo possível capturar uma variedade
de dados sobre a superfície da Terra em várias escalas. Com isso, as análises
decorrentes deste tipo de imagens vêm sendo cada vez mais utilizadas no
monitoramento e planejamento da superfície terrestre. Para tanto, são desenvolvidos
métodos de processamento que possam explorar e extrair as informações contidas nas
imagens de sensores remotos (Curlander e Kober, 1992; Serpico e Roli, 1995).
Com o lançamento do IKONOS II em setembro 1999, com resolução de 1m para
imagem pancromática e 4m para imagens multi-espectrais, os objetos terrestres
passaram a ser melhor discriminados visualmente. Com a alta resolução espacial, essas
imagens permitem, por exemplo, distinguir tipos de edifícios no espaço urbano (Jensen
e Cowen, 1999).
26
Antes do lançamento do IKONOS, as melhores imagens de satélite disponível no
mercado para aplicações em grande escalas era a do SPOT 4 (10 m e 20 m), do
LANDSAT 5 (30 m) e do LANDSAT 7 (15 m e 30 m). Lançado em outubro de 2001, o
satélite de alta precisão cartográfica QuickBird vem fazendo concorrência ao IKONOS.
O QuickBird coleta imagens com resolução de 61 cm no modo pancromático e 2,44 m
no modo multiespectral, a nadir. Esses dados orbitais de resolução submétrica são
comparáveis aos de uma fotografia aérea.
Em decorrência do aprimoramento da resolução espacial, temporal e espectral dos
sensores espaciais, está sendo possível monitorar diferentes fenômenos com um nível
maior de detalhes. A resolução temporal é de fundamental importância, no que diz
respeito a trabalhos de monitoramento, pois permite fazer o acompanhamento dinâmico
dos alvos terrestres. Já a resolução espectral auxilia na discriminação dos diferentes
objetos na imagem. Segundo Townshend (1981), a resolução espacial é a habilidade de
distinguir os alvos entre si e de medir as propriedades espectrais de pequenos alvos. A
tabela 2.1 apresenta as características dos satélites LANDSAT 5, LANDSAT 7,
IKONOS II, SPOT e QuickBird.
TABELA 2.1 Características dos Satélites IKONOS, SPOT e QuickBird.
Satélite/Sensor Lançamento Produto Resolução Espacial(m)
Faixa Imageada(km)
LANDSAT 5/TM 1984 7 Bandas
Multiespectrais 30 185
4 Bandas Multiespectrais 20 60
SPOT 4/HRVIR 1998 Banda Pancromática 10 60
7 Bandas Multiespectrais 30 185 LANDSAT
7/ETM+ 1999 Banda Pancromática 15 185
4 Bandas Multiespectrais 4 11
IKONOS II 1999 Banda Pancromática 1 11
4 Bandas Multiespectrais 2,4 22
QUICKBIRD 2001 Banda Pancromática 0,60 16,5
27
Atualmente, os produtos provenientes dos sensores orbitais são mais fortemente
utilizados em bases de dados dos Sistemas de Informações Geográficas (SIG) no auxílio
ao processo de tomada de decisão em estudos voltados para o monitoramento e
planejamento do espaço rural e urbano.
2.2 Sistemas de Processamento de Imagens
Segundo Marques Filho e Vieira Neto (1999), os sistemas de processamento de imagens
são utilizados no aprimoramento de informações pictóricas para interpretação humana e
na análise automática por computador de informações extraídas de uma cena. Um dos
principais objetivos dos sistemas de processamento de imagens é distinguir e identificar
os diferentes objetos existentes na imagem.
O sistema de processamento de imagens possui componentes (fases) que descrevem os
passos (operações) existentes no sistema. A Figura 2.1 representa, através de um
diagrama, os componentes típicos em um sistema de processamento de imagens.
Segundo Marques Filho e Vieira Neto (1999), as operações que se pode efetuar em uma
imagem são: aquisição, armazenamento, processamento e exibição (saída).
FIGURA 2.1 – Componentes de um Sistema de Processamento de Imagens. .
28
Todos os componentes do sistema de processamento de imagem têm papéis
fundamentais na eficácia do sistema como um todo.
2.2.1 Aquisição
A etapa de aquisição é responsável pela entrada de dados no sistema de processamento
de imagens. Essa etapa tem como função converter uma imagem em uma representação
numérica adequada para o processamento digital subseqüente (Marques Filho e Vieira
Neto, 1999). Utiliza-se, no processo de aquisição de imagem, um sensor e um
digitalizador. O primeiro converterá a informação espectral em sinal elétrico e o
segundo processo promove a transformação da imagem analógica em imagem digital.
2.2.2 Armazenamento
Armazenar é guardar, acumular, introduzir dados em dispositivo físico ou em sistema
digital, com o objetivo de posterior recuperação. Esse é um dos desafios para os
pesquisadores da área de processamento de imagem digital, pois os sistemas de
aquisição estão cada vez melhores, requerendo bons sistemas computacionais para
armazenar os dados provenientes da etapa de aquisição.
Segundo Marques Filho e Vieira Neto (1999), a etapa de armazenamento pode ser
dividida em três categorias: a) armazenamento de curta duração de uma imagem
(memória RAM), enquanto ela é utilizada nas várias etapas do processamento; b)
armazenamento de massa para operações de recuperação de imagens relativamente
rápidas; c) arquivamento de imagens, para recuperação futura quando isto se fizer
necessário.
2.2.3 Processamento
Processar uma imagem consiste em reconstruir, efetuar medidas, extrair características,
rotular e identificar objetos e exibir classes intrínsecas na imagem. Esses procedimentos
são executados através de procedimentos como pré-processamento, segmentação,
extração de atributos, seleção de atributos e classificação (Hussain, 1991).
29
Em geral, esses procedimentos são expressos em forma de algoritmos e funções. O
processamento de imagens digitais é caracterizado por soluções específicas, ou seja,
para uma determinada aplicação pode não ser necessário utilizar o procedimento de pré-
processamento, ou ainda, a utilização de alguns procedimentos pode ser totalmente
inadequado em outras áreas.
A etapa de processamento é de fundamental importância para os sistemas de
processamento de imagem, pois os procedimentos executados têm características
específicas na obtenção dos resultados esperados pelo usuário. O processamento segue
uma seqüência de análise que pode ser visualizada na Figura 2.2.
FIGURA 2.2 – Componentes do processamento de imagem.
30
2.2.3.1 Pré-processamento
O pré-processamento é o primeiro passo do processamento da informação visual
(Cohen, 1982). Seus objetivos são a reconstrução de uma imagem de qualidade
apropriada ao processamento, e melhoria ou realce da qualidade da imagem de entrada
por supressão de ruídos. Além disso, procura ressaltar as características selecionadas,
facilitando os estágios posteriores do processamento da imagem. Procura-se realçar
determinadas características das imagens e recuperar imagens que sofreram algum tipo
de degradação.
São usadas nesse procedimento, operações matemáticas com objetivo de alterar os
valores dos pixels da imagem, fazendo com que haja uma melhoria na qualidade da
imagem que será processada. Todas as técnicas de pré-processamento envolvem a
modificação na imagem. Segundo Gonzáles e Woods (2000), estas modificações
abragem a correção geométrica, modificação da escala de cinza e contraste, e
suavização de imagens.
A correção geométrica tem o objetivo de minimizar as distorções geométricas,
provenientes das características do sensor e das variações decorrentes do movimento do
mesmo durante a passagem sobre o alvo (Luiz et al, 2003). Através da correção
geométrica é possível integrar as imagens a um sistema de informações geográficas
(SIG), desenvolvendo análises da geometria dos objetos existentes na imagem. A
correção radiomérica é outro procedimento utilizado na etapa de pré-processamento.
Algumas operações típicas que se relacionam com a correção radiométrica são a
eliminação de ruídos, a restauração e a correção atmosférica.
2.2.3.2 Segmentação
Com os avanços no processo de aquisição e processamento de imagem, verifica-se a
necessidade de se desenvolver métodos de extração das informações contidas nas
imagens. A imagem é representada por uma matriz bidimensional de pixels contendo
valores distribuídos de níveis de cinza. A função desempenhada por um algoritmo de
31
segmentação é agrupar os pixels de uma imagem que compartilham alguns atributos
semelhantes (textura, média, variância, área, etc).
Os procedimentos de segmentação de imagem é um dos principais foco de estudo na
área de análise de imagem. Nas últimas duas décadas várias técnicas de segmentação
têm sido desenvolvidas para incorporar as informações contextuais nos procedimentos
de classificação (Ballard e Brown, 1983). Agrupar partes de uma imagem em unidades
homogêneas com relação a uma ou mais características resulta em um processo de
segmentação. No processo de segmentação, existem dois importantes aspectos para
considerar: o primeiro é a estrutura dos dados usados para agrupar as regiões
homogêneas; a outra é a transformação envolvida para computar (medir) as
características dessas regiões (Ballard e Brown, 1983).
Segundo Lambert e Macairne (2000), os métodos de segmentação podem ser divididos
em quatro grupos: baseados em bordas, vizinhança, histograma e em agrupamentos
(“clusters”). O método baseado em bordas procura as descontinuidades na imagem
enquanto o baseado em vizinhança emprega a semelhança entre diferentes regiões na
imagem. Pelo método da descontinuidade, a partição da imagem é efetuada com base
nas alterações bruscas de intensidade (ex., detecção de bordas). Já a partição por
similaridade é efetuada com base na similaridade entre pixels. Um algoritmo de
"clusters" é uma técnica de segmentação que procura agrupar regiões, a partir de uma
medida estatística de similaridade entre elas.
Depois do processo de segmentação, são extraídas as características de cada segmento
da imagem. Essas características são usadas no treinamento do classificador. O processo
de segmentação pode ser usado anteriormente ao processo de classificação de imagens
de alta resolução. O desenvolvimento de algoritmo capaz de particionar o espaço intra-
urbano é um desafio para os pesquisadores da área de processamento de imagem.
32
2.2.3.3 Extração e Seleção de Atributos
A obtenção de bons resultados na classificação depende do processo de extração e
seleção de atributos, pois é a partir desta fase que é criado o conjunto de atributos que
será utilizado na etapa de treinamento e posteriormente na fase de classificação.
Pode-se pensar que quanto maior o número de atributos para representar um padrão
(classe), maior o poder discriminatório do classificador. Porém, nem sempre isso é
verdade. Na prática, o que acontece é uma degradação na acurácia dos resultados da
classificação com o aumento da dimensionalidade dos dados mantendo-se constante o
número de amostras de treinamento. Segundo Jain et al. (2000), existem duas razões
para reduzir esta dimensionalidade: diminuir o custo de processamento e aumentar a
acurácia da classificação. Uma descrição mais detalhada dos métodos de extração e
seleção de atributos é apresentada nas Seções 2.3 e 2.4.
2.2.3.4 Treinamento
A fase de treinamento inicia-se com a escolha de um grupo de amostras que representa
cada uma das classes. Essas amostras podem ser definidas usando dados de campo,
fotos aéreas ou ainda a partir da interpretação visual da imagem a ser classificada
(Fonseca, 2004). Todos os pixels dentro de uma área de treinamento para uma dada
classe constituem o chamado conjunto de treinamento para aquela classe (Crósta, 1993).
O conjunto de treinamento é utilizado para estimar os parâmetros usados pelo algoritmo
de classificação. Estes podem ser propriedades do modelo de probabilidade ou equações
que definem o particionamento no espaço de atributos (Fonseca, 2004).
A determinação das amostras de treinamento pressupõe bons conhecimentos em
interpretação de imagens de satélite. Uma outra forma de definir as amostras de
treinamento é através da utilização do GPS (Global Positioning System) em trabalhos de
campo, que tem-se tornado uma tecnologia extremamente útil para uma série de
atividades que necessita de posicionamento. Essa fase de treinamento está presente nos
algoritmos de classificação supervisionada. Nos algoritmos de classificação não-
33
supervisionada, o usuário tem pouco conhecimento sobre as classes, pois não requer um
conhecimento prévio da área de estudo.
A confiabilidade das amostras na representatividade das classes está ligada à
variabilidade entre as classes. Em alguns casos, é necessário um número grande de
amostras na imagem para representar uma classe. Dependendo dos parâmetros
utilizados, é necessário selecionar quais medidas estatísticas melhor discriminam as
classes. Essa seleção é executada no processo de seleção de atributos.
2.2.3.5 Classificação
Um dos principais objetivos na análise de imagens digitais é distinguir e identificar os
diferentes objetos presentes na imagem. Essa distinção e identificação tornam-se
possíveis, pelo fato dos objetos na imagem apresentarem diferentes comportamentos de
reflectância, medida ao longo do espectro eletromagnético.
A classificação é um processo utilizado para criar mapas temáticos. Esses mapas são
informações que representam a distribuição espacial de um tema em particular. Os
temas podem representar os mais diversos objetos, como solo, vegetação, profundidade
da água, atmosfera, etc. Dentro de um tema pode haver alguns sub-temas definidos, e
assim o processo da classificação tornar-se cada vez mais refinado.
A classificação automática de imagens consiste em associar cada pixel da imagem a um
"rótulo", descrevendo um objeto real. Desta forma, os níveis de cinza (NC) associados a
cada pixel, definidos pela reflectância dos materiais que compõem esse pixel, são
identificados como pertencentes a um tipo de classe. Esse processo de classificação é
dito classificação pixel-a-pixel, ou seja, identifica-se o objeto levando em conta apenas
as características pontuais.
Na classificação por região, podem ser consideradas as informações contextuais,
espectrais e geométricas de cada segmento (região) no processo de rotulação. Nesse
caso, todos os pixels que compõe a região são designados para um mesmo rótulo.
34
A tarefa do classificador de um sistema é usar o vetor fornecido pelo extrator da
característica para atribuir o objeto a uma categoria ou classe (Duda et al., 2001).
Dependendo da classe em estudo, o perfeito desempenho da classificação é difícil de ser
obtido, sendo uma tarefa mais geral, estimar a probabilidade de que um padrão (objeto)
pertença a uma determinada classe, baseando-se no valor de algum atributo ou em um
conjuntos de atributos (Gose et al, 1996).
Os métodos de classificação se dividem em duas categorias: a classificação
supervisionada e a não-supervisionada. A primeira refere-se ao processo de
classificação que usa um conjunto de amostras de treinamento para classificar amostras
similares presentes na imagem, enquanto que na classificação não-supervisionada o
processo de classificação não requer conhecimento a priori das classes em estudo (Gose
et al, 1996). Na segunda abordagem as técnicas são baseadas em agrupamentos
(clusters), usando medidas de similaridades no processo de classificação.
Segundo Duda et al. (2001), existem alguns algoritmos clássicos, tanto de classificação
não-supervisionada (Isodata, K-Médias), quanto na supervisionada (vizinho mais
próximo, método Fisher, método por árvore de decisão, redes neurais, método do
paralelepípedo, máxima verossimilhança (Maxver), distância de Mahalanobis). Esses
algoritmos representam um grupo de metodologias que vem sendo aplicado em sistema
de processamento de imagens (Gose et al, 1996; Theodoridis e Koutroumbas, 1999;
Kohn, 1998).
Um critério amplamente utilizado na avaliação da classificação é o erro de classificação
de um subconjunto de padrões. Uma outra alternativa para avaliar o desempenho do
classificador é através do cálculo do coeficiente de concordância Kappa, TAU, entre
outros. O coeficiente Kappa foi introduzido por Cohen (1960), no contexto do
sensoriamento remoto é calculado a partir da matriz de confusão (Congalton, 1983). A
matriz de confusão é uma matriz quadrada de números que expressam a quantidade de
unidades amostrais, associada a uma dada categoria (classe). Essa matriz apresenta não
somente os acertos, mas também quais as classes cujas amostras foram erroneamente
classificadas e quais classes ocorreram confusão. Na avaliação da classificação, deve-se
35
utilizar um conjunto de amostras diferente do conjunto utilizado no treinamento. Esse
conjunto é chamado de amostra de teste. A utilização desse conjunto de amostras evita
que a avaliação da classificação seja tendenciosa.
2.2.4 Saída
Os dispositivos de saída em um sistema de processamento de imagens, que são
dispositivos que efetivamente permitem que os resultados da etapa de processamento
sejam disponibilizados para os usuários são os monitores de vídeo, plotters e
impressoras. Esses dispositivos têm função de transformar dados digitais em informação
visível.
2.3 Extração de Atributos
Extrair as características (atributos) mais importantes numa imagem evidencia as
diferenças e similaridades entre os objetos. Entre essas características pode-se incluir o
brilho de uma determinada região, a textura de uma região, a amplitude do histograma,
entre outros (Pratt, 1991). De uma forma geral, a extração de atributos é um processo
usualmente associado à análise dos regiões de uma imagem.
Os métodos para criar novas características baseadas na combinação ou na
transformação de características já existentes são chamados métodos de extração de
atributos (Dutra e Huber, 1999). O estudo de extração de atributos em reconhecimento
estatístico de padrões requer a definição de dois elementos:
Atributos: é qualquer aspecto, qualidade ou característica de um objeto. Os
atributos podem ser simbólicos, numéricos ou ambos.
Padrão: é um conjunto de atributos que definem um objeto ou um grupo de
objetos. É essencialmente um arranjo ou uma ordenação presente em
alguma organização de estrutura (Pandya, 1995).
A fim de desenvolver um eficiente sistema de reconhecimento de padrões, deve-se
primeiramente efetuar a escolhar dos métodos de extração de atributos. Para projetar um
36
sistema com baixa complexidade, o vetor de atributos criado pela extração deve conter
atributos pertinentes sobre as classes a serem reconhecidas. Um vetor de atributo é
composto de vários atributos que representa um objeto. Um conjunto de atributos
também pode ser representado no espaço de atributos 2D e 3D (Figura 2.3). A extração
de atributos irrelevantes pode resultar em um baixo desempenho na etapa de
classificação.
FIGURA 2.3 – Representação de atributos em uma, duas (2D) e três dimensões (3D).
A extração de atributos é responsável pela mensuração dos atributos dos objetos
pertencentes à imagem em estudo, que são utilizados para identificar uma classe de
padrão. O principal objetivo da extração de atributos é caracterizar os objetos, através
de medidas, para ser utilizados na classificação de imagens (Duda et al., 2001). As
medidas podem ser adquiridas computacionalmente através de algoritmos simples que
extraem informações de tamanho, cor do objeto, ou medidas, que através de algoritmos
complexos, extraem características de forma, conectividade, textura, entre outros.
A obtenção de bons resultados na classificação depende do processo de extração de
atributos, pois é a partir desta fase que se cria o vetor de atributos utilizado na etapa de
treinamento e posteriormente na fase de classificação. Muitos trabalhos têm utilizado
inúmeros atributos para quantificar os objetos nas imagens (Haralick et al., 1973; Rennó
et al., 1998; Arivazhagan e Ganesan, 2003; Chen et al., 2004). Métodos de análise de
textura e forma têm sido desenvolvidos usando métodos estatísticos e morfológicos
(Tari et al., 1997; Soltanian-Zadeha et al., 2004).
37
2.3.1 Atributos de Textura
A textura contém informações importantes sobre o arranjo estrutural das superfícies e
seus relacionamentos com o ambiente ao redor (Haralick et al., 1973). A textura refere-
se ao padrão aparente de uma determinada região, descrita pelas propriedades lisa,
rugosa e grossa. A análise de textura em dados digitais é um estudo do padrão espacial
ou freqüência de variação de níveis de cinza em uma determinada região.
A utilização de técnicas de extração de textura é desenvolvida, com o intuito de extrair
informação da distribuição de uma determinada região, objetivando a melhoria no
desempenho do classificador. A caracterização da textura, na maioria das vezes, é
baseada em modelos estatísticos (Haralick et al., 1973; Haralick, 1979), modelos
estocásticos (Haindl, 1991) e modelos estruturais (Haralick , 1979; Haindl, 1991).
A seguir, apresenta-se algumas definições de atributos extraídos de regiões em imagens,
e utilizados no processo de classificação.
2.3.2 Atributos Distribucionais
Os atributos distribucionais podem ser divididos em dois grupos: básicos e particulares.
Os atributos distribucionais básicos são baseados em estatística de primeira ordem, onde
a caracterização da textura não leva em consideração a distribuição espacial dos níveis
de cinza de uma região na imagem. Os atributos de primeira ordem podem ser
calculados pela distribuição de frequências (nível de cinza) dos pixels de uma imagem.
Segundo Soares et al. (997) e Rennó (1995), os atributos distribucionais básicos mais
comumentes utilizados são:
a) variância
[ ] ( )∑ −=i
iPMiV 2 (2.1)
onde ( )iP é a freqüência relativa com que o nível de cinza i ocorre na região e M é a
média dos níveis de cinza da região, ou seja,
38
( )∑=i
iiPM (2.2)
b) coeficiente de variação
MVCV = (2.3)
c) assimetria
( ) ( )23
3
V
iPMiAS i
∑ −= (2.4)
d) assimetria da média em relação à mediana
VMEDM
ASM−
= (2.5)
onde MED é a mediana dos níveis de cinza da imagem.
e) curtose
( ) ( )2
4
V
iPMiCUR i
∑ −= (2.6)
Os atributos distribucionais particulares buscam representar a textura de uma
determinada região, utilizando estimadores de parâmetros de algumas distribuições
estatísticas como a distribuição log-normal, a gama, a K amplitude, entre outras.
Algumas dessas distribuições são utilizadas especialmente em imagens de radar.
Yanasse et al. (1993), utilizou uma série dessas distribuições estatísticas em imagens de
radar de abertura sintética (SAR) para discriminar áreas de floresta e não-floresta. A
energia (uniformidade) e entropia de uma região são atributos considerados atributos
distribucionais particulares e de grande utilização na classificação de imagens de radar.
39
f) energia
( )2∑=i
iPUNI (2.7)
g) entropia
( ) ( )∑−=i
iPiPENT log* (2.8)
2.3.3 Atributos de Co-Corrência
Haralick et al. (1973) introduziu a representação de texturas através da matriz de co-
ocorrência. Esta metodologia explora a dependência espacial dos níveis de cinza da
textura para montar uma matriz que representa a informação textural. A matriz de co-
ocorrência é baseada na orientação e distância entre os pixels da imagem. Cada
elemento ( ) yxjiP ∆∆ ,, da matriz de co-ocorrência, representa a freqüência relativa com
que dois pixels vizinhos (separados por uma distância de ∆x colunas e ∆y linhas)
ocorrem na imagem, um com o nível de cinza i e o outro com o nível de cinza j.
A principal desvantagem no uso de medidas texturais baseadas na matriz de co-
ocorrência é a grande exigência em memória e tempo computacional. Por exemplo,
numa imagem com resolução radiométrica de 8 bits (256 níveis de cinza), a matriz de
co-ocorrência é composta por 65536 elementos, muitos deles com valor nulo (Rennó,
1995). Como alternativa, pode-se trabalhar com vetores soma e diferença de níveis de
cinza (Unser, 1986; Welch et al., 1990). Cada elemento do vetor soma é definido como:
( ) ( ) kjijijiPkPj
yxi
yxS =+∀= ∑∑ ∆∆∆∆ /,, ,, (2.9)
enquanto que o elemento do vetor diferença é definido como:
( ) ( ) kjijijiPkPj
yxi
yxD =−∀= ∑∑ ∆∆∆∆ /,, ,, (2.10)
40
Dessa forma, utilizando-se a mesma imagem de 8 bits, o vetor soma terá 511 elementos
e o vetor diferença 256 elementos.
A seguir apresentam-se algumas medidas de textura baseadas na matriz de co-
ocorrência e nos vetores soma e diferença de níveis de cinza (Haralick et al., 1973;
Rennó, 1995; Soares et. al, 1997).
a) uniformidade (energia)
UNI ( )∑∑ ∆∆∆∆ =j
yxi
yx jiP 2,, , (2.11)
A energia mede uniformidade textural, isto é, repetição de pares de pixel na imagem.
Em alguns trabalhos na área de análise de textura, a energia também é chamada de
segundo momento angular (Haralick et al., 1973). Altos valores de energia indicam que
a distribuição de nível cinza em região na imagem tem uma distribuição constante ou
uma forma periódica (Soares et. al, 1997).
b) entropia
( ) ( )∑∑ ∆∆∆∆∆∆ −=j
yxyxi
yx jiPjiPENT ,,, ,log, (2.12)
A entropia calcula o desordem de uma imagem. Quando a imagem não é texturalmente
uniformizada o valor da entropia é alto (Soares et. al, 1997).
c) contraste
( ) ( )∑∑ ∆∆∆∆ −=j
yxi
yx jiPjiCON ,2
, , (2.13)
O contraste é uma estimativa das variações locais ao quadrado dos níveis de cinza entre
pares de pixels (Soares et. al, 1997).
d) homogeneidade
41
( )( )∑∑ −+
= ∆∆∆∆
j
yx
iyx ji
jiPHOM 2
,, 1
, (2.14)
Essa medida de textura resulta em grandes valores para regiões com níveis de cinza
similares. O contraste e a homogeneidade são inversamente correlacionados (Soares et.
al, 1997).
e) correlação
( )
cl
jclyx
iyx
jiijPCOR
σσ
µµ∑∑ −=
∆∆
∆∆
,
,
, (2.15)
onde
( )∑ ∆∆∗=i
yxl iiP ,,µ (2.16)
( )∑ ∆∆∗=j
yxc jjP ,,µ (2.17)
( ) ( )∑ ∆∆∗−=i
yxll iPi ,2 ,µσ (2.18)
( ) ( )∑ ∆∆∗−=j
yxcc jPj ,2 ,µσ (2.19)
( ) ( )∑ ∆∆∆∆ =∗j
yxyx jiPiP ,, ,, (2.20)
e
( ) ( )∑ ∆∆∆∆ =∗i
yxyx jiPjP ,, ,, (2.21)
A correlação mede a dependência linear de pixels em relação a sua vizinhança. Valores
de correlação altos indicam uma alta relação linear entre os níveis cinzas de pares de
pixel presente em uma região na imagem.
42
f) chi-quadrado
( )( ) ( )∑∑
∆∆∆∆
∆∆∆∆ ∗∗=
j yxyx
yx
iyx jPiP
jiPCHI
,,
2,
, ,,,
(2.22)
Essa medida pode ser entendida como uma normalização da energia para a dependência
linear dos tons de cinza em uma região na imagem (Soares et. al, 1997).
g) média do vetor soma
( )∑ ∆∆∆∆ =k
yxS
yx kkPMS ,, (2.23)
h) variância do vetor soma
VS ( ) ( )∑ ∆∆∆∆∆∆ −=k
yxS
yxyx kPMSk ,2
,, (2.24)
i) uniformidade (energia) do vetor soma
UNIS ( )∑ ∆∆∆∆ =k
yxS
yx kP 2,, (2.25)
j) entropia do vetor soma
( ) ( )∑ ∆∆∆∆∆∆ −=k
yxS
yxS
yx kPkPENTS ,,, log (2.26)
l) média do vetor diferença
( )∑ ∆∆∆∆ =k
yxD
yx kkPMD ,, (2.27)
m) variância do vetor diferença
VD ( ) ( )∑ ∆∆∆∆∆∆ −=k
yxD
yxyx kPMDk ,2
,, (2.28)
43
n) uniformidade do vetor diferença
UNID ( )∑ ∆∆∆∆ =k
yxD
yx kP 2,, (2.29)
o) entropia do vetor diferença
( ) ( )∑ ∆∆∆∆∆∆ −=k
yxD
yxD
yx kPkPENTD ,,, log (2.30)
2.3.4 Atributos de Autocorrelação Espacial
As análises de autocorrelação espacial têm por finalidade obter comportamentos globais
dos níveis de cinza distribuídos sobre uma região na imagem, e também inferir padrões
para esta dependência espacial.
A autocorrelação espacial indica a relação espacial existente entre os pixels pertencente
a imagem. Essa relação é definida através da informação de vizinhança entre os pixels.
Há um valor de autocorrelação para cada relação de vizinhança, sendo definida por uma
distância em linhas e outra em colunas (Rennó, 1995), comumente denominada lag. Por
exemplo, a autocorrelação de lag (1,1) refere a correlação existente entre cada pixel e
seu vizinho na direção θ = -45°. Outras configurações de lags podem ser testadas,
obtendo novos valores de autocorrelação na mesma região de estudo. Portanto, a
escolha dos lags é de fundamental importância na caracterização da autocorrelação da
região. A autocorrelação espacial para região retangular é definida como:
( )( )
( )∑∑
∑∑
==
−
=++
−
=
−
−−= nj
jji
ni
i
ljnj
jljjliiji
lini
iljli
xx
xxxxAUT
1
2,
1
1,,
1, (2.31)
44
onde li e lj são os lags em coluna e linha respectivamente; ni e nj são o número de
colunas e linhas, xi,j é o nível de cinza do pixel localizado na i-ésima coluna e j-ésima
linha e x é o nível de cinza médio.
2.3.5 Atributos de Forma
Classificadores tradicionais, baseados em princípios espectrais, são os que
habitualmente encontram-se implementados na maioria dos softwares utilizados em
processos de extração de atributos de uma região. No processamento digital de imagem,
uma representação de uma região não consiste apenas na diferenciação dos níveis de
cinza dos objetos, mas também da delimitação de sua fronteira através da forma dos
objetos (região).
Técnicas qualitativas e quantitativas são desenvolvidas para caracterizar a forma dos
objetos nas imagens (Pratt, 1991). Essas técnicas vêm sendo usadas na classificação de
imagens nos sistemas de reconhecimentos de padrões. Há várias outras maneiras de
representar e descrever a variação da forma dos objetos, como através da teoria do
código da cadeia, teoria das assinaturas, dos números de formas, circularidade, entre
outras (Gonzales e Woods, 2000). Com o estabelecimento das medidas de distância,
área e perímetro, vários atributos geométricos dos objetos podem ser desenvolvidos
(Pratt, 1991). O valor da área de um objeto em dado matricial (imagem) é obtido, de
forma simples, através da contagem dos pixels que pertencem ao objeto.
Para o cálculo do perímetro de um objeto, representado na forma matricial, é necessário
extrair os pixels de borda. Existem vários algoritmos para a extração de pixels de borda,
cada um com sua característica peculiar. Uma simples definição do perímetro de um
objeto em dados matriciais é dada pelo número de pixels pertencente a borda do objeto.
Defini-se borda como sendo a fronteira entre duas regiões, cujo níveis de cinza
predominantes são relativamente diferentes (Marques Filho e Vieira Neto, 1999).
Existem na literatura vários algoritmos desenvolvidos com objetivo de obter um valor
do perímetro mais próximo do valor real. Intuitivamente, o perímetro de um objeto pode
ser calculado medindo-se (percorrendo-se) todos os lados do mesmo. Observa-se que o
45
resultado do cálculo do perímetro por esse métodos tem o mesmo valor de um retângulo
envolvente ao objeto. Essa é uma limitação do método. A representação de objetos na
forma matricial pode introduzir erros na definição de suas bordas dependendo da sua
escala, rotação e a complexidades do objeto.
A Figura 2.4 apresenta o mesmo objeto (um quadrado) em duas posições na imagem.
Pode-se notar o aparecimento de um efeito “escada” onde deveria aparecer uma linha
inclinada. Nesse caso, o valor do perímetro calculado pelo lado dos pixels pertencentes
a borda, aproximadamente dobra quando o quadrado é rotacionado em 45° (quadrado a
direita ).
FIGURA 2.4 – Diferentes valores do perímetro para um mesmo objeto.
Outro algoritmo de cálculo do perímetro de um objeto é executado através de
operadores de detecção, que percorrem toda a borda do objeto, geralmente no sentido
horário. Os operadores de detecção identificam os pixels pertencentes à borda do objeto,
os quais são utilizados no cálculo do perímetro (Gose et al., 1996).
A Figura 2.5 apresenta configurações de operadores de detecção através de uma janela
de 4 pixels. Os pixels escuros representam os pixels pertencentes ao objeto. Se existir 4
pixels escuros em uma uma janela de 4 pixels, o pixel em análise não faz parte da borda
do objeto. Através de cada configuração, o algoritmo pecorre o objeto em direções
diferentes, dependendo da configuração dos operadores (configuração de 1, 2 ou 3
pixels), até o pixel inicial da análise.
46
FIGURA 2.5 – Operadores de detecção. As setas indicam a direção de movimentação
dos operadores. Os pixels escuros identificam aqueles pertencentes ao objeto.
O cálculo do perímetro utilizando operadores de detecção pode ter valores diferentes
para um mesmo objeto, dependendo da configuração de vizinhança estabelecida para os
operadores. A Figura 2.6 simula um objeto em uma imagem 2D, utilizando para o
cálculo do perímetro operadores de detecção em uma janela de 4 pixels. Observa-se três
configurações dos operadores de detecção (em vermelho) e suas direções de
deslocamento em um mesmo objeto. A primeira configuração apresenta uma
configuração de 2 pixels e a sua direção de deslocamento (para cima), a segunda
configuração é de 1 pixel e seu descolcamento para o lado direito, e por último a terceira
configuração de 3 pixels com o deslocamento para cima. Seguindo esse mesmo
raciocínio, percorre-se todo o objeto identificando os pixels de borda . A restrição deste
método é que o cálculo do perímetro em dados matriciais não é invariante à rotação.
47
FIGURA 2.6 – Exemplos de cálculo de perímetro por operados de detecção.
Como boa parte dos atributos de forma utilizam na sua formulação o perímetro como
uma variável, torna-se indispensável a eficiência na estimação do perímetro, que irá
implicar em uma melhor representação dos atributos de forma.
A extração de atributo da forma constitui-se em uma importante fonte de dados para o
processo de classificação de imagens, contribuindo em muitos casos para um melhor
desempenho no processo de classificação. Segundo Soltanian-Zadeha et al. (2004),
pode-se representar a forma de um objeto através de modelos. Esse método foi bastante
utilizado, mas é ineficiente. Cada objeto requer um único modelo para representar cada
possível orientação ou localização do objeto na imagem, tornando-se inviável a sua
aplicação no processamento de imagens.
Progressos recentes na área de tecnologia de computadores, tornaram possível o
desenvolvimento de atributos de forma na representação global em uma imagem (Duda
et al., 2001). Atributos de momento, coeficiente de Fourier são exemplos de métodos de
análise da forma de objetos em imagens digitais.
Outros métodos de análise da forma depende do conhecimento do contorno do objeto,
por exemplo, chain coding (Jahne, 1997). Pode-se categorizar os diferentes métodos
entre os baseados na representação de região ou contorno. Cada representação fornece
várias medidas da forma de um objeto em uma imagem. Uns dos atributos mais
utilizados são o comprimento, a largura e a área dos objetos. Outros atributos de forma
podem exigir uma alta complexidade computacional. Segundo Gose et al. (1996), outra
48
medida de forma que pode ser utilizada como atributo é o perímetro (P) ao quadrado
dividido pela área (A) de uma região. Esse atributo é chamado de complexidade. Para
um objeto igual a um círculo de raio r ,esse atributo tem valor igual:
57,124/)2(/ 222 === πππ rrAP (2.32)
Objetos com formas diferentes apresentam valores mais altos. Por exemplo, P2/A = 16
para todos os quadrados e P2/A = 20,78 para um triângulo eqüilátero.
Pode-se modificar o atributo de complexidade com o objetivo de produzir uma medida
de circularidade ou coeficiente de compacidade (compactness) definido por:
2/4 PAC π= (2.33)
A circularidade é um atributo adimensional que varia de 0 a 1. Se o objeto for um
círculo a medida de circularidade é igual a 1. O atributo de circularidade é fortemente
utilizado nos sistemas de reconhecimento de padrões, pois tem a característica de ser
invariante a rotação e a mudança de escala, já que o mesmo depende dos descritores
simples como a área e o perímetro, e esse por sua vez, não deveria depender da rotação
das regiões.
Os atributos de forma possibilitam a separação dos objetos que possuem formas
diferentes e mesma resposta espectral. A análise da forma do objeto é de fundamental
importância para estudos relacionados com o espaço urbano. Alguns objetos em
imagem de alta resolução possuem semelhanças na resposta espectral, sendo necessário
aplicar outros tipos de atributos para separar esses objetos. Por exemplo, os telhados, no
caso das áreas urbanas, podem ter semelhança na resposta espectral com as vias e ruas,
mas possuem formas diferentes. Essa análise poderia possibilitar o monitoramento e
planejamento da expansão de uma cidade através de imagem de satélite, principalmente
imagens de alta resolução espacial.
49
2.4 Seleção de Atributos
Pode-se pensar, erroneamente, que quanto maior o número de atributos para representar
um padrão (classe), maior o poder discriminatório do classificador. Porém, nem sempre
isso é verdade. Na prática, o que acontece, é uma degradação na acurácia dos resultados
da classificação com o aumento da dimensionalidade dos dados, mantendo-se constante
o número de amostras de treinamento. Segundo Jain et al. (2000), existem duas razões
para reduzir a dimensionalidade: diminuir o custo de processamento e aumentar a
acurácia da classificação.
As buscas por soluções mais rápidas, automáticas e de baixa complexidade
computacional, proporcionaram avanços significativos no desenvolvimento de
algoritmos de seleção de atributos. A forma ideal para se obter o melhor subconjunto de
atributos em processamento de imagem é através do cálculo do erro de classificação.
Para um número alto de atributos, esse método se torna inviável, pois o cálculo do erro
deverá ser feito para todas as combinações de atributos, o que envolve a classificação de
um número grande de padrões.
A seleção de atributos é uma tarefa de difícil realização, pois depende dos dados de
entrada, isto é, do domínio da aplicação (Dutra e Huber, 1999). O problema da seleção
de atributos começa com a seleção de um conjunto de m-dimensões, onde cada
dimensão representa um atributo, a partir de um conjunto de d-dimensões, onde m ≤ d
(Dutra e Huber, 1998). Métodos automáticos de seleção de atributos são importantes em
muitas situações em que se tem disponível um conjunto com um número grande de
atributos e deseja-se selecionar um subconjunto adequado para solucionar o problema.
A seleção de atributos é uma técnica de otimização que, dado um conjunto de d
atributos, tenta selecionar um subconjunto de tamanho requerido que maximiza uma
função critério.
Os algoritmos de seleção de atributos são desenvolvidos principalmente para reduzir a
dimensionalidade sem que ocorra perda na eficiência do poder de distinção das classes
pelo classificador. Essa fase é destinada à escolha dos atributos que melhor distinguem
as classes previamente selecionadas. A maioria dos métodos de seleção de atributos
50
utiliza princípios estatísticos, ou seja, medidas estatísticas dos atributos entre pares de
classes, selecionando os atributos que contém informações relevantes para reproduzir o
problema.
Há várias formas de medir a distância entre conjuntos de classes diferentes no espaço de
atributos. Dentre elas, pode-se citar (Theodoridis e Koutroumbas, 1999; Kohn, 1998):
Distância Euclidiana: distância entre dois pontos (Figura 2.7). No espaço de
atributos d-dimensional a distância euclidiana entre um ponto x qualquer e o centróide
(média) da classe k é definida por:
∑=
−=d
iikixk xE
1
2)( µ (2.34)
onde xi é o valor do atributo i no ponto x, µ ik é o valor médio do atributo i na classe k e
d é o número de atributos.
FIGURA 2.7 – Distância Euclidiana no espaço de atributos.
51
Distância de Mahalanobis: distância entre um ponto e o centróide de uma
distribuição (Figura 2.8). A distância de Mahalanobis entre um ponto x e a classe k é
definida por:
[ ] )()( 1 xxM kkt
kxk −−=−∑ µµ (2.35)
onde µk e Σk representam o vetor de média e a matriz de covariância da classe.
FIGURA 2.8 – Distância de Mahalanobis no espaço de atributos.
Distância de Bhattacharyya: medida da similaridade entre duas distribuições
estatísticas (Bhattacharyya, 1943). Na seleção de atributos, a distância de Bhattacharyya
entre a distribuição x e a distribuição da classe k é dada por:
xk
xk
xkxkt
xkkxB∑∑
∑+∑
+−
∑+∑
−=− 2ln
21)(
2)(
81 1
µµµµ (2.36)
onde µk e µx são os vetores de média e Σk e Σx representam as matrizes de covariância
da classe k e de x.
52
A Figura 2.9 apresenta um exemplo de aplicação da distância de Bhattacharyya,
calculando a distância da distribuição x entre as classes 1 e 2 em duas dimensões.
FIGURA 2.9 – Distância de Bhattacharyya no espaço de atributos.
Para executar a seleção de atributos com base em distâncias entre classes, é necessário
definir uma função critério que possa avaliar a separabilidade entre todas as classes de
uma maneira global. A função critério para a maioria das distâncias citadas acima pode
ser efetuada por uma simples operação de soma, média, desvio padrão e outras
características estatísticas entre os pares de classes existente (Dutra e Huber, 1998). É
desejável que a função critério seja maior quanto menor for a redundância entre os
atributos e quanto maior a facilidade de discriminar padrões de classes diferentes.
Ao utilizar uma função critério em métodos de seleção de atributos deve-se maximizar a
distância entre padrões de classes diferentes no espaço de atributos, visando otimizar o
conjunto de atributos para minimizar a probabilidade de erro na classificação.
A distância Jeffrerys-Matusita (distância JM) é uma função critério muito utilizada, que
expressa as medidas estatísticas de separabilidade entre duas distribuições (Richards,
1993). A distância JM entre as classes x e k é dada por:
53
)1(2 xkBxk eJM −−= , JM ∈ [0, 2 ) (2.37)
onde Bxk representa a distância de Bhattacharyya entre as classes x e k.
As medidas estatísticas citadas acima, representam um conjunto de distâncias utilizadas
no cálculo da separabilidade entre classes no espaço de atributo. Essa separabilidade é
usada nos métodos de seleção de atributos. Segundo Boz (2002), os algoritmos de
seleção de atributos são divididos em três grupos: exponenciais (busca exaustiva),
randômicos (algoritmo genético) e seqüenciais. De acordo com Jain e Zongker (1997),
tais abordagens podem ser agrupadas nas categorias de Reconhecimento Estatístico de
padrões (REP) e em redes neurais, cuja taxonomia é apresentada na Figura 2.10.
FIGURA 2.10 – Taxonomia dos métodos de seleção de atributos.
FONTE: Adaptada de Jain e Zongker (1997, p. 2).
Na área de REP, os métodos exploram as distribuições estatísticas dos atributos,
aplicando métodos determinísticos e estocásticos na obtenção dos subconjuntos de
atributos ótimos e sub-ótimos. Os métodos de seleção de atributos aplicados em redes
54
neurais buscam selecionar os melhores atributos para sua camada de entrada (utilizada
para a redistribuição da informação de entrada), selecionando o mais significativo na
etapa de classificação.
2.4.1 Seleção de Atributos em Redes Neurais Artificiais
O método Node Pruning é o método mais utilizado na literatura em aplicação de redes
neurais (Mao et al., 1994). Também chamado de “corte de nós”, funciona através de
uma rede neural multi-camadas com retro-alimentação, utilizando um algoritmo de
aprendizado baseado em retro-propagação (backpropagation). Segundo Campos (2001),
esse método é definido por uma medida de “significância de nós” e utiliza um algoritmo
que elimina os nós menos significativos. Dessa forma, reduz-se o conjunto de
treinamento da rede, diminuindo a complexidade.
2.4.2 Seleção de Atributos em Reconhecimento Estatístico de Padrões
O método de seleção de atributo utilizado para extrair um subconjunto ótimo do
conjunto global de atributos é a busca exaustiva. O número de possibilidades desse
método cresce exponencialmente, fazendo a busca exaustiva pouco utilizada para um
número alto de atributos. O que se faz é extrair um subconjunto ótimo do conjunto
global de n atributos para um número fixo de k atributos. A esse método dá-se o nome
de método de seleção de atributos exaustivo de escolha fixa (FIXO).
Segundo Narendra e Fukunaga (1994), o algoritmo branch-and-bound de seleção de
atributos extrai um subconjunto ótimo sem efetuar a busca exaustiva. A principal
característica do algoritmo é a propriedade monotônica da função critério, cujo valor
aumenta à medida que se adiciona um atributo no conjunto global de atributos.
Os métodos que extraem subconjuntos sub-ótimos utilizam duas abordagens:
determinística e estocástica. As duas abordagens proporcionam a seleção de uma única
solução (único caminho) ou de várias soluções (múltiplos caminhos) para o problema de
seleção de atributos. Os métodos seqüenciais são os mais utilizados para selecionar um
único subconjunto. Dos métodos que fornecem múltiplos caminhos para a solução do
55
problema, os algoritmos genéticos destacam-se por utilizar um conjunto de soluções a
cada iteração.
2.4.2.1 Algoritmo Genético (AG)
Os métodos tradicionais de seleção, que trabalham com apenas uma solução, são
aplicados para solucionar problemas com único caminho. A otimização por múltiplos
caminhos exige que o método de busca encontre um conjunto de soluções ideais, e não
uma solução global ideal.
Os algoritmos genéticos (AG) simulam a evolução de uma população de indivíduos
(conjunto global de atributos), baseados na teoria da seleção natural, com o objetivo de
encontrar a solução final de um determinado problema (Harper et al., 2005). A teoria da
seleção natural especifica que os indivíduos (subconjunto de atributos) mais aptos, com
relação a um determinado ambiente, têm maior probabilidade de sobreviverem e
aumentar a sua descendência neste ambiente.
A aplicação de um algoritmo genético a um determinado problema consiste em
especificar cada subconjunto de atributos como uma possível solução do problema,
determinar uma população formada por estes subconjuntos de atributos, e o mais
importante, determinar uma forma de avaliação da aptidão de cada subconjunto de
atributos com relação ao ambiente em que este se encontra. O ambiente é a
representação do problema que se quer solucionar.
A aptidão ou valor de aptidão do subconjunto de atributos representa o quão próxima da
solução ótima (melhor solução possível), está a possível solução representada pelo
subconjunto de atributos deste problema. Normalmente, os subconjuntos de atributos
mais aptos de uma população têm maior probabilidade de se reproduzirem ou serem
alterados através de operadores genéticos como recombinação genética e mutação (ação
do ambiente selecionando os subconjuntos de atributos mais aptos). Desta forma, novos
indivíduos são obtidos a partir de indivíduos com elevados valores de aptidão, com o
objetivo de gerar um indivíduo que represente a solução ótima do problema.
56
Algoritmos genéticos foram provados, teoricamente e empiricamente, eficientes em
buscas robustas em espaços complexos de soluções, podendo ser aplicados a problemas
de otimização de complexos sistemas de equações não lineares restritas. Diversos
artigos e dissertações estabelecem a validade do método em aplicações de otimização de
funções e controle, que necessitam de soluções com elevado índice de aproximação das
soluções exatas (Harper et al., 2005; Zhang et al., 2004; Meyer e Packard, 1992; Tsutsui
e Fujimoto, 1993; Mitchel, 1998).
Apesar das vantagens, os AG não são eficientes para muitos problemas. Segundo
Lacerda e Carvalho (1999), os AG são bastantes lentos. Enquanto os AG estão
avaliando a população inicial, muitos outros métodos de seleção de atributos
convencionais já encontravam a solução. Segundo Beasley et al. (1993), a área de maior
interesse para os AG é aquela que envolve problemas de difícil otmização pelas técnicas
convencionais. Quando uma técnica convencional pode ser utilizada, ela geralmente é
mais rápida e mais precisa que os AG.
2.4.2.2 Simulated Annealing
Simulated Annealing (SA) é um método de busca aplicado extensamente na solução de
muitos problemas de otimização combinatorial (Azizi e Zolfaghari, 2004). Este método
é utilizado para contornar o problema dos mínimos locais, e permite encontrar a solução
global ótima. O processo se inicia com um atributo qualquer do espaço de soluções,
normalmente gerado aleatoriamente, e seleciona um de seus vizinhos randomicamente.
Se este vizinho fornecer melhor discriminação entre as classes que o atributo original,
ele é aceito e substitui a solução corrente. Segundo Reeves (1993), se o algoritmo ao
incrementar o atributo, piorar por uma quantidade ∆, ele é aceito com uma
probabilidade e-∆/T, onde T decresce gradualmente conforme o progresso do algoritmo.
Esse processo é repetido até que T seja tão pequeno que mais nenhum movimento seja
aceito. A melhor solução encontrada durante a busca é tomada como uma boa
aproximação para a solução ótima.
Originalmente, Simulated Annealing foi derivado de simulações em termodinâmica e
por esta razão o parâmetro T é referenciado como temperatura e a maneira pela qual ela
57
é reduzida é chamada de processo de resfriamento. Diversos artigos estabelecem a
validade do método em aplicações de otimização (Azizi e Zolfaghari, 2004; Hajek,
1988; Huang et al., 1986; Thompson e Dowsland, 1995).
A área de aplicação do SA é em problemas de difícil otmização pelas técnicas
convencionais. Apesar do método SA convergir para a solução ótima, a velocidade de
redução de temperatura exigida implica em visitar um número exponencial de soluções.
A princípio é necessário um processo lento de redução da temperatura e isso resulta em
tempos de processamento elevados. Segundo Reeves (1993), outra desvatagem na
utilização dos método AS é a calibração de muitos parâmetros. Isso torna o processo de
seleção mais lento e com uma alta complexidade computacional.
2.4.2.3 Algoritmos Sequenciais de Seleção de Atributos
Os métodos seqüenciais de seleção de atributos têm sido estudados em vários trabalhos
(Dutra e Huber, 1999; Jain e Zongker, 1997). Segundo Dutra e Huber (1999), os dois
métodos seqüenciais mais proeminentes da seleção de atributos são: Sequential
Forward Feature Selection (SFS) e Sequential Backward Feature Selection (SBS).
O algoritmo de seleção seqüencial para frente (SFS) vem sendo utilizado na tentativa de
resolver a tarefa de seleção de atributos (Dutra e Huber, 1999; Jain et al., 2000;
Campos, 2001). O métodos SFS é facil de implementar, possui baixo custo
computacional e muito utilizado na solucão de problemas de otmização e busca.
Aplicado em sistemas, onde pretende-se obter um subconjunto de atributos com
eficiência e de forma rápida, o métodos SFS apresenta uma aceitável solução para o que
se propõe.
Nos sistemas de processamento de imagens, o método SFS é utilizado principalmente
na seleção dos canais que melhor discriminam as classes. Outra utilização é na escolha
dos melhores atributos que representam uma classe (variância, média, entre outros), e
que serão utilizados no preocesso de classificação.
58
O algoritmo SFS inicia com um conjunto vazio (Y0= φ) e, conforme o algoritmo é
executado, o melhor atributo x+ é inserido no subconjunto, resultante do máximo valor
da função critério J (YK + x+), quando combinado com os atributos YK que já tenha sido
selecionado (Figura 2.11).
FIGURA 2.11 – Algoritmo SFS.
Os passos de 2 a 4 são continuamente repetidos até que um critério de parada seja
satisfeito. Para os métodos sequenciais, a seleção de atributos pode ser interrompida
quando o número de atributos selecionados for igual ao número de amostra de
treinamento da classe que possui a menor quantidade de amostras de treinamento.
O método SFS tem menor custo computacional quando se deseja obter conjuntos
pequenos em relação ao total de atributos (Jain e Zongker, 1997). Uma vez que um
atributo tenha sido selecionado, ele não pode ser descartado do subconjunto, o que pode
provocar o chamado efeito nesting. Este efeito ocorre quando o subconjunto ótimo não
contém elementos do conjunto já selecionado, o que impossibilita que seja obtido o
conjunto de atributos ótimo.
O algoritmo SBS, assim com método SFS vem sendo utilizado em trabalho
direcionando ao estudo de seleção de atributos em sistemas de processamento de
imagens (Dutra e Huber, 1999; Jain et al., 2000; Campos, 2001).
O algoritmo SBS inicia com um conjunto de atributos completo (Y0= X) e, nas iterações
do algoritmo, remove-se o atributo com o mínimo valor da função critério J (YK – x-),
onde YK é o conjunto de atributos já selecionado e x- é o atributo a ser removido (Figura
59
2.12). O método SBS tem menor custo computacional, quando se deseja obter conjuntos
grandes em relação ao total de atributos.
Uma desvantagem desse método é que as primeiras interações são executadas com o
número global de atributos. Se existir uma alta correlação entre os atributos em estudo,
o método pode eliminar o atributo que representa melhor a separabilidade entre as
classes. Isso por que, a discriminação das classes por esse atributo, pode não representar
uma boa separabilidades entre as classes quando unido a um subconjunto maior. Uma
vez eliminado o atributo, ele não retornará ao subconjunto de atributos selecionado para
a classificação.
FIGURA 2.12 – Algoritmo SBS.
Assim como o método SFS, pode-se utilizar o número de amostra de treinamento da
classe que possui a menor quantidade de amostras de treinamento como o critério de
parada na seleção de atributos.
60
61
CAPÍTULO 3
MATERIAIS E MÉTODOS
Este capítulo apresenta a descrição do protótipo utilizado na classificação de imagens
por região e as implementações dos algoritmos desenvolvidos neste trabalho. O sistema
Texture (Rennó et al, 1998) foi aperfeiçoado a fim de agregar métodos de seleção de
atributos e extração de atributos de forma, fornecendo um produto de análise de imagem
com um grande potencial de uso. Os algoritmos de extração de atributos de forma e
seleção de atributos, assim como a interface gráfica, foram implementados na
linguagem de programação IDL (Interactive Data Language), utilizando algumas
funções do ENVI. As atividades realizadas na implementação dos métodos de extração
e seleção de atributos e as interfaces do sistema são apresentadas a seguir.
3.1 Sistema Texture
3.1.1 Extração de Atributos
No processamento digital de imagem, a representação de uma região consiste em duas
alternativas: a representação de sua fronteira (forma); ou em termos dos pixels que
compõem a região (textura). Quando se trabalha com classificação de regiões, as
informações contextuais e geométricas podem ser importantes para a representatividade
das regiões que representam uma determinada classe. Extrair informações significativas
das classes descreve a eficiência dos métodos de extração de atributos e possibilita uma
melhor discriminação das classes no processo de classificação.
O sistema desenvolvido possui métodos de extração de atributos de textura e de forma.
Os atributos de textura já existentes no sistema, foram reorganizados em 3 grupos:
Distribucional (dist), que se divide em dois subgrupos (básicos e particulares); co-
ocorrência (cooc); autocorrelação espacial (auto). A importância e a utilidade da textura
em sistema de reconhecimento de padrões é enfatizada pela grande quantidade de
trabalhos nestas áreas.
62
Nos últimos anos, muitos trabalhos têm se concentrado na utilização da informação
textural, em sistemas de processamento de imagens (Chang e Kuo, 1993; Manjunath e
Ma, 1996; Rennó et al., 1998; Arivazhagan e Ganesan, 2003). Neste caso, a eficiência
da representação dos atributos de textura é essencial para se obter uma boa
representação das classes, delimitando com maior precisão as fronteiras de
separabilidade das classes no espaço de atributos. Dessa forma, o classificador pode,
independente da sua complexidade, obter bons resultados na etapa de classificação.
Utilizou-se a estrutura do sistema Texture para agregar atributos de forma (shape), ao
processo de extração de atributos, que integrados ao sistema, fosse possível aumentar a
distinção entre as classes. A utilização dos atributos de forma é de fundamental
importância na análise da separabilidades das classes que possuem respostas espectrais
similares, mas apresentam geometrias diferentes. Dessa forma, a partição do espaço de
atributos se torna melhor definida, fornecendo um melhor desempenho do classificador
utilizado.
Os atributos são representados por vetores contendo medidas extraídas das imagens.
Utilizam-se esses vetores na seleção de atributos e na etapa de classificação,
examinando as distribuições estatísticas de cada atributo na distinção das classes. Deve-
se extrair atributos relevantes na separabilidade das classes para se obter bons resultados
no processo de classificação. Diante dessas características, o sistema pode disponibilizar
ao usuário a extração de um número elevado de atributos, tanto atributos de textura com
atributos de forma.
A Figura 3.1 apresenta um fluxograma dos atributos existentes no sistema
(distribucionais, co-ocorrência e autocorrelação espacial) e os atributos de forma dos
objetos (marcados por um retângulo vermelho).
63
FIGURA 3.1 - Fluxograma dos atributos existentes no sistema. O retângulo em
vermelho destaca os atributos implementados neste trabalho.
64
As informações (medidas) extraídas das regiões são registradas em uma estrutura de
dados que permite a imediata identificação da origem do atributo: nome da imagem,
banda utilizada, nome dos atributos e configuração. Separa-se a estrutura em layers,
onde cada layer possui informações do número de atributos e quais os atributos que
fazem parte desse layer, assim como a imagem na qual foram extraídas esses atributos.
A união de todos os dados, de todas as imagens, forma desta maneira, o espaço de
atributos.
Inicialmente, pode-se extrair todos os atributos existentes no sistema para um único
canal (banda de uma imagem) e fazer o mesmo procedimento para outros canais. O
sistema também suporta imagens de diferentes sensores na extração de atributos. O
objetivo de agregar essas características é a possibilidade de aumentar a eficiência do
classificador. É necessário que o usuário conheça as características de cada atributo,
pois fornecerão um melhor entendimento das medidas de separabilidade entre as
classes.
A possibilidade de extrair informações das regiões com objetivo de aumentar a
separabilidade entre as classes é grande, e a sua eficiência está diretamente ligada a
delimitação das regiões através do processo de segmentação ou pela aquisição dos ROI
(Region of Interest) a partir do ENVI.
Grande parte dos atributos de forma, em dados matriciais, utilizam os valores do
perímetro e da área de uma região na sua formulação, onde uma boa estimação do
perímetro e um preciso cálculo da área de uma região implica em uma melhor
representação dos atributos de forma. A seguir serão descritos os atributos de forma
implementados neste trabalho.
3.1.1.1 Área
Efetuou-se a implementação do atributo Área contando-se os pixels existentes em cada
região. Esse método de cálculo de área supõe que os pixels na imagem possuem a
mesma dimensão, ou seja, o tamanho do pixels seja constante.
65
3.1.1.2 Perímetro
Para o atributo Perímetro, primeiramente, desenvolveu-se um procedimento para a
detecção dos pixels pertencentes à borda, utilizando uma configuração de vizinhança 4
(Figura 3.2).
FIGURA 3.2 - Definição dos pixels vizinhos (em cinza) ao pixel k (em preto)
considerados na análise de borda.
Como todos os pixels pertencentes a uma determinada região possuem um mesmo
identificador, percorreu-se todos os pixels analisando a sua vizinhança. Se existir 4
pixels na configuração de vizinhança 4, que pertençam a mesma região, o pixel em
análise não faz parte da borda da região. Por exemplo, os pixels com valores diferentes
de 4 na Figura 3.3 são identificados como pixels de borda, os quais serão utilizados no
cálculo do perímetro.
FIGURA 3.3 – Detecção dos pixels de borda.
Os pixels pertencentes a borda são armazenados em uma estrutura que possui a
quantidade de pixels vizinhos ao mesmo e seus endereçamentos. A estimativa do
k
66
perímetro é feita através do cálculo da distância entre os centróides dos pixels de borda,
atributindo o valor 1 para pixels na horizontal e vertical ou 2 para pixels na diagonal.
Visando analisar as possíveis configurações dos pixels de borda, percorre-se todos os
pixels com uma vizinhança 8, estabelecendo as configurações de vizinhança para cada
pixel de borda.
O vetor criado para o cálculo do perímetro, inicia com um conjunto vazio. A medida
que percorre-se os pixels de borda, adiciona-se um determinado valor ao perímetro,
dependendo da configuração dos pixels. A Figura 3.4 apresenta exemplos de três
possíveis configurações de vizinhança 8 para cada pixel de borda. Na primeira
configuração (Figura 3.4a), o pixel em análise possui pixels adjacentes na horizontal e
vertical. Para o cálculo do perímetro, essa configuração acrescenta um valor de 2
unidades. A configuração apresentada na Figura 3.4b, possui um pixel na horizontal ou
vertical e um pixel na diagonal. Essa configuração adiciona ao valor do perímetro 1+
2 unidades. Na última configuração, os pixels de borda adjacentes ao pixel em
análise, encontram-se na diagonal, essa por sua vez, adiciona ao valor do perímetro
2 2 unidades. Como o pixel seguinte da análise encontra-se na configuração anterior,
ao final do cálculo do perímetro, somam-se os valores contido no vetor do perímetro e
divide-se o valor encontrado por 2. Dessa forma, calcula-se o valor do perímetro para
cada região existente na imagem.
(a)
(b)
(c)
FIGURA 3.4 – Exemplos de configurações de vizinhança 8 para os pixels de borda.
67
Para melhor percepção do cálculo do perímetro utilizando a metodologia descrita acima,
um exemplo de duas configuração dos pixels de borda (A e B) é apresentado na Figura
3.5. A configuração A apresenta uma análise para o pixel de borda, atributindo um valor
de 2 unidades (pixels adjacentes ao pixels em análise na horizontal e na vertical) no
cálculo do perímetro. Na configuração B, atribui-se o valor 1+ 2 (um pixel adjacente
na vertical e outro na diagonal) no cálculo do perímetro.
FIGURA 3.5–Delimitação do perímetro. Em detalhe, duas configurações (A e B) de
vizinhança para cada pixels de borda. A linha azul marca o perímetro estimado.
3.1.1.3 Complexidade
Implementou-se os atributos de complexidade com o objetivo de extrair informações da
forma das regiões, a fim de aumentar o poder discriminatório do classificador, conforme
Equação 2.32.
3.1.1.4 Circularidade
Definiu-se o atributo de circularidade ou coeficiente de compacidade (compactness),
conforme Equação 2.33. A circularidade é um atributo adimensional que varia de 0 a 1.
68
Um objeto que possui uma forma semelhante a um círculo, o valor da circularidade
aproxima-se a 1. Para outros objetos, o valor da circularidade é menor.
3.1.2 Seleção de atributos
No processamento de imagens, é necessário escolher diferentes atributos
(características) conforme as classes de interesse. Um número alto de atributos não
implica em uma boa classificação, ao contrário, pode existir uma alta correlação entre
os atributos, fazendo com que o custo de processamento aumente e podendo gerar
problemas matemáticos (inversão de matrizes). Faz-se então necessário escolher os
atributos mais representativos, ou seja, que melhor discriminam as classes de interesse.
Isso é possível aplicando os métodos de seleção de atributos descritos na seção 2.3.
O sistema dispõe, durante a etapa de extração de atributos no sistema, de uma grande
quantidade de atributos , pois existe possibilidade de extrair todos os atributos de várias
imagens diferentes e ainda o sistema proporciona muitas configurações, tanto para a
matriz de co-ocorrência como para as autocorrelações espaciais. Para um número alto
de atributos, a análise visual não proporciona um bom resultado na seleção dos
melhores atributos, decorrente da limitação do sistema em apresentar dados multi-
dimensionais.
A etapa de seleção de atributos é uma das principais tarefas de processamento de
imagens, utilizada para selecionar os atributos mais representativos na separabilidade
das classes. É importante lembrar, que um atributo é considerado relevante se ele é
capaz de distinguir objetos pertencentes a cada classe.
O sistema oferece uma ferramenta visual de análise dos atributos em duas dimensões
para cada classe (Figura 3.6). Pode-se visualizar dois gráficos nessa análise: o primeiro
apresenta a dispersão dos atributos para as amostras de treinamento em cada classe; e o
segundo apresenta essa dispersão de forma escalonada (entre 0 e 1), utilizada nos
processos de seleção e classificação. O usuário pode através dessa análise eliminar
alguns atributos que visualmente não apresentam uma boa separabilidade entre as
classes, ou ainda executar a fusão (merge) entre as classes que apresentam similaridades
69
na dispersão dos atributos. A Figura 3.6a apresenta a distribuição dos valores do
atributo de média das amostras de treinamento para cada classe (1, 2 e 3). Cada traço,
no gráfico, representa o valor do atributo. O traço maior é a média dos valores do
atributo de cada classe. Observa-se que na Figura 3.6b a separabilidade dos valores do
atributo de circularidade é maior que na Figura 3.6a.
(a) (b)
FIGURA 3.6 – Análise dos atributos em duas dimensões para cada classe. (a) Atributo de média e (b) atributo de circularidade.
Considera-se a melhor seleção de atributos aquela que resulta numa classificação com
mínimo erro. Esse procedimento é bastante custoso, pois é necessário fazer todas as
combinações de atributos e analisar os resultados da classificação, selecionando-se o
grupo de atributos que obtém o melhor desempenho do classificador. Para minimizar
este problema, de forma que não ocorra perda na eficiência do classificador,
implementaram-se três métodos de seleção de atributos no sistema Texture: Sequential
Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) e o
algoritmo de escolha fixa do subconjunto de atributos (FIXO).
Um aspecto relevante na implementação é a possibilidade da aplicação dos métodos de
forma interativa, ou seja, pode-se utilizar os métodos sequenciais na seleção de um
subconjunto de atributos e posteriormente usar o método de busca exastiva de escolha
fixa na seleção de um subconjunto de atributos do subconjunto já selecionado pelo
70
método sequêncial. Isso torna-se importante, pois a complexidade do métodos de busca
exaustiva cresce exponencialmente, impossibilitando o seu uso para um número alto de
atributos. O que se faz é reduzir a dimensionalidade pelos métodos sequenciais e
posteriormente aplicar o método de busca exaustiva para selecionar o melhor
subconjunto no espaço reduzido. Todos os métodos são baseados em distâncias
estatísticas entre pares de classes.
Utilizou-se a distância JM com função critério no processo de seleção de atributos. O
primeiro passo é calcular a distância JM para todos os subconjuntos de atributos entre
pares de classes. Através do valor total da distância, de cada subconjunto de atributos,
efetua-se uma operação de média, ou seja, divide-se o valor total pelo número de
combinações entre pares de classes. A seleção do subconjunto de atributos é feita pelo
rank dos subconjuntos de atributos através do valor da maior distância média JM. O
primeiro subconjunto de atributos no rank (maior distância média JM) é selecionado
como o subconjunto que melhor discrimina as classes em estudo.
A partir das regiões de treinamento, fez-se a seleção de atributos pelos 3 métodos
propostos. A quantidade de atributos selecionados deve ser menor que o número
mínimo de amostras de treinamento para as classes analisadas. Isso porque, o cálculo da
distância de Bhattacharyya pode gerar problemas matemáticos de inversão de matrizes.
De acordo com as etapas de um sistema de processamento de imagens, implementaram-
se os métodos de seleção de atributos e posteriormente o algorimo de classificação por
região. Objetivando agregar essas etapas descritas anteriormente, implementou-se uma
interface de forma a conter as duas etapas. Com intuito de induzir o usuário a seguir as
etapas de processamento, desenvolveu-se algumas restrições que obriga o usuário a
primeiro selecionar os atributos e posteriormente efetuar a etapa de classificação.
3.1.3 Classificação
Uma classificação ideal, que corresponda totalmente a realidade, é muito difícil de ser
obtida, sendo uma tarefa mais geral, estimar a probabilidade de que um padrão (objeto)
71
pertença a uma determinada classe, baseando-se nos valores de algum atributo ou de um
conjunto de atributos.
A classificação por região analisa a variabilidade espacial de uma determinada região
em relação as classe em estudo. As regiões são extraídas pelo processo de segmentação.
Outra forma de extrair regiões de uma imagem é através da digitalização das regiões de
interesse (ROI). Assim como a etapa de extração de atributos pode ser executada
utilizando uma imagem segmentada ou regiões de interesse, o mesmo acontece com a
etapa de classificação.
O sistema Texture já dispunha de classificadores baseados na Máxima Verossimilhança
Gaussiana e na distância de Mahalanobis. Introduziu-se no sistema, um método baseado
em distância euclidiana. Esses métodos apresentam características peculiares e podem,
dependendo do problema, influenciar na eficácia da classificação.
3.2 Avaliação dos Métodos de Seleção e dos Atributos de Forma
Na avaliação, tanto para os atributos de forma quanto para os métodos de seleção de
atributos, foram desenvolvidos experimentos que evidenciam a sua eficiência em
sistemas de processamento de imagens. Os métodos de seleção de atributos foram
aplicados em todos os experimento a fim de selecionar o subconjunto que melhor
discrimina as classes definidas em cada experimento.
3.2.1 Imagens para Teste
Utilizaram-se imagens sintéticas e de sensoriamento remoto na validação dos métodos
de extração e seleção de atributos propostos. As imagens sintéticas foram usadas a fim
de obter um completo controle sobre as regiões existentes na mesma, tanto na análise
geométrica como nos valores espectrais.
Nas imagens sintéticas (960 x 720 pixels), foram representadas 3 formas geométricas
com diferentes dimensões: retângulo, círculo e triângulo. Cada forma geométrica possui
20 regiões, totalizando 60 regiões em toda a imagem. Através desse tipo de imagem,
procurou-se evidenciar a capacidade de discriminação dos objetos através de atributos
72
de forma e textura. Entretanto, como a representação de texturas é um problema
complexo, o álbum de texturas de Brodatz (1956) foi escolhido como fonte inicial de
dados de avaliação. O álbum de texturas de Brodatz tem sido frequentemente utilizado
em pesquisas de reconhecimento de padrões de texturas, pois apresenta grande variação
de tipos de texturas encontradas na natureza e de materiais sintéticos. Foram escolhidos
2 padrões de textura de Brodatz: Bark (D12) e Beach Sand (D29). Foram aplicados os
dois padrões de textura em cada forma geométrica como apresentada na em Figura 3.7.
Variaram-se aleatoriamente os valores de brilho e contraste de cada região.
FIGURA 3.7 – Imagem sintética com as duas texturas do álbum de Brodatz.
Para demonstrar a potencialidade dos métodos de extração e seleção de atributos
propostos para a classificação por região em imagens de sensoriamento remoto foi
utilizado uma imagem Landsat/TM banda 5 (400x400 pixels) da região da Floresta
Nacional Tapajós, situada no Estado do Pará (55° 03’ 35’’ a 55° 08’ 46’’ WGr, 03° 02’
07’’ a 03° 07’ 15’’S). A imagem Landsat/TM utilizada refere-se à órbita-ponto 227/062,
de 02 de agosto de 1999 (Figura 3.8).
73
FIGURA 3.8 – Imagem Landsat/TM banda 5.
3.2.2 Definição dos Experimentos
A fim de testar os métodos de extração e seleção de atributos para classificação de
regiões, desenvolveram-se experimentos, os quais utilizaram 38 atributos do sistema
proposto (Tabela 3.1). Utilizou-se a configuração da matriz de co-ocorrência 3x3 para
extrair os atributos de co-ocorrência.
TABELA 3.1– Atributos extraídos das regiões de treinamento.
F1 média (dist) F2 variância (dist) F3 desvio padrão (dist) F4 desvio absoluto da média (dist) F5 assimetria (dist) F6 curtose (dist) F7 coeficiente de variação (dist) F8 mediana (dist) F9 entropia (dist) F10 energia (dist) F11 média da log-normal (dist) F12 variância da log-normal (dist) F13 contraste (cooc) F14 entropia (cooc) F15 energia (cooc) F16 homogeniedade (cooc) F17 correlação (cooc) F18 dissimilaridade (cooc) F19 chi-quadrado (cooc)
F20 cluster shade (cooc) F21 cluster prominence (cooc) F22 média do vetor soma (cooc) F23 variância do vetor soma (cooc) F24 entropia do vetor soma (cooc) F25 energia do vetor soma (cooc) F26 média do vetor diferença (cooc) F27 variância do vetor diferença(cooc) F28 entropia do vetor diferença (cooc) F29 energia do vetor diferença (cooc) F30 contraste do vetor diferença (cooc) F31 área (shap) F32 perímetro (shap) F33 complexidade (shap) F34 circularidade (shap) F35 Lag 1,-1 (auto) F36 Lag 1,0 (auto) F37 Lag 1,1 (auto) F38 Lag 0,1 (auto)
74
O critério de avaliação da classificação, para todos os experimentos, foi executado
através da acurácia total (razão entre o número de regiões classificadas corretamente e
número total de regiões). Essa avaliação se deu na classificação das amostras de teste e
da imagem segmentada. Para a avaliação na imagem segmentada, foram escolhidas
aleatoriamente uma quantidade de amostras proporcional a cada classe no cálculo da
acurácia total.
3.2.2.1 Experimento Utilizando a Imagem Sintética
A partir da imagem sintética, foram preparados 3 experimentos a fim de testar a
eficiência dos métodos de extração e seleção de atributos na discriminação de objetos
com diferentes características de forma e textura. Para cada teste, extraíram-se amostras
de treinamento diferentes, com intuito de analisar todas as características dos atributos
existentes no sistema para cada região na imagem.
No primeiro experimento, buscou-se avaliar através dos processos de extração e
seleção, a viabilidade do uso dos atributos de forma na distinção de objetos com formas
geométricas distintas. Para tanto, a partir da imagem sintética, foram definidas 3 classes
de forma geométricas: retângulo, círculo e triângulo. Pode-se notar, pela Figura 3.9, que
cada classe (identificada por um retângulo colorido) apresenta as 2 texturas do álbum de
Brodatz, fazendo com que este experimento assemelhe-se ao estudo de separabilidade
entre classes que possuam padrões espectrais semelhantes, mas com a forma dos objetos
de cada classe diferente. Nesse experimento, selecionou-se de cada classe, 10 amostras
de treinamento (regiões destacados na Figura 3.9) utilizadas no processo de extração
dos atributos de forma e de textura (Tabela 3.1). As regiões restantes de cada classe
constituíram as amostras de teste utilizadas no cálculo da acurácia da classificação.
Utilizou-se o classificador de Mahalanobis e da distância Euclidiana no processo de
classificação das regiões.
75
FIGURA 3.9 – Imagem Original. O retângulo envolvente a cada forma geométrica
indica as classes em estudo. As regiões em destaque representam as amostras de treinamento.
O experimento 2 foi idêntico ao experimento 1 exceto pela rotação de algumas regiões
das amostras de treinamento e de teste, tendo por objetivo a análise dos atributos de
forma em relação a características de serem invariantes a rotação. Este teste consiste
em verificar se a representação dos atributos de forma através da rotação das regiões de
interesse extraídos pelos metódos propostos, é eficiente. A eficiência é verificada
quando os valores dos atributos extraídos nas duas imagens não tem alterações. A
Figura 3.10 apresenta a imagem com as regiões rotacionadas e as 10 regiões utilizadas
no treinamento.
FIGURA 3.10 – Imagem original. O retângulo envolvente a cada forma geométrica indica as classes em estudo. As regiões em destaque representam as amostras de treinamento.
76
No experimento 3, através da imagem sintética original (a mesma empregada no
experimento 1 e 2), procurou-se evidenciar as classes através das duas texturas álbum de
Brodatz: Bark (parte superior da Figura 3.11 ) e Beach Sand (parte inferior da Figura
3.11). O objetivo é analisar a eficiência dos métodos de seleção de atributos aplicados
ao número alto de atributo e verificar o desempenho do classificador para os
subconjuntos selecionados. Extrairam-se para cada classe, 15 amostras de treinamento
(regiões em destaque na Figura 3.11) e de teste.
FIGURA 3.11–Imagem original. A linha tracejada representa o limite entre as duas classes de textura. As regiões em destaque representam as amostras de treinamento.
3.2.2.2 Imagem de Sensoriamento Remoto
Na imagem de sensoriamento remoto, foram realizados dois experimento. Na extração
de atributos, utilizou-se apenas o canal 5 da imagem Landsat/TM, pois as classes em
estudo apresentam boa separabilidade nesse canal. Com base na imagem e no
conhecimento de campo, três classes de interesse foram definidas: Floresta primária
(FP), Desmatamento (DT) e água (AG).
77
No primeiro experimento, extrairam-se 20 amostras de treinamento e de teste para cada
classe, através da digitalização de ROI (Figura 3.12a), totalizando 120 regiões em toda a
imagem. As amostras de teste foram utilizadas na avaliação da classificação.
No segundo experimento, utilizou-se as mesmas amostras de treinamento do primeiro
experimento, mas na etapa de classificação, utilizaram-se uma imagem segmentada.
Usou-se na segmentação da imagem de sensoriamento remoto o segmentador proposto
por Sousa Junior et al (2003). Para a segmentação da imagem Landsat/TM utilizou-se
um limiar de área igual a 20 pixels e a similaridade de 10 níveis de cinza. Os valores
utilizados na segmentação foram estabelecidos pela análise visual do processo de
segmentação, os quais obtiveram uma melhor representatividade na delimitação dos
objetos. A Figura 3.12b apresenta a imagem segmentada utilizada no processo de
segmentação.
A imagem de referência utilizado neste trabalho foi confeccionada através dos dados
coletados em campo (Figura 3.12c). A metodologia usada para a confecção desse mapa
está descrita em Pardi Lacruz et al. (2001). Utilizaram-se as informações de campo na
definição das classes e na avaliação da classificação, analisando o desempenho do
classificador, visualizando não somente os acertos, mas também quais as classes cujas
amostras foram erroneamente classificadas e quais classes ocorreram confusão.
78
(a)
(b)
(c)
FIGURA 3.12 - Imagem de SR. (a) As regiões em destaque representam as amostras de treinamento, (b) imagem segmentada e (c) imagem de referência.
79
CAPÍTULO 4
RESULTADOS E DISCUSSÕES
O objetivo deste Capítulo é avaliar e discutir os resultados encontrados na aplicação dos
métodos de extração e seleção de atributos na classificação das diferentes classes
representadas através de atributos de forma e textura. Os resultados das atividades
realizadas na implementação dos métodos de extração e seleção de atributos e no
desenvolvimento e adaptação das interfaces no sistema são apresentados a seguir.
4.1 Teste com Imagens Sintéticas
Os resultados encontrados nos três experimentos utilizando imagens sintéticas para a
validação dos métodos de extração de atributos de forma e da aplicação dos métodos de
seleção de atributos para a classificação por região são apresentados a seguir.
4.1.1 Experimento 1
Os processos de extração, seleção e classificação descritos neste experimento, servem
de modelo para os outros experimentos. Com intuito de reorganizar os atributos por
classes de medidas, a interface de extração de atributos existente no sistema foi
modificada a fim de englobar todos os atributos por categorias (espectral, textura e de
forma).
A Figura 4.1 apresenta a interface de extração dos grupos de atributos. Cada grupo de
atributo possui características intrinsícas descritas na seção 3.1. Os atributos podem ser
extraídos de vários canais existentes na imagem. O sistema também oferece a
possibilidade de se extrair atributos de diferentes sensores.
80
FIGURA 4.1 – Interface de extração de atributos.
Com um conjunto global de 38 atributos extraídos (Tabela 3.1), selecionaram-se os
subconjuntos que melhor discriminaram as três classes definidas para este experimento.
A Figura 4.2 apresenta a interface de extração dos atributos de forma (área, perímetro,
complexidade e circularidade), implementados no sistema.
FIGURA 4.2 – Interface de extração dos atributos de forma.
A capacidade dos atributos de forma em separar as classes, no experimento, é
apresentada na análise visual na Figura 4.3, a qual apresenta a distribuição dos atributos
de forma: área (Figura 4.3a), perímetro (Figura 4.3b), complexidade (Figura 4.3c) e
circularidade (Figura 4.3d), extraídos das regiões de treinamento. As classes (Groups)
de interesse foram definidas como: 1-Retângulo, 2-Círculo e 3-Triângulo.
81
(a)
(b)
(c)
(d)
FIGURA 4.3 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade.
Pode-se observar a boa separabilidade dos atributos de complexidade e circularidade
entre as classes. Então, esses atributos devem ser selecionados e utilizados no processo
de classificação.
A interface de classificação existente no sistema foi modificada a fim de englobar os
métodos de seleção de atributos e a classificação pela distância euclidiana (Figura 4.4).
Convém notar que, a Figura 4.4 apresenta os atributos extraídos e as classes de interesse
(Available Groups), informando ao usuário quais os atributos usados, tanto na etapa de
seleção de atributos quanto no processo de classificação.
82
FIGURA 4.4 – Interface de classificação.
Através da estrutura criada para o armazenamento das informações das classes e dos
atributos extraídos, pode-se escolher manualmente o subconjunto de atributos que serão
utilizados na classificação ou aplicar os métodos de seleção para selecionar o melhor
subconjunto, utilizando a distância JM como função critério (JM Distance Feature
Selection).
A escolha dos melhores atributos é importante na obtenção de uma boa classificação. As
Figuras 4.5(a) e 4.5(b) apresentam os resultados das classificações do classificador de
Mahalanobis e do classificador pela distância Euclidiana, respectivamente, utilizando o
conjunto de 38 atributos.
83
(a) (b)
FIGURA 4.5 – Resultado da classificação utilizando todos os 38 atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana.
Observa-se que a utilização de um número alto de atributos não implica em uma boa
classificação, ao contrário, pode existir uma alta correlação entre os atributos, fazendo
com que o custo de processamento aumente, gerando problemas matemáticos (inversão
de matrizes), sendo necessário escolher os atributos mais representativos, ou seja, que
melhor discriminam as classes de interesse.
A Figura 4.6 apresenta a interface de seleção de atributos com os três métodos
propostos. Ao aplicar os métodos de seleção de atributos, o sistema seleciona um
subconjunto de atributos (à direita) do conjunto global de atributos (à esquerda). A
quantidade dos atributos que podem ser selecionados pelos métodos de seleção é
definida pelo usuário.
FIGURA 4.6 – Interface de seleção de atributos.
84
Aplicando-se os métodos de seleção propostos neste trabalho, obteve-se o valor da
distância média JM e a acurácia total da classificação para cada subconjunto de
atributos selecionados (Tabela 4.1). Para se alcançar uma avaliação mais eficaz na etapa
de classificação, utilizou-se um conjunto de amostras diferente do conjunto utilizado no
treinamento. A utilização desse conjunto de amostras evita que a classificação seja
tendenciosa.
TABELA 4.1– Atributos selecionados através dos métodos de seleção propostos.
Métodos Média JM
Acurácia Total (%)
Dist. Euclidiana
Acurácia Total (%)
Dist. Mahalanobis
SFS 1,3478 100 100SBS 1,0302 76,67 73,33FIXO 1,3478 100 100
SFS 1,4033 100 100SBS 1,0332 70 86,67FIXO 1,4033 100 100
Quant. De Atributos Atributos Selecionados
1
2 desvio absoluto da média (dist) e Correlação (cooc)Circularidade (shap) e Complexidade (shap)
Circularidade (shap)Correlação (cooc)
Circularidade (shap)
Circularidade (shap) e Complexidade (shap)
Observa-se que existem diferentes resultados de classificação para um mesmo
subconjunto de atributos, selecionado pelo método SBS. Isso ocorre, pois os métodos de
seleção que utilizam distâncias estatísticas garantem uma boa separabilidade entre as
classes, mas uma boa classificação não depende apenas dos métodos de seleção, mas
também do classificador utilizado.
Nesse experimento, com apenas o subconjunto de 1 atributo selecionado, pelos métodos
SFS e FIXO, obteve-se 100% de acerto na classificação das amostras de teste utilizando
os dois classificadores. Isso foi possível, pois o atributo de circularidade selecionado
possue uma alta separabilidades entre as classes no espaço de atributos. Para o método
SBS, a seleção de apenas um atributo não foi suficiente para classificar corretamente
todas as amostras de teste.
Na escolha de um subconjunto de 2 atributos, o resultado obtido pelo método SBS
apresenta valores menores na avaliação da classificação (acurácia total) e para a
distância média JM em relação aos métodos SFS e FIXO. Esse resultado era esperado,
pois os atributos mais significativos na discriminação das classes quando combinados
com uma quantidade alta de atributos correlacionados, pode não ser relevante na
85
separabilidade entre as classes, ou seja, ao aplicar o método SBS na escolha de um
subconjunto com poucos atributos em relação ao conjunto global, ocorre que, o
processo de busca do método eliminou os atributos relevantes na separabilidade entre as
classes.
A Figura 4.7 apresenta as distribuições dos subconjuntos de dois atributos selecionados
pelos métodos de seleção de atributos. Pode-se observar como a dispensão dos valores
dos atributos de circularidade e complexidade (Figura 4.7a) são bastante representativos
na separabilidade entre as classes do que os atributos de correlação e o desvio absoluto
da média (Figura 4.7b).
(a)
(b)
FIGURA 4.7– Distribuição em duas dimensões dos subconjuntos de dois atributos selecionados pelos métodos propostos: a) pelos métodos SFS e FIXO, b) pelo método SBS
86
4.1.2 Experimento 2
Neste experimento utilizou-se a mesma imagem empregada no experimento 1. A
modificação está no rotacionamento de algumas regiões de treinamento e de teste.
Analisou-se a distribuição dos valores dos atributos de forma, no espaço de atributo,
tendo com base os resultados dos valores obtidos no experimento 1.
A Figura 4.8 apresenta a distribuição dos atributos da forma das regiões rotacionadas:
área (Figura 4.8a), perímetro (Figura 4.8b), complexidade (Figura 4.8c) e circularidade
(Figura 4.8d), extraídos das regiões de treinamento. As classes (Groups) de interesse
foram definidas como: 1-Retângulo, 2-Círculo e 3-Triângulo.
(a)
(b)
(c)
(d)
FIGURA 4.8– Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade.
87
Verificou-se que houve modificação nos valores dos atributos de área e perímetro. Essa
modificação era esperada, pois a extração desses atributos em dados matriciais,
dependendo dos métodos e modelos utilizados nos seus cálculos, não é invariante a
rotação. Essa característica é apresentada na seção 2.3.5.
Para os atributos de complexidade e circularidade, a representação das regiões das
classes manteve-se aproximadamente com o mesmo grau de separabilidade em relação
ao experimento 1. Isso ocorre, pois existe uma relação entre os valores de área e
perímetro extraídos nos dois experimentos. Ou seja, se a área aumentou numa proporção
de 10 pixels, com a rotação de uma determinada região, o valor do perímetro aumentou
aproximadamente na mesma proporção. Os valores dos atributos de área e perímetro são
intrínsecos aos cálculos dos atributos de complexidade e circularidade. Desse modo, não
há modificações significativas nos valores dos atributos de complexidade e
circularidade na representação das classes com as variações nos valores dos atributos de
área e perímetro.
Com objetivo de analisar a classificação sem utilizar os métodos de seleção de atributos,
classificou-se as amostras de teste com o conjunto global de atributo, verificando o
desempenho dos dois classificadores propostos. As Figuras 4.9 (a) e 4.9 (b) apresentam
os resultados das classificações do classificador de Mahalanobis e do classificador pela
distância Euclidiana, respectivamente, para este teste.
(a) (b)
FIGURA 4.9 – Resultado da classificação com o conjunto global de atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana.
88
Os métodos de seleção de atributos tornam-se indispensáveis na obtenção de uma boa
classificação, selecionando os atributos mais significativos na separabilidade das
classes. Isso pode ser mais notável quando se utiliza o conjunto global de atributos na
classificação.
A metodologia aplicada na seleção dos subconjuntos de atributos para esse experimento
segue os mesmos procedimentos do experimento 1: após a extração dos atributos, o
sistema deve selecionar o atributo que melhor discrimina as classes de interesse, através
dos métodos propostos. Os dois classificadores utilizados no experimento 1 também
foram aplicados. A Tabela 4.2 apresenta os valores da distância média JM e a acurácia
da classificação para cada subconjunto de atributos selecionado.
TABELA 4.2 Resultado dos métodos de seleção de atributos e classificação das amostras de teste no Experimento 2.
Métodos Média JM
Acurácia Total (%)
Dist. Euclidiana
Acurácia Total (%)
Dist. Mahalanobis
SFS 1,3308 100 100SBS 0,7439 53,33 36,67FIXO 1,3308 100 100
SFS 1,4005 100 100SBS 0.9879 63,33 63,33FIXO 1,4005 100 100
Quant. De Atributos Atributos Selecionados
1
2 variância da log-normal (dist) e dissimilaridade (cooc)Circularidade (shap) e Complexidade (shap)
Circularidade (shap)variância da log-normal (dist)
Circularidade (shap)
Circularidade (shap) e Complexidade (shap)
* As siglas referem-se aos atributos descritos na Tabela 3.1.
Com apenas o subconjunto de um atributo obteve-se 100% de acerto na classificação
das regiões utilizando os dois classificadores. Ou seja, não é necessário selecionar
outros subconjuntos de atributos, pois com apenas um atributo o sistema alcançou o
maior valor da acurácia total da classificação. Efetuou-se a seleção de outro subconjunto
com o intuito de validar os métodos de seleção. A dimensionalidade é diretamente
proporcional à complexidade computacional, ou seja, quanto menor a dimensionalidade
dos dados, menor a complexidade computacional.
Para o classificador pela distância euclidiana, houve um decréscimo no valor da
acurácia total da classificação, utilizando as regiões rotacionadas. Isso ocorre, pois com
89
a modificação nos valores dos atributos, é possível que o valor de apenas um atributo de
uma região pertencente a uma determinada classe esteja mais próximo do valor da
média do mesmo atributo de outra classe, classificando a região erroneamente. Na
verdade, a aplicação desse classificador neste trabalho é apenas para ilustrar que uma
boa classificaçao não depende apenas dos métodos de seleção de atributos, mas também
da classificador utilizado.
4.1.3 Experimento 3
Neste experimento são utilizados, além dos atributos de forma, os atributos de textura
descritos na seção 2.2. As texturas são representadas através do álbum de texturas de
Brodatz (1956). A Tabela 4.3 apresenta os resultados da classificação através da
distância de Mahalanobis e o valor da distância média JM para cada subconjunto de
atributos selecionado.
TABELA 4.3– Resultado dos métodos seleção de atributos e classificação das amostras de teste no Experimento 3.
Métodos Média JM Acurácia Total (%)SFS 1,1259 93,33SBS 0,9752 50FIXO 1,1259 93,33
SFS 0,5775 96,66SBS 0,6217 66,66FIXO 0,6217 66,66
SFS 0,6609 93,33SBS 0,6863 80FIXO 0,6863 80
SFS 0,6959 96,66SBS 0,6975 86,66FIXO 0,6975 86,66
SFS 0,7017 96,66SBS 0,7003 90FIXO 0,7017 96,66
SFS 0,7042 96,66SBS 0,7037 96,66FIXO 0,7042 96,66
SFS 0,7057 96,66SBS 0,7055 96,66FIXO 0,7057 96,66
SFS 0,7064 100SBS 0,7062 96,66FIXO
F26, F15, F10, F9, F13 e F376 F2, F6, F9, F10, F15 e F17
Atributos Selecionados*
F10 e F15F10 e F15
Quant. De AtributosF26F15F26
F26 e F15
F6, F9, F10 e F15F6, F9, F10 e F15
F9, F10, F13, F15 e F26
F9, F10 e F15F9, F10 e F15
F26, F15, F10 e F9
F26, F15, F10, F9 e F13
1
3
4
2
5 F2, F6, F9, F10 e F15
F26, F15 e F10
F9, F10, F13, F15, F26 e F37
7
F26, F15, F10, F9, F13, F37, F6 e F12
F26, F15, F10, F9, F13, F37 e F6F2, F6, F9, F10, F15, F17 e F19F4, F6, F9, F10, F12, F15 e F37
F2, F5, F6, F9, F10, F15, F17 e F198
* As siglas referem-se aos atributos descritos na Tabela 3.1.
90
Observa-se que na maioria dos subconjuntos de atributos selecionados pelos três
métodos propostos, houve uma concordância entre a distância média JM com os valores
obtidos na acurácia total da classificação. Ou seja, o subconjunto selecionado que
obteve a maior média JM, alcançou a melhor acurácia na etapa de classificação. Nem
sempre isso é verdade, pois um bom resultado na avaliação da classificação não
depende apenas da aplicação dos métodos de seleção de atributos, mas também do
classificador utilizado.
O valor da acurácia total aumentou com o acréscimo de atributos nos subconjuntos de
atributos selecionados. Esse aumento é possível, pois a cada atributo adicionado ao
subconjunto utilizados na classificação, a separabilidade entre as classes no espaço de
atributos torna-se mais bem definida. Em alguns casos, com apenas um atributo
selecionado pode-se alcançar o melhor resultado na classificação. Ou seja, nem sempre
o acréscimo de atributo representa uma melhora desempenho do classificador. Isso
depende da distribuição dos dados. Os métodos de seleção de atributos foram
executados até um subconjunto de 8 atributos, pois o resultado encontrado na acurácia
total da classificação alcançou 100%, utilizando o método SFS.
Executou-se o método de busca exaustiva de escolha fixa (FIXO) até um subconjunto
de 5 atributos. Para os subconjuntos maiores, utilizando-se o método FIXO, usou-se o
método sequencial SFS na seleção de um subconjunto de 14 atributos e posteriormente
aplicou-se o método FIXO na seleção dos subconjuntos de atributos do subconjunto já
selecionado pelo método sequencial. Essa característica mostra a flexibilidade no uso
dos métodos de seleção de atributos no sistema. Isso é de fundamental importância na
utilização do método FIXO, pois a complexidade dos métodos de busca exaustiva
cresce exponencialmente, impossibilitando o seu uso para um número alto de
combinações. A Figura 4.10 apresenta o gráfico dos valores da acurácia total para cada
subconjunto de atributos selecionados neste experimento.
91
FIGURA 4.10 – Acurácia total da classificação para cada subconjunto de atributos
selecionado.
4.2 Imagens de Sensoriamento Remoto
Para este teste foram utilizadas imagens da superfície terrestre. Da mesma forma que no
teste com o álbum Brodatz, utilizou-se o classificador de Mahalanobis. A fim de testar
os métodos de extração e seleção para classificação de regiões, utilizou-se os 38
atributos de texturas e de forma existentes na Tabela 3.1.
A partir das regiões de treinamento, fez-se a seleção de atributos pelos 3 métodos
propostos, formando subconjuntos de até 12 atributos. Não foi possível selecionoar
subconjuntos maiores, pois ocorreram problemas matemáticos de inversão de matrizes,
decorrente da alta correlação entre os atributos extraídos. Para testar os métodos
propostos, realizaram-se dois experimentos: a) classificação de regiões digitalizadas
sobre a imagem Landsat/TM (experimento 1); b) classificação de regiões de uma
imagem segmentada a partir da mesma imagem Landsat/TM (experimento 2).
92
4.2.1 Experimento 1
No primeiro experimento, cada subconjunto de atributos selecionado pelos três métodos
(SFS, SBS e EF) foi avaliado pela classificação das regiões de teste, através da acurácia
total.
Esperava-se que o método FIXO obtivesse a melhor acurácia na classificação para todos
os subconjuntos de atributos selecionados em relação aos outros métodos de seleção,
pois esse método extrai um subconjunto ótimo do conjunto global de atributos, ou seja,
o método executa todas as combinações e seleciona o subconjunto que possui a maior
distância média JM. Mas isso não ocorreu porque os métodos de seleção que utilizam
distâncias estatísticas garantem uma boa separabilidade entre as classes, porém uma boa
classificação depende também do classificador utilizado.
A Tabela 4.4 apresenta os valores da distância média JM e a acurácia total para cada
subconjunto de atributos selecionados pelos três métodos de seleção propostos neste
trabalho.
TABELA 4.4 – Resultado dos métodos de seleção de atributos e classificação das amostra de teste em imagens de SR.
Métodos Média JM Acurácia Total (%)SFS 1,4142 98,33SBS 1,3468 96,66FIXO 1,4142 98,33
SFS 1,4129 98,33SBS 1,4122 100FIXO 1,4141 100
SFS 1,4139 98,33SBS 1,4135 100FIXO 1,4142 95
SFS 1,4142 93,33SBS 1,4139 98,33FIXO 1,4142 95
1
3
4
2
F8, F15 e F20F8, F10 e F11F1, F10 e F11
F8, F15, F20 e F23F8, F9, F10 e F11
F1, F10, F11 e F20
Atributos Selecionados
F8 e F11F1 e F11
Quant. De AtributosF8F11F5
F8 e F15
* As siglas referem-se aos atributos descritos na Tabela 3.1.
Para a classificação das regiões de teste, obteve-se um excelente resultado, alcançando
100% no valor da acurácia total, utilizando-se apenas 2 atributos selecionados pelos
métodos SBS e FIXO. A obtenção desse resultado foi possível, pois as classes em
93
estudo são bem separáveis, e com apenas a obtenção de estatística de primeira ordem,
como a média ou a mediana pode-se obter um bom desempenho na classificação.
Observa-se ainda que o acréscimo de atributo pode significar um melhor desempenho
do classificador, mas a partir do subconjunto de 3 atributos houve um decrécimo no
valor da acurácia da classificação, decorrente da seleção de atributos correlacionados.
4.2.2 Experimento 2
No segundo experimento, utilizaram-se as mesmas amostras de treinamento do
experimento 1. O classificador pode também ser treinado através das regiões extraídas
da imagem segmentada. Geralmente as regiões da imagem segmentada são utilizadas
quando se quer discriminar os objetos através da forma. No experimento proposto, as
classes são definidas através da características espectrais. Por isso, utilizou-se as regiões
digitalizadas na imagem.
A Tabela 4.45 apresenta os valores da distância média JM e a acurácia total para cada
subconjunto de atributos selecionados pelos três métodos de seleção propostos neste
trabalho. Para o cálculo da acurácia total utilizaram-se 684 pixels da classe floresta, 123
pixels da classe água e 100 pixels da classe desmatamento. Os pixels de cada classe
foram escolhidos aleatoriamente em uma quantidade proporcional a cada classe.
TABELA 4.5 – Resultado dos métodos de seleção de atributos e classificação da imagem segmentada.
Métodos Média JM Acurácia Total (%)SFS 1,4142 96,14SBS 1,3468 89,97FIXO 1,4142 96,14
SFS 1,4129 96,36SBS 1,4122 95,81FIXO 1,4141 93,94
SFS 1,4139 96,03SBS 1,4135 95,81FIXO 1,4142 93,71
SFS 1,4142 95,14SBS 1,4139 95,81FIXO 1,4142 94,93
1
3
4
2
F8, F15 e F20F8, F10 e F11F1, F10 e F11
F8, F15, F20 e F23F8, F9, F10 e F11
F1, F10, F11 e F20
Atributos Selecionados
F8 e F11F1 e F11
Quant. De AtributosF8F11F5
F8 e F15
* As siglas referem-se aos atributos descritos na Tabela 3.1.
94
Na etapa de classificação usou-se as regiões extraídas pelo processo de segmentação
(Figura 4.11a). O resultado da classificação da imagem segmentada utilizando o
classificador da distância de Mahalanobis com o subconjunto dos 2 atributos,
selecionado pelo método SFS (F8-mediana e F15-energia) é apresentado na Figura
4.11c. Para efeito de visualização do problema de classificar uma imagem utilizando
informações redundantes (atributos correlacionados), apresenta-se uma imagem
classificada, pela distância de Mahalanobis, utilizando os 38 atributos (Figura 4.11d).
Observa-se que, na Figura 4.11d, há muita confusão, ou seja, o número de regiões
classificadas corretamente é menor que na Figura 4.11c. Pode-se observar ainda que
com um número menor de atributos obteve-se um melhor resultado na classificação.
Estes resultados em imagens de sensoriamento remoto mostram que os métodos de
seleção propostos ao problema em estudo reduzem a dimensionalidade do espaço de
atributos, aumentando o poder discriminatório. Desta forma, os métodos podem ser
considerados um processo de redução de dimensionalidade. Esta redução elimina os
atributos que tem a menor relevância na separabilidade das classes. A dificuldade em se
classificar regiões decorrentes do processo de segmentação está na aceitação de que a
segmentação representa fielmente os objetos na imagem.
95
FIGURA 4.11 – Imagem de SR. (a) Imagem segmentada; (b) imagem de referência; (c) Imagem classificada utilizando um subconjunto de 2 atributos e (d) Imagem classificada com o conjunto global de atributos.
96
97
CAPÍTULO 5
CONCLUSÕES E RECOMENDAÇÕES
Os objetivos propostos neste trabalho foram alcançados, pois os algoritmos de extração
de atributos de forma e seleção de atributos implementados obtiveram resultados
bastante satisfatórios. Os métodos de extração e seleção de atributos aplicados à
classificação por regiões apresentaram resultados eficazes para o que se propunham.
Através do aprendizado adquirido ao longo desse trabalho e dos resultados obtidos nos
experimentos, elaborou-se uma descrição das conclusões e recomendações, com o
intuito de aprimorar o sistema desenvolvido.
5.1 Conclusões
Esse trabalho apresentou métodos de extração e seleção de atributos na classificação por
regiões. Através desses métodos, foi possível extrair atributos de textura e de forma dos
objetos (regiões) nas imagens sintéticas, selecionando os atributos mais relevantes na
separabilidade das classes. No processo de classificação, uma quantidade alta de
atributos pode não aumentar a precisão do classificador. Isso ocorre devido à
redundância das informações.
Os atributos de forma, agregados ao sistema, obtiveram resultados eficientes no
processo de classificação por regiões, nas imagens sintéticas utilizadas nos
experimentos, os quais comprovaram a viabilidade da utilização desses atributos em
análise de imagens. Observou-se que houve valores diferentes dos atributos de forma no
processo de rotação das regiões na imagem. Percebeu-se que esta variação de valores
não foi significativa, pois a variação dos valores do atributo de área era
aproximadamente proporcional à modificação no valor do atributo perímetro. Como os
atributos de circularidade e complexidade dependem dos atributos de área e perímetro,
os seus valores não tiveram variações significativas na imagem, entre os valores
encontrados nas regiões originais e nas imagens com as regiões rotacionadas.
98
O teste realizado com as texturas extraídas do álbum de Brodatz, revelou a
potencialidade do sistema em extrair uma quantidade alta de atributos (textura e forma).
Essa característica gera uma alta dimensionalidade, que influencia diretamente no
resultado da classificação. Assim, ao aplicar os métodos de seleção de atributos ao
conjunto global extraído pelo sistema, selecionou-se um subconjunto que aumentou o
desempenho do classificador.
Os resultados encontrados mostraram a viabilidade em se utilizar os métodos de seleção
de atributos, quando o objetivo é a redução da dimensionalidade sem que haja perda no
poder discriminatório entre as classes. Como não existe nenhuma relação determinística
entre métodos de seleção de atributos padrão e erro de classificação, conclui-se que
todas as estratégias de busca devem ser usadas para diminuir o número de avaliações na
escolha da decisão final baseada no erro da classificação.
Quanto à aplicação dos métodos de seleção de atributos, o critério de parada executado
pela avaliação da classificação ou pelo número de atributos que se deseja selecionar, foi
suficiente na verificação do desempenho do classificador nos testes da imagem sintética
e de sensoriamento remoto.
Foi verificada que com apenas um subconjunto de dois atributos selecionado obteve-se
o melhor valor na classificação da imagem de sensoriamento remoto. Isso depende, não
só do tipo de sensor utilizado, mas também da aquisição das amostras de treinamento. É
necessário que as amostras de treinamento representem fielmente cada classe, com isso
os limites de decisão no espaço de atributos apresentarão uma boa separabilidade entre
as classes.
Na implementação do método FIXO, na seleção de atributos, esperava-se que os
subconjuntos selecionados por esse método apresentassem uma melhor acurácia na
classificação, pois esse método extrai um subconjunto ótimo do conjunto global de
atributos, mas isso não ocorreu, porque os métodos de seleção que utilizam distâncias
estatísticas garantem uma boa separabilidade entre as classes, mas uma boa
classificação depende também do classificador utilizado.
99
As interfaces gráficas implementadas no sistema Texture, que acompanha as etapas do
sistema de processamento de imagens, são interfaces intuitivas e fáceis de usar. No
entanto, é de fundamental importância compreender as etapas do sistema de
processamento de imagens para se obter uma melhor compreensão da seqüência das
interfaces.
Uma das contribuições deste trabalho foi a pesquisa da influência do processo de
seleção de atributo nos sistemas de processamento de imagens, fundamental na
obtenção de uma boa classificação. Pode-se, então, concluir que os métodos de seleção
apresentaram os subconjuntos que melhor discriminam as classes de interesse, mas não
garante que com esses subconjuntos o sistema obterá uma melhor classificação. Isso
porque uma classificação que apresente uma boa acurácia, não depende apenas dos
métodos de seleção, mas também do classificador utilizado.
5.2 Recomendações
A principal contribuição deste trabalho é o aperfeiçoamento do processo de extração de
atributos proposta por Rennó et al. (1998) e aplicação de métodos de seleção de
atributos na classificação por regiões. Para continuar o trabalho nesta área, que se utiliza
processo de extração e seleção de atributos, existem outras pesquisas que poderiam dar
continuidade e auxiliar futuros estudos.
Ampliar o conjunto de extratores da forma das regiões. Da mesma forma que
se implementaram os atributos nesse trabalho, incorporar ao sistema outras
técnicas que mapeiem a distribuição da forma no espaço de atributos. Agregar
ao sistema de classificação por região um processo de segmentação de
imagens. Através da implementação desses métodos, o sistema abrangeria
todas as etapas do processamento de imagens digitais.
Implementar outros métodos de seleção de atributos, com o objetivo de
selecionar os subconjuntos mais relevantes na separabilidade das classes,
aplicando métodos estocásticos (determinados pelas leis da probabilidade;
aleatórios) ou métodos determinísticos que evitem o efeito de nesting.
100
Desenvolver métricas de avaliação e comparação com outros algoritmos de
seleção de atributos e aplicar em outras áreas de estudos com dados oriundos
de vários sensores.
Agregar ao sistema medidas de avaliação da classificação através de análise
estatística.
Considerando a possibilidade do desenvolvimento de um sistema de processamento de
imagens de acesso livre, algumas questões precisam ser resolvidas para uma maior
eficiência. Em primeiro lugar, deve ser elaborado um estudo para a modificação das
funções do ENVI para funções específicas do IDL. Isso porque o IDL possui um
utilitário (IDL Virtual Machine) multi-plataforma de distribuição gratuita para rodar
dados compilados em código IDL. O IDL Virtual Machine proporciona aos usuários
IDL distribuir suas aplicações, permitindo aos desenvolvedores de softwares
distribuírem facilmente seus softwares compilados em código IDL, ou aplicações sem a
necessidade de licença adicional.
Espera-se que este trabalho possa ter contribuído para mostrar a importância da
utilização da extração dos atributos de forma e a necessidade da aplicação dos métodos
de seleção de atributos em sistemas de processamento de imagens. Os códigos
desenvolvidos estão disponíveis na biblioteca digital URLib: www.dpi.inpe.br/texture/
(Oliveira e Rennó, 2005).
101
REFERÊNCIAS BIBLIOGRÁFICAS
Arivazhagan, S.; Ganesan, L. Texture classification using wavelet transform. Pattern Recognition Letters, v.24, n.12, p.1513-1521, 2003.
Azizi, N.; Zolfaghari, S. Adaptive temperature control for simulated annealing: a comparative study. Computers & Operations Research, v.31, n.14, p.2439-245. Dec. 2004.
Ballard, A.; Brown, C.M. Computer Vision. Englewood Cliffs: Prentice-Hall, 1983. 523p.
Beasley, D.; Bull, D. R.; Martin, R. R. An overview of genetic algorithms: part 1, fundamentals. University computing, v. 15, n.2, p.58-69, 1993.
Bhattacharyya, A. On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the Calcutta Mathematics Society, v.35, p.99–110, 1943.
Boz, O. Feature subset selection by using sorted feature relevance. In: International Conference on Machine Learning and Applications, 2002, Las Vegas, USA. Proceedings… [S.l.]: [S.n.], 2002.
Campos, T. E. Técnicas de seleção de características com cplicações em reconhecimento de Faces. 2001. 160p. Dissertação (Mestrado em Ciência da Computação) – Universidade de São Paulo, São Paulo, 2001.
Chang, T.; Kuo, J. C. Texture analysis and classification with tree-structured wavelet transform. IEEE Transactions on Image Processing, v.2, n.4, p.429-441, Oct. 1993.
Chen, S.; Zhu, Y.; Zhang, D.; Yang, J Y. Feature extraction approaches based on matrix pattern: MatPCA and MatFLDA. Pattern Recognition Letters, v.26, n.8 p.1157-1167, June 2005.
Curlander, J.; Kober, W. Rule based system for thematic classification in SAR imagery. IEEE Transactions on Geoscience and Remote Sensing, New York, p. 854– 856, july 1992. Special issue on the 1992 International Geoscience and Remote Sensing Symposium (IGARSS’ 92).
Donnay, J. P. Use of remote sensing information in planning. In: Stillwell, J.; Geertman, S.; Openshaw, S. (eds). Geographical Information and Planning. Berlin: Springer-Verlag, 1999. p.242- 260.
Duda R.O.; Hart P.E.; Stork D.G. Pattern classification. New York: Wiley, 2001. v.2, 654p.
Dutra, L. V.; Huber, R. Feature Selection For Ers-1/2 Insar Classification: High Dimensionalty Case. In: International Geoscience and Remote Sensing Symposium, 1998, Seattle, USA. Proceeding... [S.l.]: [S.n.], 1998.
Dutra, L. V.; Huber, R. Feature extraction and selection for ERS 1/2 InSAR classification. International Journal Remote Sensing, v.20, n.5, p.993-1016, 1999.
102
Fonseca, L. M. G. Processamento digital de imagens de sensores semotos. São José dos Campos: INPE, 2004. Disponível na biblioteca digital URLib: < http://www.dpi.inpe.br/%7Eleila/ser437.html >. Acesso em: 15 maio 2004.
Gonzales, R. C.; Woods, R. E. Processamento de imagens digitais. [S.l.]: Edgard Blücher, 2000. 509p.
Gose, E.; Johnsonbaugh. R.; Jost, S. Pattern recognition and image analysis. New Jersey: A Simon & Schuster, 1996. 484 p.
Haindl, M. Texture Synthesis. CWI Quarterly, v.4, n.4, p.305-331, 1991.
Haralick, R. M.; Shunmugan, K.; Dinstein, I. Texture feature for image classification. IEEE Transactions Systems, Man and Cybernetics, v. 3, n. 6, p.6610-621, Nov. 1973.
Haralick, R. M. Statistical and structural approaches to texture. IEEE Transactions on Image Processing, v.67, p.786-804, May 1979.
Harper, P. R.; Senna, V.; Vieira, I. T.; Shahani, A. K. A genetic algorithm for the project assignment problem. Computers & Operations Research, v.2, n.5, p.1255-1265, May 2005. No prelo.
Huang M. D.; Romeo, F.; Sangiovanni-Vincentelli, A. An efficient general cooling schedule for simulated annealing. In: IEEE international conference on computer aided design, 1986, Santa Clara, USA. Proceedings... Santa Clara: [S.n], 1986. p. 381-384.
Hussain, Z. Digital image processing: practical applications of parallel processing techniques. New York: Ellis Horwood, 1991. 406p.
Jahne, B. Digital image processing. Berlin: Springer-Verlag, 1997. 555p.
Jain, A. K.; Zongker, D. Feature-selection: evaluation, application, and small sample performance. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.19, n.2, p.152-157, Feb. 1997.
Jain, A. K.; Robert, P. W.; Moa, D.; Moa, J. Statistical pattern recognition: a review. IEEE Transactions On Pattern Analysis And Machine Intelligence, v.22, n.1, Jan. 2000.
Jensen, J. R.; Cowen, D. C. Remote sensing of urban/suburban infrastructure and socio-economic attributes. Photogrammetric Engineering and Remote Sensing, v.65, n.5, p.611-622, 1999.
Kohn, A. F. Reconhecimento de padrões, uma abordagem estatística. São Paulo: PEE/EPUSP, 1998. 205p.
Lambert, P.; Macairne, L. Filtering and segmentation: the specifity of color images. In: International Conference on Color In Graphics Image Processing, 2000, Saint Etienne, France. Proceedings... [S.l.]: [S.n.], 2000.
Lacerda, E. G. M.; Carvalho, A. C. P. L. Introdução aos algoritmos genéticos. In: Galvão, C. O.; Valença, M. J. S. Sistemas inteligentes: aplicações a recursos hídricos e ciências ambientais. Porto Alegre: Universidade/UFRGS; Associação Brasileira de Recursos Hídricos, 1999. p. 99-150.
103
Luiz, S.; Oliveira, C. G.; Okida, R. Comparação entre diferentes métodos de correção geométrica em imagem RADARSAT-1 no Flona Tapajós. In: Simpósio Brasileiro de Sensoriamento Remoto, 11., 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 325-332.
Mao, J.; Mohiuddin, K.; Jain, A. K. Parsimonious network design and feature selection through node pruning. In: International Conference on Pattern Recognition, 12., 1994, Jesusalem. Proceedings... 1994. p. 622-624. [S.l]: IAPR, 1994.
Marques Filho, O.; Vieira Neto, H. Processamento digital de imagens. Rio de Janeiro: Brasport, 1999. 406 p.
Meyer, T. P.; Packard, N. H. Local forecasting of high-dimensional chaotic dynamics. In: Workshop on Nonlinear Modeling and Forecasting, 1992, New York. Proceedings… New York: [S.n], 1992.
Nijenhuis, A.; Wilf, H. S. Combinatorial algorithms for computers and calculators. 2. ed. [S. l.]: Academic Press, 1978. 320p.
Oliveira, J. A.; Rennó, C. D. Texture 1.0: a region classifier using textural measures. São José dos Campos: INPE.DPI, 2005. Disponível na biblioteca digital URLib: <www.dpi.inpe.br/~camilo/texture>. Acesso em: 03 maio 2005.
Pardi Lacruz, M. S.; Shimabukuro, Y. E.; Williams, M.; Rennó, C. D.; Herbert, D. A; Rastetter, E. B. Utilização do sensoriamento remoto e dados de campo para amodelagem das atividades biogeoquimicas na Floresta Nacional de Tapajós. In: Simpósio Brasileiro de Sensoriamento Remoto, 10., 2001, Foz do Iguaçu. Anais... São José dos Campos: Instituto Nacional de Pesquisa Espacial, 2001. 1 CD-ROM.
Pratt, W. K. Digital image processing. [S. L.]: Wiley Interscience, 1991. 698p.
Reeves, C. R. Modern heuristic techniques for combinatorial problems. New York: Blackwell, John Wiley & Sons, 1993. 320p.
Rennó, C. D.; Freitas, C. C.; Frery, A. C. A system for region image classification based on textural measures. In: Latino-American Seminar on Radar Remote Sensing: Image Procesing Techniques, 2., 1998, Santos. Anais.... Santos: ESA, 1998.
Rennó, C. D. Avaliacao de medidas texturais na discriminacao de classes de uso utilizando imagens SIR-C/X-SAR do perímetro irrigado de Bebedouro, Petrolina, PE. 1995. 111 p. (INPE-10441-TDI/926). Dissertação (Mestrado em Sensoriamento Remoto) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 1995. Disponível na biblioteca digital URLib: <http://iris.sid.inpe.br:1912/rep-/sid.inpe.br/jeferson/2004/03.05.11.22>. Acesso em: 06 jan. 2005.
Richards, J. A. Remote sensing digital image analysis: an introduction. New York: Springer-Verlag, 1993. v. 2, 340p.
Serpico, S.; Roli, F. Classification of multisensor remote sensing images by structured neural networks. IEEE Transactions on Geoscience and Remote Sensing, v.33, n.3, p.562– 577, 1995.
104
Soares, J. V.; Rennó, C. D.; Formaggio, A. R.; Yanasse, C. C. F.; Frery, A. C. An investigation of the selection of texture features for crop discrimination using SAR imagery. Remote Sensing Environment, v.59, n.2, p.234-247, 1997.
Soltanian-Zadeha, H; Rafiee-Rad, F.; Pourabdollah-Nejad, D. S. Comparison of multiwavelet, wavelet, Haralick, and shape features for microcalcification classification in mammograms. Pattern Recognition: The Journal of the Pattern Recognition Society, v.37, n.10, p.1973-1986, 2004.
Sousa Junior, M. A.; Dutra, L. V.; Freitas, C. C. Desenvolvimento de um Segmentador Incremental Multi-nível (SIM) para imagens ópticas e de radar. In: Simpósio Brasileiro de Sensoriamento Remoto, 11., 05 a 10 abr. 2003, Belo Horizonte. Anais... São José dos Campos: Instituto Nacional de Pesquisas Espaciais, 2003. p.2293-2300.
Tari, Z. S. G.; Shah, J.; Pien, H. Extraction of shape skeletons from grayscale images.
Proceedings of the Computer Vision and Image Understanding, v.66, p.133-146, 1997.
Theodoridis, S.; Koutroumbas, K. Pattern recognition. New York: Academic Press, 1999. v.1.
Thompson, J.; Dowsland, K. A. General cooling schedules for a simulated annealing based timetabling system. In: International Conference on the Practice and Theory of Automated Timetabling, 1., 1995, Edinburgh. Proceedings... Edinburgh: Napier University, 1995.
Townshend, J. R. G. The spatial resolving power of earth resource satellites. Progress in Physical Geography, v.5, p. 32-55, 1981.
Tsutsui, S.; Fujimoto, Y. Forking genetic algorithm with blocking and shrinking modes (fGA). In: Internacional Conference on Genetic Algorithms, 5., 1993. Proceedings… [S.l.]: University of Illinois, 1993. p.206-213.
Unser, M. Sum and difference histograms for texture classification. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.8, n.1, p.118-125, Jan. 1986.
Welch, R. M.; Kuo, K. S; Sengupta, S. K. Cloud and surface textural features in polar regions. IEEE Transaction on Geoscience and Remote Sensing, v.28, n.4, p.520-528, July 1990.
Yanasse, C. C. F.; Frery, A. C.; Sant’Anna, S. J. S.; Hernandes, P. F.; Dutra, L. V. Statistical analysis of SAREX data over Tapajós - Brazil. In: South American Radar Experiment (SAREX), 6-8 Dec. 1993, Paris. Proceedings… Paris: ESA, 1993. p.25-40.
Zhang, P.; Verma, B.; Kumar, K. Neural vs. statistical classifier in conjunction with genetic algorithm based feature selection. Pattern Recognition Letters, v.26, n.7, p.909-919, May 2005.