classificaÇÃo de regiÕes usando atributos de...

INPE-13746-TDI/1050

CLASSIFICAÇÃO DE REGIÕES USANDO ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS

Joanito de Andrade Oliveira

Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. Luciano Vieira Dutra e Camilo Daleles Rennó, aprovada em 1º de

abril de 2005.

INPE São José dos Campos

2006

621.376.5 OLIVEIRA, J. A. Classificação de regiões usando atributos de forma e

seleção de atributos/ J. A. Oliveira. – São José dos Campos: INPE, 2005.

104p. – (INPE-13746-TDI/1050). 1.Extração de atributos. 2.Seleção de atributos.

3.Classificação por região. 4.Processamento de Imagens. 5.Reconhecimento de padrões. I.Título.

Aprovado (a) pela Banca Examinadora em cumprimento ao

requisito exigido para obtenção do Título de Mestre em

Computação Aplicada

Aluno (a): Joanito de Andrade Oliveira

São José dos Campos, 01 de abril de 2005

1) Ó Senhor, Deus da vida, que cuidas de toda criação, dá-nos a paz!

- Dá-nos, Senhor, a tua paz!

2) Que a nossa segurança não venha das armas, mas do respeito!

- Senhor, ensina-nos a respeitar o diferente!

3) Que nossa força não seja a violência, mas o amor!

- Senhor, ensina-nos a amar!

4) Que nossa riqueza não seja o dinheiro, mas a partilha!

- Senhor,ensina-nos a partilhar!

5) Que nosso caminho não seja a ambição, mas a justiça!

- Senhor, ensina-nos a ser justos!

6) Que nossa vitória não seja a vingança, mas o perdão!

- Senhor ensina-nos a perdoar!

Desarmados e confiantes, queremos defender a dignidade de toda criação, partilhando, hoje e sempre, o pão da solidariedade e da paz. Por Jesus Cristo teu Filho divino, nosso irmão, que, feito vítima da nossa violência, ainda do alto da cruz, deu a todos o teu perdão. Amém!

Campanha da Fraternidade Ecumênica 2005

A meus pais,

Nilton Fernandes e Licía Raquel de Andrade.

AGRADECIMENTOS

Agradeço a Deus, Pai de misericórdia e ao Senhor Jesus Cristo, modelo de oração e de vida, espírito de sabedoria e fortaleza, que me sustenta contra o mal e fez-me vitorioso em mais uma etapa da vida. Agradeço a meus familiares pelas orações e apoio na realização deste sonho. Também não poderia deixar de agradecer a meus pais em especial, por terem me ensinado a respeitar o próximo, a acreditar nos nossos sonhos, a não desistir nos momentos de fraqueza, a ser caridoso e apresentar sempre o amor verdadeiro. Agradeço a meus irmãos Joselito e Nilcia por sempre acreditarem na importância do estudo e por oferecerem o amor necessário ao fortalecimento da união familiar. A minha Tia Gisélia, por me ensinar a respeitar todas as pessoas, oferecendo sempre o amor e por incentivar a realização deste trabalho. Aos amigos de Itabuna Dionísio, Jabison, Antônio Batista, Mário, George, Juninho, Maurício e Reginaldo. Estendo os meus agradecimentos aos meus amigos e simpatizantes da República Orion: Felipe, Moacyr, Jefersson, Aditya. Agradeço também a minha namorada Thaise Calazans, pelo companheirismo e compreensão. Agradeço aos meus orientadores, Dr. Luciano Vieira Dutra e Dr. Camilo Daleles Rennó, pelo encorajamento, apoio e, principalmente, serenidade e confiança com que orientaram este trabalho. Aos Professores. Doutores. Carlos Antônio O. Vieira e Elpídio Inácio Fernandes Filho, por terem me incentivado a ingressar no curso de mestrado. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), pelo auxílio financeiro de dois anos de bolsa de mestrado. Ao Instituto Nacional de Pesquisas Espaciais (INPE), pela oportunidade de estudos e utilização de suas instalações. Ao Departamento de Processamento de Imagem (DPI), pela utilização da sua excelente estrutura física. Aos meus colegas de trabalho da DPI, pela amizade e o excelente ambiente de trabalho. Em especial, agradeço a Alessandra, Manoel, Sidnei, Silvia, Ricardo, Pierre, Vantier e Joelma, pela amizade sincera e valiosas trocas de idéias. Aos professores do INPE, pelo conhecimento compartilhado.

RESUMO

Com o aumento da disponibilidade no número de atributos extraídos dos dados de sensoriamento remoto, existe uma necessidade crescente de reduzir a complexidade da etapa de classificação. Quando a dimensionalidade dos dados é muito alta, uma estratégia de busca deveria ser utilizada para selecionar um subconjunto de atributos que forneçam o mínimo erro de classificação, considerando o tamanho limitado dos dados de treinamento. Particularmente, quando se trabalha com ambiente muito complexo como é a cena urbana, a extração do atributo de forma é necessária para distinguir diferentes classes de objetos que possuem assinaturas espectrais similares. Um grande número de atributos e o número limitado de amostra de treinamento é uma situação comum nos estudos urbanos no qual implica a aplicação dos métodos de seleção de atributos adaptados para a classificação de regiões. Este trabalho propõe a utilização de métodos de extração de atributos de forma e seleção de atributos em sistemas de processamento de imagens. Primeiramente, extraíram-se 38 atributos de forma e textura de cada amostra de treinamento. A seleção dos subconjuntos para cada método de seleção foi baseada na distância média Jeffrerys-Matusita (JM). A fim de determinar a eficiência da metodologia proposta, foram realizados testes em imagens sintéticas e de sensoriamento remoto (Landsat/TM). Os métodos de seleção de atributos Sequential Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) e NEXKSB (Next ksubset of an n-Set) foram aplicados na redução da dimensionalidade. Esses três métodos de seleção de atributos foram aplicados e uma acurácia de 100% foi alcançada usando dois atributos em ambas as imagens. Como não existe uma relação determinística entre os métodos de seleção de atributos e o erro de classificação é possível concluir que todas as estratégias de busca deveriam ser usadas para diminuir o número de avaliações baseadas no erro de classificação. Este trabalho apresentou a importância da extração do atributo de forma e a necessidade da aplicação dos métodos de seleção de atributos nos sistemas de processamento de imagens.

CLASSIFICATION OF REGION USING SHAPE FEATURE AND FEATURE SELECTION

ABSTRACT

With the steady increase in the number of features available from remote sensing sources, there is a growing necessity to reduce the complexity of the classification task. When data dimensionality is very high, a search strategy should be used to select the subset of features that gives the minimum classification error, considering the limited size of training data. Particularly when one deals with the very complex environment that is the urban scene, shape feature extraction is necessary to distinguish different classes of objects which have similar spectral signature. Large number of features and limited number of training samples is the common situation in urban studies which implies the application of feature selection methods adapted to region classification. This work proposes shape feature extraction and application of feature selection methods in systems of image processing. Firstly, we extracted 38 shape and texture features for each training sample. The selected feature subset by each criterion was classified based on greater average Jeffrerys-Matusita (JM) distance. In order to determine the efficiency of the methodology, tests were developed in synthetic and Landsat-TM images. The Sequential Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) and NEXKSB (Next subset of an n-Set) were tested to reduce the data dimensionality. These three different feature selection methods were used and an accuracy of 100% was achieved by using 2 features in both synthetic and Landsat-TM images. As there is no a deterministic relation between feature selection methods and classification error, it is possible to conclude that all search strategies should be used to narrow the number of choices assessments based on classification error. This work showed the importance of the shape feature extraction and the necessity of the application feature selection methods in systems of image processing.

SUMÁRIO

Pág.

LISTA DE FIGURAS

LISTA DE TABELAS

CAPÍTULO 1 - INTRODUÇÃO................................................................................. 19 1.1 Contextualização ...................................................................................................... 19 1.2 Objetivos................................................................................................................... 21 1.3 Organização da Dissertação...................................................................................... 22

CAPÍTULO 2 - FUNDAMENTAÇÃO TEÓRICA ................................................... 25 2.1 Imagens de Sensores Remotos ................................................................................. 25 2.2 Sistemas de Processamento de Imagens................................................................... 27 2.2.1 Aquisição............................................................................................................... 28 2.2.2 Armazenamento..................................................................................................... 28 2.2.3 Processamento ....................................................................................................... 28 2.2.3.1 Pré-Processamento ............................................................................................. 30 2.2.3.2 Segmentação....................................................................................................... 30 2.2.3.3 Extração e Seleção de Atributos......................................................................... 32 2.2.3.4 Treinamento........................................................................................................ 32 2.2.3.5 Classificação....................................................................................................... 33 2.2.4 Saída ...................................................................................................................... 35 2.3 Extração de Atributos ............................................................................................... 35 2.3.1 Atributos de Textura.............................................................................................. 37 2.3.2 Atributos de Distribucionais.................................................................................. 37 2.3.3 Atributos de Co-Ocorrência .................................................................................. 39 2.3.4 Atributos de Autocorrelação Espacial ................................................................... 43 2.3.5 Atributos de Forma................................................................................................ 44 2.4 Seleção de Atributos................................................................................................. 49 2.4.1 Seleção de Atributos em Redes Neurais Artificiais............................................... 54 2.4.2 Seleção de Atributos em Reconhecimento Estatístico de Padrões ........................ 54 2.4.2.1 Algoritmo Genético (AG)................................................................................... 55 2.4.2.2 Simulated Annealing .......................................................................................... 56 2.4.2.3 Algoritmos Sequenciais de Seleção de Atributos............................................... 57

CAPÍTULO 3 - MATERIAIS E MÉTODOS ............................................................ 61 3.1 Sistema Texture ........................................................................................................ 61 3.1.1 Extração de Atributos ............................................................................................ 61 3.1.1.1 Área .................................................................................................................... 64 3.1.1.2 Perímetro ............................................................................................................ 65 3.1.1.3 Complexidade..................................................................................................... 67 3.1.1.4 Circularidade ...................................................................................................... 67 3.1.2 Seleção deAtributos............................................................................................... 68 3.1.3 Classificação.......................................................................................................... 70

3.2 Avaliação dos Métodos de Seleção e dos Atributos de Forma................................. 71 3.2.1 Imagens para Teste ................................................................................................ 71 3.2.2 Definição dos Experimentos.................................................................................. 73 3.2.2.1 Experimento Utilizando a Imagem Sintética...................................................... 74 3.2.2.2 Imagem de Sensoriamento Remoto.................................................................... 76

CAPÍTULO 4 - RESULTADOS E DISCUSSÕES .................................................... 79 4.1 Teste com Imagens Sintéticas .................................................................................. 79 4.1.1 Experimento 1 ....................................................................................................... 79 4.1.2 Experimento 2 ....................................................................................................... 86 4.1.3 Experimento 3 ....................................................................................................... 89 4.2 Imagens de Sensoriamento Remoto ......................................................................... 91 4.2.1 Experimento 1 ....................................................................................................... 92 4.2.2 Experimento 2 ....................................................................................................... 93

CAPÍTULO 5 - CONCLUSÕES E RECOMENDAÇÕES....................................... 97 5.1 Conclusões................................................................................................................ 97 5.2 Recomendações ........................................................................................................ 99

REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 101

LISTA DE FIGURAS

Pág.

2.1 – Componentes de um Sistema de Processamento de Imagens........................... 27 2.2 - Componentes do processamento de imagem .................................................... 29 2.3 - Representação de atributos em uma, duas (2D) e três dimensões (3D) ............ 36 2.4 - Diferentes valores do perímetro para um mesmo objeto................................... 45 2.5 - Operadores de detecção. As setas indicam a direção de movimentação dos

operadores. Os pixels escuros identificam aqueles pertencentes ao objeto....... 46 2.6 - Exemplos de cálculo de perímetro por operados de detecção........................... 47 2.7 - Distância Euclidiana no espaço de atributos ..................................................... 50 2.8 - Distância de Mahalanobis no espaço de atributos............................................. 51 2.9 - Distância de Bhattacharyya no espaço de atributos .......................................... 52 2.10 - Taxonomia dos métodos de seleção de atributos ............................................ 53 2.11 - Algoritmo SFS................................................................................................. 58 2.12 - Algoritmo SBS ................................................................................................ 59 3.1 - Fluxograma dos atributos existentes no sistema. O retângulo em vermelho

destaca os atributos implementados neste trabalho........................................... 63 3.2 - Definição dos pixels vizinhos (em cinza) ao pixel k (em preto) considerados

na análise de borda ............................................................................................ 65 3.3 - Detecção dos pixels de borda Definição dos pixels vizinhos (em cinza) ao

pixel k (em preto) considerados na análise de borda......................................... 65 3.4 - Exemplos de configurações de vizinhança 8 para os pixels de borda............... 66 3.5 - Delimitação do perímetro. Em detalhe, duas configurações (A e B) de

vizinhança para cada pixels de borda. A linha azul marca o perímetro estimado ............................................................................................................ 67

3.6 - Análise dos atributos em duas dimensões para cada classe .............................. 69 3.7 - Imagem sintética com as duas texturas do álbum de Brodatz........................... 72 3.8 - Imagem Landsat/TM banda 5 ........................................................................... 73 3.9 - Imagem original. O retângulo envolvente a cada forma geométrica indica as

classes em estudo. As regiões em destaque representam as amostras de treinamento........................................................................................................ 75

3.10 - Imagem original. O retângulo envolvente a cada forma geométrica indica as classes em estudo. As regiões em destaque representam as amostras de treinamento....................................................................................................... 75

3.11 - Imagem original. A linha tracejada representa o limite entre as duas classes de textura. As regiões em destaque representam as amostras de treinamento. 76

3.12 - Imagem de SR. (a) As regiões em destaque representam as amostras de treinamento; (b) Imagem segmentada e (c) imagem de referência.................. 78

4.1 - Interface de extração de atributos...................................................................... 80 4.2 - Interface de extração dos atributos de forma .................................................... 80 4.3 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo,

2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade ................................. 81

4.4 - Interface de classificação .................................................................................. 82

4.5 - Resultado da classificação utilizando todos os 38 atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana...........................

83

4.6 - Interface de seleção de atributos ....................................................................... 83 4.7 - Distribuição em duas dimensões dos subconjuntos de dois atributos

selecionados pelos métodos propostos:a) pelos métodos SFS e FIXO, b) pelo método SBS....................................................................................................... 85

4.8 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade ................................. 86

4.9 - Resultado da classificação com o conjunto global de atributos ........................ 87 4.10 - Acurácia total da classificação para cada subconjunto de atributos

selecionado .................................................................................................... 91 4.11 - Imagem de SR. (a) Imagem segmentada; (b) imagem de referência; (c)

Imagem classificada utilizando um subconjunto de 2 atributos e (d) Imagem classificada com o conjunto global de atributos .............................................. 95

LISTA DE TABELAS

Pág.

2.1 - Características dos Satélites IKONOS, SPOT e QuickBird.............................. 26 3.1 - Atributos extraídos das regiões de treinamento ................................................ 73 4.1 - Atributos selecionados através dos métodos de seleção propostos................... 84 4.2 - Resultado dos métodos de extração de atributos, seleção de atributos e

classificação das amostra de teste no Experimento 2........................................ 88 4.3 - Resultado dos métodos de extração de atributos, seleção de atributos e

classificação das amostra de teste no Experimento 3........................................ 89 4.4 - Resultado dos métodos de extração de atributos, seleção de atributos e

classificação das amostra de teste em imagens de SR ...................................... 92 4.5 - Resultado dos métodos de extração de atributos, seleção de atributos e

classificação da imagem segmentada................................................................ 93

19

CAPÍTULO 1

INTRODUÇÃO

1.1 Contextualização

A evolução da tecnologia de computação, em termos de hardware, bem como o

desenvolvimento de algoritmos mais eficientes para manipulação de imagens digitais,

têm permitido um número crescente de aplicações de reconhecimento de padrões. Um

sistema de reconhecimento de padrões pode ser aplicado em diversas áreas de

pesquisas: reconhecimento de voz, data mining, classificação de documentos, análise

de imagens, automação indústrial, sensoriamento remoto, bioinformática, etc.

O desenvolvimento de um sistema de reconhecimento de padrões requer a definição do

padrão das classes e de um ambiente de aquisição dos dados, a representação do padrão,

a extração e seleção de atributos, a análise de agrupamento, o desenvolvimento e

aprendizado do classificador, a seleção das amostras de treinamento e teste, e a

avaliação do desempenho do classificador. As quatro melhores abordagens de

reconhecimento de padrões são os casamentos de modelos, a abordagem estatística, a

abordagem estrutural e as redes neurais (Jain et al., 2000).

Segundo Duda et al. (2001), um sistema de reconhecimento de padrões que usa uma

abordagem estatística pode ser composto pelas seguintes partes: um sistema de

aquisição de dados (sensores ou câmeras); um sistema de pré-processamento, para

suprimir ruídos; um extrator de atributos (características), utilizado para criar um vetor

de atributos extraídos dos objetos em análise; um seletor de atributos, que analisa o

conjunto de atributos que melhor discrimina os objetos em estudo, eliminando os

atributos mais redundantes e menos relevantes na separabilidade; e um classificador,

que analisa as características de um padrão e aplica um modelo na decisão, atribuindo o

padrão a uma determinada classe.

20

A abordagem estatística é amplamente utilizada nos sistemas de processamento de

imagens. Esses sistemas abrangem operações de aquisição, armazenamento,

processamento e exibição da imagem (Marques Filho e Vieira Neto, 1999). Nos últimos

anos, a necessidade de se obter informações decorrentes do processamento de imagem

está fazendo crescer paralelamente a esse processo, os estudos relacionados com os

métodos de extração e seleção de atributos em imagens, procurando encontrar um

subconjunto de atributos mais relevantes na separabilidade das classes. Com uma

extração e seleção de atributos eficaz, o algoritmo de classificação implementado pode

obter resultados mais satisfatórios, independente da sua complexidade. Isso ocorre

devido à redução da dimensão do espaço de atributos, onde as superfícies de decisão se

tornam mais simples.

Nos métodos de extração baseados em atributos visuais, que representam as

informações dos objetos, os critérios de similaridade devem ser suficientemente

robustos para evitar que o resultado da classificação de um padrão seja muito diferente

do padrão de referência (treinamento). Portanto, os modelos de similaridade devem, de

alguma forma, processar e reproduzir o modo como os seres humanos avaliam as

similaridades entre os objetos.

O grande número de atributos encontrados na literatura que podem caracterizar um

objeto em particular e as dificuldades em se identificar previamente qual ou quais deles

são importantes na separabilidade das classes, levou os pesquisadores a intensificar os

estudos nas pesquisas aplicadas a redução da dimensionalidade. Essa redução pode ser

feita pela seleção empírica de alguns atributos, de acordo com os resultados

encontrados, ou pela aplicação de algoritmos de seleção de atributos (métodos de

busca). Segundo Boz (2002), os algoritmos de seleção de atributos são divididos em três

grupos: exponenciais (busca exaustiva), randômicos (algoritmo genético) e seqüenciais.

A seleção de atributos pode envolver processo de otimização de mais de um critério ou

objetivo. Intuitivamente, no caso da seleção de atributos objetivando a classificação de

imagens, taxas de erros menores podem ser geradas a partir da uma simples aplicação

de métodos de seleção de atributos. Os métodos determinísticos de seleção de atributos

21

têm sido estudados em trabalhos aplicados aos sistemas de processamento de imagens

(Jain e Zongker, 1997; Dutra e Huber, 1999). Com o intuito de solucionar problemas

com mais de um objetivo, surgiu o conceito de otimização multiobjetiva (múltiplos

caminhos). Esse conceito permite que, para um determinado problema, um conjunto de

soluções seja apresentado sem privilegiar um ou outro objetivo, fornecendo ao usuário a

escolha da solução que mais se ajusta às suas necessidades.

Apesar dos avanços obtidos no desenvolvimento de novos métodos de extração e

seleção de atributos, os resultados podem ser diferentes dependendo do método adotado.

Isso ocorre, pois cada método possui características intrínsecas ao problema que se

deseja solucionar, além dos diferentes critérios matemáticos utilizados em cada método.

1.2 Objetivos

Este trabalho tem como principal objetivo, o desenvolvimento e implementação de

algoritmos computacionais para extração de atributos de forma e seleção de atributos,

que agregados a um sistema de extração de atributos de textura e classificação por

região, possam auxiliar no processo de classificação semi-automática de imagens

digitais. Os algoritmos de seleção de atributos estão fundamentados em princípios

estatísticos.

Procurou-se validar a utilização de atributos de forma na classificação por região através

da avaliação dos resultados obtidos e apresentar a eficiência da aplicação dos métodos

de seleção de atributos em sistemas de processamentos de imagens.

Ao longo da elaboração deste trabalho foi necessário implementar algoritmos que

efetuassem tarefas combinatoriais e desenvolver mecanismos que possibilitassem a

análise dos atributos utilizados no processo de classificação.

22

Dentre as atividades destacam-se:

1) Implementação do método de extração de atributos de forma, significativos na

separabilidade das classes em estudo.

2) Desenvolvimento de algoritmos de seleção de atributos, manipulando funções

matemáticas e obtendo soluções sub-ótimas.

3) Utilização do algoritmo NEXKSB (Next ksubset of an n-Set) para obter as

combinações de k atributos a partir de um conjunto de n atributos (Nijenhuis e

Wilf, 1978).

4) Implementação e adaptação de interfaces gráficas

Realizou-se as atividades a fim de determinar a eficiência da metodologia proposta para

um sistema de classificação por região, utilizando atributos de textura e de forma.

1.3 Organização da Dissertação

Esta dissertação está organizada em cinco capítulos. Ao longo de todo o texto tem-se

sempre em foco, o estudo da extração e seleção de atributos. Abaixo, a estrutura de cada

um dos capítulos.

No Capítulo 1, é apresentada uma breve introdução do trabalho através de uma

contextualização do problema da extração e seleção de atributos e os objetivos que se

deseja alcançar.

Apresentam-se no Capítulo 2 os conceitos dos sistemas de processamento de imagens

que sustentam a definição de seus componentes. Destes conceitos, serão estabelecidas

as ligações entre os universos conceituais dos métodos de extração e seleção de

atributos e suas aplicações em sistema de processamento de imagens.

O Capítulo 3 apresenta os materiais e os métodos de extração de atributos de forma e

seleção de atributos utilizados neste trabalho. A implementação e adaptação das

interfaces gráficas no sistema para a extração de atributos de textura, de forma e as

23

interfaces dos métodos de seleção de atributos e classificação também são descritas

neste capítulo.

O Capítulo 4 apresenta os resultados e discussões dos testes para o sistema de extração e

seleção de atributos aplicados à classificação de regiões de imagens sintéticas e de

sensoriamento remoto. Analisa-se nesse capítulo, a viabilidade da aplicação dos

atributos de forma na extração de informações geométricas das regiões. A análise dos

métodos de seleção de atributos é discutida, observando a acurácia total da classificação

e a eficiência para um conjunto alto de atributo.

Ao final, o Capítulo 5 expõe as conclusões da aplicação dos métodos implementados em

um sistema de processamento de imagens, proporcionando uma dedução possitiva do

emprego dos métodos nesse tipo de sistema. Com o intutito de aperfeiçoar o sistema,

algumas recomendações são propostas como sugestões de trabalhos futuros.

25

CAPÍTULO 2

FUNDAMENTAÇÃO TEÓRICA

Como os métodos de extração e seleção de atributos utilizados na classificação de

imagens digitais constituem uma das principais ferramentas neste trabalho, um resumo

de sua teoria é apresentado neste capítulo. Além disso, para uma melhor compreensão

das imagens geradas por sensores remotos e as etapas do sistema de processamento de

imagens são apresentadas a seguir.

2.1 Imagens de Sensores Remotos

O objetivo principal do desenvolvimento de sensores espaciais é a geração de imagens

que possam auxiliar na classificação do uso da terra, no planejamento e monitoramento

do ambiente rural e urbano. A geração de mapas cresceu paralelamente com a

disponibilidade das imagens de satélites e com o desenvolvimento e aprimoramento das

técnicas de manipulação de imagens, constituindo um ponto de partida para muitas

aplicações em diferentes domínios de planejamento do espaço (Donnay, 1999).

Com os avanços tecnológicos, tanto para as imagens geradas por satélite como para as

adquiridas por sensores aerotransportados, está sendo possível capturar uma variedade

de dados sobre a superfície da Terra em várias escalas. Com isso, as análises

decorrentes deste tipo de imagens vêm sendo cada vez mais utilizadas no

monitoramento e planejamento da superfície terrestre. Para tanto, são desenvolvidos

métodos de processamento que possam explorar e extrair as informações contidas nas

imagens de sensores remotos (Curlander e Kober, 1992; Serpico e Roli, 1995).

Com o lançamento do IKONOS II em setembro 1999, com resolução de 1m para

imagem pancromática e 4m para imagens multi-espectrais, os objetos terrestres

passaram a ser melhor discriminados visualmente. Com a alta resolução espacial, essas

imagens permitem, por exemplo, distinguir tipos de edifícios no espaço urbano (Jensen

e Cowen, 1999).

26

Antes do lançamento do IKONOS, as melhores imagens de satélite disponível no

mercado para aplicações em grande escalas era a do SPOT 4 (10 m e 20 m), do

LANDSAT 5 (30 m) e do LANDSAT 7 (15 m e 30 m). Lançado em outubro de 2001, o

satélite de alta precisão cartográfica QuickBird vem fazendo concorrência ao IKONOS.

O QuickBird coleta imagens com resolução de 61 cm no modo pancromático e 2,44 m

no modo multiespectral, a nadir. Esses dados orbitais de resolução submétrica são

comparáveis aos de uma fotografia aérea.

Em decorrência do aprimoramento da resolução espacial, temporal e espectral dos

sensores espaciais, está sendo possível monitorar diferentes fenômenos com um nível

maior de detalhes. A resolução temporal é de fundamental importância, no que diz

respeito a trabalhos de monitoramento, pois permite fazer o acompanhamento dinâmico

dos alvos terrestres. Já a resolução espectral auxilia na discriminação dos diferentes

objetos na imagem. Segundo Townshend (1981), a resolução espacial é a habilidade de

distinguir os alvos entre si e de medir as propriedades espectrais de pequenos alvos. A

tabela 2.1 apresenta as características dos satélites LANDSAT 5, LANDSAT 7,

IKONOS II, SPOT e QuickBird.

TABELA 2.1 Características dos Satélites IKONOS, SPOT e QuickBird.

Satélite/Sensor Lançamento Produto Resolução Espacial(m)

Faixa Imageada(km)

LANDSAT 5/TM 1984 7 Bandas

Multiespectrais 30 185

4 Bandas Multiespectrais 20 60

SPOT 4/HRVIR 1998 Banda Pancromática 10 60

7 Bandas Multiespectrais 30 185 LANDSAT

7/ETM+ 1999 Banda Pancromática 15 185

4 Bandas Multiespectrais 4 11

IKONOS II 1999 Banda Pancromática 1 11

4 Bandas Multiespectrais 2,4 22

QUICKBIRD 2001 Banda Pancromática 0,60 16,5

27

Atualmente, os produtos provenientes dos sensores orbitais são mais fortemente

utilizados em bases de dados dos Sistemas de Informações Geográficas (SIG) no auxílio

ao processo de tomada de decisão em estudos voltados para o monitoramento e

planejamento do espaço rural e urbano.

2.2 Sistemas de Processamento de Imagens

Segundo Marques Filho e Vieira Neto (1999), os sistemas de processamento de imagens

são utilizados no aprimoramento de informações pictóricas para interpretação humana e

na análise automática por computador de informações extraídas de uma cena. Um dos

principais objetivos dos sistemas de processamento de imagens é distinguir e identificar

os diferentes objetos existentes na imagem.

O sistema de processamento de imagens possui componentes (fases) que descrevem os

passos (operações) existentes no sistema. A Figura 2.1 representa, através de um

diagrama, os componentes típicos em um sistema de processamento de imagens.

Segundo Marques Filho e Vieira Neto (1999), as operações que se pode efetuar em uma

imagem são: aquisição, armazenamento, processamento e exibição (saída).

FIGURA 2.1 – Componentes de um Sistema de Processamento de Imagens. .

28

Todos os componentes do sistema de processamento de imagem têm papéis

fundamentais na eficácia do sistema como um todo.

2.2.1 Aquisição

A etapa de aquisição é responsável pela entrada de dados no sistema de processamento

de imagens. Essa etapa tem como função converter uma imagem em uma representação

numérica adequada para o processamento digital subseqüente (Marques Filho e Vieira

Neto, 1999). Utiliza-se, no processo de aquisição de imagem, um sensor e um

digitalizador. O primeiro converterá a informação espectral em sinal elétrico e o

segundo processo promove a transformação da imagem analógica em imagem digital.

2.2.2 Armazenamento

Armazenar é guardar, acumular, introduzir dados em dispositivo físico ou em sistema

digital, com o objetivo de posterior recuperação. Esse é um dos desafios para os

pesquisadores da área de processamento de imagem digital, pois os sistemas de

aquisição estão cada vez melhores, requerendo bons sistemas computacionais para

armazenar os dados provenientes da etapa de aquisição.

Segundo Marques Filho e Vieira Neto (1999), a etapa de armazenamento pode ser

dividida em três categorias: a) armazenamento de curta duração de uma imagem

(memória RAM), enquanto ela é utilizada nas várias etapas do processamento; b)

armazenamento de massa para operações de recuperação de imagens relativamente

rápidas; c) arquivamento de imagens, para recuperação futura quando isto se fizer

necessário.

2.2.3 Processamento

Processar uma imagem consiste em reconstruir, efetuar medidas, extrair características,

rotular e identificar objetos e exibir classes intrínsecas na imagem. Esses procedimentos

são executados através de procedimentos como pré-processamento, segmentação,

extração de atributos, seleção de atributos e classificação (Hussain, 1991).

29

Em geral, esses procedimentos são expressos em forma de algoritmos e funções. O

processamento de imagens digitais é caracterizado por soluções específicas, ou seja,

para uma determinada aplicação pode não ser necessário utilizar o procedimento de pré-

processamento, ou ainda, a utilização de alguns procedimentos pode ser totalmente

inadequado em outras áreas.

A etapa de processamento é de fundamental importância para os sistemas de

processamento de imagem, pois os procedimentos executados têm características

específicas na obtenção dos resultados esperados pelo usuário. O processamento segue

uma seqüência de análise que pode ser visualizada na Figura 2.2.

FIGURA 2.2 – Componentes do processamento de imagem.

30

2.2.3.1 Pré-processamento

O pré-processamento é o primeiro passo do processamento da informação visual

(Cohen, 1982). Seus objetivos são a reconstrução de uma imagem de qualidade

apropriada ao processamento, e melhoria ou realce da qualidade da imagem de entrada

por supressão de ruídos. Além disso, procura ressaltar as características selecionadas,

facilitando os estágios posteriores do processamento da imagem. Procura-se realçar

determinadas características das imagens e recuperar imagens que sofreram algum tipo

de degradação.

São usadas nesse procedimento, operações matemáticas com objetivo de alterar os

valores dos pixels da imagem, fazendo com que haja uma melhoria na qualidade da

imagem que será processada. Todas as técnicas de pré-processamento envolvem a

modificação na imagem. Segundo Gonzáles e Woods (2000), estas modificações

abragem a correção geométrica, modificação da escala de cinza e contraste, e

suavização de imagens.

A correção geométrica tem o objetivo de minimizar as distorções geométricas,

provenientes das características do sensor e das variações decorrentes do movimento do

mesmo durante a passagem sobre o alvo (Luiz et al, 2003). Através da correção

geométrica é possível integrar as imagens a um sistema de informações geográficas

(SIG), desenvolvendo análises da geometria dos objetos existentes na imagem. A

correção radiomérica é outro procedimento utilizado na etapa de pré-processamento.

Algumas operações típicas que se relacionam com a correção radiométrica são a

eliminação de ruídos, a restauração e a correção atmosférica.

2.2.3.2 Segmentação

Com os avanços no processo de aquisição e processamento de imagem, verifica-se a

necessidade de se desenvolver métodos de extração das informações contidas nas

imagens. A imagem é representada por uma matriz bidimensional de pixels contendo

valores distribuídos de níveis de cinza. A função desempenhada por um algoritmo de

31

segmentação é agrupar os pixels de uma imagem que compartilham alguns atributos

semelhantes (textura, média, variância, área, etc).

Os procedimentos de segmentação de imagem é um dos principais foco de estudo na

área de análise de imagem. Nas últimas duas décadas várias técnicas de segmentação

têm sido desenvolvidas para incorporar as informações contextuais nos procedimentos

de classificação (Ballard e Brown, 1983). Agrupar partes de uma imagem em unidades

homogêneas com relação a uma ou mais características resulta em um processo de

segmentação. No processo de segmentação, existem dois importantes aspectos para

considerar: o primeiro é a estrutura dos dados usados para agrupar as regiões

homogêneas; a outra é a transformação envolvida para computar (medir) as

características dessas regiões (Ballard e Brown, 1983).

Segundo Lambert e Macairne (2000), os métodos de segmentação podem ser divididos

em quatro grupos: baseados em bordas, vizinhança, histograma e em agrupamentos

(“clusters”). O método baseado em bordas procura as descontinuidades na imagem

enquanto o baseado em vizinhança emprega a semelhança entre diferentes regiões na

imagem. Pelo método da descontinuidade, a partição da imagem é efetuada com base

nas alterações bruscas de intensidade (ex., detecção de bordas). Já a partição por

similaridade é efetuada com base na similaridade entre pixels. Um algoritmo de

"clusters" é uma técnica de segmentação que procura agrupar regiões, a partir de uma

medida estatística de similaridade entre elas.

Depois do processo de segmentação, são extraídas as características de cada segmento

da imagem. Essas características são usadas no treinamento do classificador. O processo

de segmentação pode ser usado anteriormente ao processo de classificação de imagens

de alta resolução. O desenvolvimento de algoritmo capaz de particionar o espaço intra-

urbano é um desafio para os pesquisadores da área de processamento de imagem.

32

2.2.3.3 Extração e Seleção de Atributos

A obtenção de bons resultados na classificação depende do processo de extração e

seleção de atributos, pois é a partir desta fase que é criado o conjunto de atributos que

será utilizado na etapa de treinamento e posteriormente na fase de classificação.

Pode-se pensar que quanto maior o número de atributos para representar um padrão

(classe), maior o poder discriminatório do classificador. Porém, nem sempre isso é

verdade. Na prática, o que acontece é uma degradação na acurácia dos resultados da

classificação com o aumento da dimensionalidade dos dados mantendo-se constante o

número de amostras de treinamento. Segundo Jain et al. (2000), existem duas razões

para reduzir esta dimensionalidade: diminuir o custo de processamento e aumentar a

acurácia da classificação. Uma descrição mais detalhada dos métodos de extração e

seleção de atributos é apresentada nas Seções 2.3 e 2.4.

2.2.3.4 Treinamento

A fase de treinamento inicia-se com a escolha de um grupo de amostras que representa

cada uma das classes. Essas amostras podem ser definidas usando dados de campo,

fotos aéreas ou ainda a partir da interpretação visual da imagem a ser classificada

(Fonseca, 2004). Todos os pixels dentro de uma área de treinamento para uma dada

classe constituem o chamado conjunto de treinamento para aquela classe (Crósta, 1993).

O conjunto de treinamento é utilizado para estimar os parâmetros usados pelo algoritmo

de classificação. Estes podem ser propriedades do modelo de probabilidade ou equações

que definem o particionamento no espaço de atributos (Fonseca, 2004).

A determinação das amostras de treinamento pressupõe bons conhecimentos em

interpretação de imagens de satélite. Uma outra forma de definir as amostras de

treinamento é através da utilização do GPS (Global Positioning System) em trabalhos de

campo, que tem-se tornado uma tecnologia extremamente útil para uma série de

atividades que necessita de posicionamento. Essa fase de treinamento está presente nos

algoritmos de classificação supervisionada. Nos algoritmos de classificação não-

33

supervisionada, o usuário tem pouco conhecimento sobre as classes, pois não requer um

conhecimento prévio da área de estudo.

A confiabilidade das amostras na representatividade das classes está ligada à

variabilidade entre as classes. Em alguns casos, é necessário um número grande de

amostras na imagem para representar uma classe. Dependendo dos parâmetros

utilizados, é necessário selecionar quais medidas estatísticas melhor discriminam as

classes. Essa seleção é executada no processo de seleção de atributos.

2.2.3.5 Classificação

Um dos principais objetivos na análise de imagens digitais é distinguir e identificar os

diferentes objetos presentes na imagem. Essa distinção e identificação tornam-se

possíveis, pelo fato dos objetos na imagem apresentarem diferentes comportamentos de

reflectância, medida ao longo do espectro eletromagnético.

A classificação é um processo utilizado para criar mapas temáticos. Esses mapas são

informações que representam a distribuição espacial de um tema em particular. Os

temas podem representar os mais diversos objetos, como solo, vegetação, profundidade

da água, atmosfera, etc. Dentro de um tema pode haver alguns sub-temas definidos, e

assim o processo da classificação tornar-se cada vez mais refinado.

A classificação automática de imagens consiste em associar cada pixel da imagem a um

"rótulo", descrevendo um objeto real. Desta forma, os níveis de cinza (NC) associados a

cada pixel, definidos pela reflectância dos materiais que compõem esse pixel, são

identificados como pertencentes a um tipo de classe. Esse processo de classificação é

dito classificação pixel-a-pixel, ou seja, identifica-se o objeto levando em conta apenas

as características pontuais.

Na classificação por região, podem ser consideradas as informações contextuais,

espectrais e geométricas de cada segmento (região) no processo de rotulação. Nesse

caso, todos os pixels que compõe a região são designados para um mesmo rótulo.

34

A tarefa do classificador de um sistema é usar o vetor fornecido pelo extrator da

característica para atribuir o objeto a uma categoria ou classe (Duda et al., 2001).

Dependendo da classe em estudo, o perfeito desempenho da classificação é difícil de ser

obtido, sendo uma tarefa mais geral, estimar a probabilidade de que um padrão (objeto)

pertença a uma determinada classe, baseando-se no valor de algum atributo ou em um

conjuntos de atributos (Gose et al, 1996).

Os métodos de classificação se dividem em duas categorias: a classificação

supervisionada e a não-supervisionada. A primeira refere-se ao processo de

classificação que usa um conjunto de amostras de treinamento para classificar amostras

similares presentes na imagem, enquanto que na classificação não-supervisionada o

processo de classificação não requer conhecimento a priori das classes em estudo (Gose

et al, 1996). Na segunda abordagem as técnicas são baseadas em agrupamentos

(clusters), usando medidas de similaridades no processo de classificação.

Segundo Duda et al. (2001), existem alguns algoritmos clássicos, tanto de classificação

não-supervisionada (Isodata, K-Médias), quanto na supervisionada (vizinho mais

próximo, método Fisher, método por árvore de decisão, redes neurais, método do

paralelepípedo, máxima verossimilhança (Maxver), distância de Mahalanobis). Esses

algoritmos representam um grupo de metodologias que vem sendo aplicado em sistema

de processamento de imagens (Gose et al, 1996; Theodoridis e Koutroumbas, 1999;

Kohn, 1998).

Um critério amplamente utilizado na avaliação da classificação é o erro de classificação

de um subconjunto de padrões. Uma outra alternativa para avaliar o desempenho do

classificador é através do cálculo do coeficiente de concordância Kappa, TAU, entre

outros. O coeficiente Kappa foi introduzido por Cohen (1960), no contexto do

sensoriamento remoto é calculado a partir da matriz de confusão (Congalton, 1983). A

matriz de confusão é uma matriz quadrada de números que expressam a quantidade de

unidades amostrais, associada a uma dada categoria (classe). Essa matriz apresenta não

somente os acertos, mas também quais as classes cujas amostras foram erroneamente

classificadas e quais classes ocorreram confusão. Na avaliação da classificação, deve-se

35

utilizar um conjunto de amostras diferente do conjunto utilizado no treinamento. Esse

conjunto é chamado de amostra de teste. A utilização desse conjunto de amostras evita

que a avaliação da classificação seja tendenciosa.

2.2.4 Saída

Os dispositivos de saída em um sistema de processamento de imagens, que são

dispositivos que efetivamente permitem que os resultados da etapa de processamento

sejam disponibilizados para os usuários são os monitores de vídeo, plotters e

impressoras. Esses dispositivos têm função de transformar dados digitais em informação

visível.

2.3 Extração de Atributos

Extrair as características (atributos) mais importantes numa imagem evidencia as

diferenças e similaridades entre os objetos. Entre essas características pode-se incluir o

brilho de uma determinada região, a textura de uma região, a amplitude do histograma,

entre outros (Pratt, 1991). De uma forma geral, a extração de atributos é um processo

usualmente associado à análise dos regiões de uma imagem.

Os métodos para criar novas características baseadas na combinação ou na

transformação de características já existentes são chamados métodos de extração de

atributos (Dutra e Huber, 1999). O estudo de extração de atributos em reconhecimento

estatístico de padrões requer a definição de dois elementos:

Atributos: é qualquer aspecto, qualidade ou característica de um objeto. Os

atributos podem ser simbólicos, numéricos ou ambos.

Padrão: é um conjunto de atributos que definem um objeto ou um grupo de

objetos. É essencialmente um arranjo ou uma ordenação presente em

alguma organização de estrutura (Pandya, 1995).

A fim de desenvolver um eficiente sistema de reconhecimento de padrões, deve-se

primeiramente efetuar a escolhar dos métodos de extração de atributos. Para projetar um

36

sistema com baixa complexidade, o vetor de atributos criado pela extração deve conter

atributos pertinentes sobre as classes a serem reconhecidas. Um vetor de atributo é

composto de vários atributos que representa um objeto. Um conjunto de atributos

também pode ser representado no espaço de atributos 2D e 3D (Figura 2.3). A extração

de atributos irrelevantes pode resultar em um baixo desempenho na etapa de

classificação.

FIGURA 2.3 – Representação de atributos em uma, duas (2D) e três dimensões (3D).

A extração de atributos é responsável pela mensuração dos atributos dos objetos

pertencentes à imagem em estudo, que são utilizados para identificar uma classe de

padrão. O principal objetivo da extração de atributos é caracterizar os objetos, através

de medidas, para ser utilizados na classificação de imagens (Duda et al., 2001). As

medidas podem ser adquiridas computacionalmente através de algoritmos simples que

extraem informações de tamanho, cor do objeto, ou medidas, que através de algoritmos

complexos, extraem características de forma, conectividade, textura, entre outros.

A obtenção de bons resultados na classificação depende do processo de extração de

atributos, pois é a partir desta fase que se cria o vetor de atributos utilizado na etapa de

treinamento e posteriormente na fase de classificação. Muitos trabalhos têm utilizado

inúmeros atributos para quantificar os objetos nas imagens (Haralick et al., 1973; Rennó

et al., 1998; Arivazhagan e Ganesan, 2003; Chen et al., 2004). Métodos de análise de

textura e forma têm sido desenvolvidos usando métodos estatísticos e morfológicos

(Tari et al., 1997; Soltanian-Zadeha et al., 2004).

37

2.3.1 Atributos de Textura

A textura contém informações importantes sobre o arranjo estrutural das superfícies e

seus relacionamentos com o ambiente ao redor (Haralick et al., 1973). A textura refere-

se ao padrão aparente de uma determinada região, descrita pelas propriedades lisa,

rugosa e grossa. A análise de textura em dados digitais é um estudo do padrão espacial

ou freqüência de variação de níveis de cinza em uma determinada região.

A utilização de técnicas de extração de textura é desenvolvida, com o intuito de extrair

informação da distribuição de uma determinada região, objetivando a melhoria no

desempenho do classificador. A caracterização da textura, na maioria das vezes, é

baseada em modelos estatísticos (Haralick et al., 1973; Haralick, 1979), modelos

estocásticos (Haindl, 1991) e modelos estruturais (Haralick , 1979; Haindl, 1991).

A seguir, apresenta-se algumas definições de atributos extraídos de regiões em imagens,

e utilizados no processo de classificação.

2.3.2 Atributos Distribucionais

Os atributos distribucionais podem ser divididos em dois grupos: básicos e particulares.

Os atributos distribucionais básicos são baseados em estatística de primeira ordem, onde

a caracterização da textura não leva em consideração a distribuição espacial dos níveis

de cinza de uma região na imagem. Os atributos de primeira ordem podem ser

calculados pela distribuição de frequências (nível de cinza) dos pixels de uma imagem.

Segundo Soares et al. (997) e Rennó (1995), os atributos distribucionais básicos mais

comumentes utilizados são:

a) variância

[ ] ( )∑ −=i

iPMiV 2 (2.1)

onde ( )iP é a freqüência relativa com que o nível de cinza i ocorre na região e M é a

média dos níveis de cinza da região, ou seja,

38

( )∑=i

iiPM (2.2)

b) coeficiente de variação

MVCV = (2.3)

c) assimetria

( ) ( )23

3

V

iPMiAS i

∑ −= (2.4)

d) assimetria da média em relação à mediana

VMEDM

ASM−

= (2.5)

onde MED é a mediana dos níveis de cinza da imagem.

e) curtose

( ) ( )2

4

V

iPMiCUR i

∑ −= (2.6)

Os atributos distribucionais particulares buscam representar a textura de uma

determinada região, utilizando estimadores de parâmetros de algumas distribuições

estatísticas como a distribuição log-normal, a gama, a K amplitude, entre outras.

Algumas dessas distribuições são utilizadas especialmente em imagens de radar.

Yanasse et al. (1993), utilizou uma série dessas distribuições estatísticas em imagens de

radar de abertura sintética (SAR) para discriminar áreas de floresta e não-floresta. A

energia (uniformidade) e entropia de uma região são atributos considerados atributos

distribucionais particulares e de grande utilização na classificação de imagens de radar.

39

f) energia

( )2∑=i

iPUNI (2.7)

g) entropia

( ) ( )∑−=i

iPiPENT log* (2.8)

2.3.3 Atributos de Co-Corrência

Haralick et al. (1973) introduziu a representação de texturas através da matriz de co-

ocorrência. Esta metodologia explora a dependência espacial dos níveis de cinza da

textura para montar uma matriz que representa a informação textural. A matriz de co-

ocorrência é baseada na orientação e distância entre os pixels da imagem. Cada

elemento ( ) yxjiP ∆∆ ,, da matriz de co-ocorrência, representa a freqüência relativa com

que dois pixels vizinhos (separados por uma distância de ∆x colunas e ∆y linhas)

ocorrem na imagem, um com o nível de cinza i e o outro com o nível de cinza j.

A principal desvantagem no uso de medidas texturais baseadas na matriz de co-

ocorrência é a grande exigência em memória e tempo computacional. Por exemplo,

numa imagem com resolução radiométrica de 8 bits (256 níveis de cinza), a matriz de

co-ocorrência é composta por 65536 elementos, muitos deles com valor nulo (Rennó,

1995). Como alternativa, pode-se trabalhar com vetores soma e diferença de níveis de

cinza (Unser, 1986; Welch et al., 1990). Cada elemento do vetor soma é definido como:

( ) ( ) kjijijiPkPj

yxi

yxS =+∀= ∑∑ ∆∆∆∆ /,, ,, (2.9)

enquanto que o elemento do vetor diferença é definido como:

( ) ( ) kjijijiPkPj

yxi

yxD =−∀= ∑∑ ∆∆∆∆ /,, ,, (2.10)

40

Dessa forma, utilizando-se a mesma imagem de 8 bits, o vetor soma terá 511 elementos

e o vetor diferença 256 elementos.

A seguir apresentam-se algumas medidas de textura baseadas na matriz de co-

ocorrência e nos vetores soma e diferença de níveis de cinza (Haralick et al., 1973;

Rennó, 1995; Soares et. al, 1997).

a) uniformidade (energia)

UNI ( )∑∑ ∆∆∆∆ =j

yxi

yx jiP 2,, , (2.11)

A energia mede uniformidade textural, isto é, repetição de pares de pixel na imagem.

Em alguns trabalhos na área de análise de textura, a energia também é chamada de

segundo momento angular (Haralick et al., 1973). Altos valores de energia indicam que

a distribuição de nível cinza em região na imagem tem uma distribuição constante ou

uma forma periódica (Soares et. al, 1997).

b) entropia

( ) ( )∑∑ ∆∆∆∆∆∆ −=j

yxyxi

yx jiPjiPENT ,,, ,log, (2.12)

A entropia calcula o desordem de uma imagem. Quando a imagem não é texturalmente

uniformizada o valor da entropia é alto (Soares et. al, 1997).

c) contraste

( ) ( )∑∑ ∆∆∆∆ −=j

yxi

yx jiPjiCON ,2

, , (2.13)

O contraste é uma estimativa das variações locais ao quadrado dos níveis de cinza entre

pares de pixels (Soares et. al, 1997).

d) homogeneidade

41

( )( )∑∑ −+

= ∆∆∆∆

j

yx

iyx ji

jiPHOM 2

,, 1

, (2.14)

Essa medida de textura resulta em grandes valores para regiões com níveis de cinza

similares. O contraste e a homogeneidade são inversamente correlacionados (Soares et.

al, 1997).

e) correlação

( )

cl

jclyx

iyx

jiijPCOR

σσ

µµ∑∑ −=

∆∆

∆∆

,

,

, (2.15)

onde

( )∑ ∆∆∗=i

yxl iiP ,,µ (2.16)

( )∑ ∆∆∗=j

yxc jjP ,,µ (2.17)

( ) ( )∑ ∆∆∗−=i

yxll iPi ,2 ,µσ (2.18)

( ) ( )∑ ∆∆∗−=j

yxcc jPj ,2 ,µσ (2.19)

( ) ( )∑ ∆∆∆∆ =∗j

yxyx jiPiP ,, ,, (2.20)

e

( ) ( )∑ ∆∆∆∆ =∗i

yxyx jiPjP ,, ,, (2.21)

A correlação mede a dependência linear de pixels em relação a sua vizinhança. Valores

de correlação altos indicam uma alta relação linear entre os níveis cinzas de pares de

pixel presente em uma região na imagem.

42

f) chi-quadrado

( )( ) ( )∑∑

∆∆∆∆

∆∆∆∆ ∗∗=

j yxyx

yx

iyx jPiP

jiPCHI

,,

2,

, ,,,

(2.22)

Essa medida pode ser entendida como uma normalização da energia para a dependência

linear dos tons de cinza em uma região na imagem (Soares et. al, 1997).

g) média do vetor soma

( )∑ ∆∆∆∆ =k

yxS

yx kkPMS ,, (2.23)

h) variância do vetor soma

VS ( ) ( )∑ ∆∆∆∆∆∆ −=k

yxS

yxyx kPMSk ,2

,, (2.24)

i) uniformidade (energia) do vetor soma

UNIS ( )∑ ∆∆∆∆ =k

yxS

yx kP 2,, (2.25)

j) entropia do vetor soma

( ) ( )∑ ∆∆∆∆∆∆ −=k

yxS

yxS

yx kPkPENTS ,,, log (2.26)

l) média do vetor diferença

( )∑ ∆∆∆∆ =k

yxD

yx kkPMD ,, (2.27)

m) variância do vetor diferença

VD ( ) ( )∑ ∆∆∆∆∆∆ −=k

yxD

yxyx kPMDk ,2

,, (2.28)

43

n) uniformidade do vetor diferença

UNID ( )∑ ∆∆∆∆ =k

yxD

yx kP 2,, (2.29)

o) entropia do vetor diferença

( ) ( )∑ ∆∆∆∆∆∆ −=k

yxD

yxD

yx kPkPENTD ,,, log (2.30)

2.3.4 Atributos de Autocorrelação Espacial

As análises de autocorrelação espacial têm por finalidade obter comportamentos globais

dos níveis de cinza distribuídos sobre uma região na imagem, e também inferir padrões

para esta dependência espacial.

A autocorrelação espacial indica a relação espacial existente entre os pixels pertencente

a imagem. Essa relação é definida através da informação de vizinhança entre os pixels.

Há um valor de autocorrelação para cada relação de vizinhança, sendo definida por uma

distância em linhas e outra em colunas (Rennó, 1995), comumente denominada lag. Por

exemplo, a autocorrelação de lag (1,1) refere a correlação existente entre cada pixel e

seu vizinho na direção θ = -45°. Outras configurações de lags podem ser testadas,

obtendo novos valores de autocorrelação na mesma região de estudo. Portanto, a

escolha dos lags é de fundamental importância na caracterização da autocorrelação da

região. A autocorrelação espacial para região retangular é definida como:

( )( )

( )∑∑

∑∑

==

−

=++

−

=

−

−−= nj

jji

ni

i

ljnj

jljjliiji

lini

iljli

xx

xxxxAUT

1

2,

1

1,,

1, (2.31)

44

onde li e lj são os lags em coluna e linha respectivamente; ni e nj são o número de

colunas e linhas, xi,j é o nível de cinza do pixel localizado na i-ésima coluna e j-ésima

linha e x é o nível de cinza médio.

2.3.5 Atributos de Forma

Classificadores tradicionais, baseados em princípios espectrais, são os que

habitualmente encontram-se implementados na maioria dos softwares utilizados em

processos de extração de atributos de uma região. No processamento digital de imagem,

uma representação de uma região não consiste apenas na diferenciação dos níveis de

cinza dos objetos, mas também da delimitação de sua fronteira através da forma dos

objetos (região).

Técnicas qualitativas e quantitativas são desenvolvidas para caracterizar a forma dos

objetos nas imagens (Pratt, 1991). Essas técnicas vêm sendo usadas na classificação de

imagens nos sistemas de reconhecimentos de padrões. Há várias outras maneiras de

representar e descrever a variação da forma dos objetos, como através da teoria do

código da cadeia, teoria das assinaturas, dos números de formas, circularidade, entre

outras (Gonzales e Woods, 2000). Com o estabelecimento das medidas de distância,

área e perímetro, vários atributos geométricos dos objetos podem ser desenvolvidos

(Pratt, 1991). O valor da área de um objeto em dado matricial (imagem) é obtido, de

forma simples, através da contagem dos pixels que pertencem ao objeto.

Para o cálculo do perímetro de um objeto, representado na forma matricial, é necessário

extrair os pixels de borda. Existem vários algoritmos para a extração de pixels de borda,

cada um com sua característica peculiar. Uma simples definição do perímetro de um

objeto em dados matriciais é dada pelo número de pixels pertencente a borda do objeto.

Defini-se borda como sendo a fronteira entre duas regiões, cujo níveis de cinza

predominantes são relativamente diferentes (Marques Filho e Vieira Neto, 1999).

Existem na literatura vários algoritmos desenvolvidos com objetivo de obter um valor

do perímetro mais próximo do valor real. Intuitivamente, o perímetro de um objeto pode

ser calculado medindo-se (percorrendo-se) todos os lados do mesmo. Observa-se que o

45

resultado do cálculo do perímetro por esse métodos tem o mesmo valor de um retângulo

envolvente ao objeto. Essa é uma limitação do método. A representação de objetos na

forma matricial pode introduzir erros na definição de suas bordas dependendo da sua

escala, rotação e a complexidades do objeto.

A Figura 2.4 apresenta o mesmo objeto (um quadrado) em duas posições na imagem.

Pode-se notar o aparecimento de um efeito “escada” onde deveria aparecer uma linha

inclinada. Nesse caso, o valor do perímetro calculado pelo lado dos pixels pertencentes

a borda, aproximadamente dobra quando o quadrado é rotacionado em 45° (quadrado a

direita ).

FIGURA 2.4 – Diferentes valores do perímetro para um mesmo objeto.

Outro algoritmo de cálculo do perímetro de um objeto é executado através de

operadores de detecção, que percorrem toda a borda do objeto, geralmente no sentido

horário. Os operadores de detecção identificam os pixels pertencentes à borda do objeto,

os quais são utilizados no cálculo do perímetro (Gose et al., 1996).

A Figura 2.5 apresenta configurações de operadores de detecção através de uma janela

de 4 pixels. Os pixels escuros representam os pixels pertencentes ao objeto. Se existir 4

pixels escuros em uma uma janela de 4 pixels, o pixel em análise não faz parte da borda

do objeto. Através de cada configuração, o algoritmo pecorre o objeto em direções

diferentes, dependendo da configuração dos operadores (configuração de 1, 2 ou 3

pixels), até o pixel inicial da análise.

46

FIGURA 2.5 – Operadores de detecção. As setas indicam a direção de movimentação

dos operadores. Os pixels escuros identificam aqueles pertencentes ao objeto.

O cálculo do perímetro utilizando operadores de detecção pode ter valores diferentes

para um mesmo objeto, dependendo da configuração de vizinhança estabelecida para os

operadores. A Figura 2.6 simula um objeto em uma imagem 2D, utilizando para o

cálculo do perímetro operadores de detecção em uma janela de 4 pixels. Observa-se três

configurações dos operadores de detecção (em vermelho) e suas direções de

deslocamento em um mesmo objeto. A primeira configuração apresenta uma

configuração de 2 pixels e a sua direção de deslocamento (para cima), a segunda

configuração é de 1 pixel e seu descolcamento para o lado direito, e por último a terceira

configuração de 3 pixels com o deslocamento para cima. Seguindo esse mesmo

raciocínio, percorre-se todo o objeto identificando os pixels de borda . A restrição deste

método é que o cálculo do perímetro em dados matriciais não é invariante à rotação.

47

FIGURA 2.6 – Exemplos de cálculo de perímetro por operados de detecção.

Como boa parte dos atributos de forma utilizam na sua formulação o perímetro como

uma variável, torna-se indispensável a eficiência na estimação do perímetro, que irá

implicar em uma melhor representação dos atributos de forma.

A extração de atributo da forma constitui-se em uma importante fonte de dados para o

processo de classificação de imagens, contribuindo em muitos casos para um melhor

desempenho no processo de classificação. Segundo Soltanian-Zadeha et al. (2004),

pode-se representar a forma de um objeto através de modelos. Esse método foi bastante

utilizado, mas é ineficiente. Cada objeto requer um único modelo para representar cada

possível orientação ou localização do objeto na imagem, tornando-se inviável a sua

aplicação no processamento de imagens.

Progressos recentes na área de tecnologia de computadores, tornaram possível o

desenvolvimento de atributos de forma na representação global em uma imagem (Duda

et al., 2001). Atributos de momento, coeficiente de Fourier são exemplos de métodos de

análise da forma de objetos em imagens digitais.

Outros métodos de análise da forma depende do conhecimento do contorno do objeto,

por exemplo, chain coding (Jahne, 1997). Pode-se categorizar os diferentes métodos

entre os baseados na representação de região ou contorno. Cada representação fornece

várias medidas da forma de um objeto em uma imagem. Uns dos atributos mais

utilizados são o comprimento, a largura e a área dos objetos. Outros atributos de forma

podem exigir uma alta complexidade computacional. Segundo Gose et al. (1996), outra

48

medida de forma que pode ser utilizada como atributo é o perímetro (P) ao quadrado

dividido pela área (A) de uma região. Esse atributo é chamado de complexidade. Para

um objeto igual a um círculo de raio r ,esse atributo tem valor igual:

57,124/)2(/ 222 === πππ rrAP (2.32)

Objetos com formas diferentes apresentam valores mais altos. Por exemplo, P2/A = 16

para todos os quadrados e P2/A = 20,78 para um triângulo eqüilátero.

Pode-se modificar o atributo de complexidade com o objetivo de produzir uma medida

de circularidade ou coeficiente de compacidade (compactness) definido por:

2/4 PAC π= (2.33)

A circularidade é um atributo adimensional que varia de 0 a 1. Se o objeto for um

círculo a medida de circularidade é igual a 1. O atributo de circularidade é fortemente

utilizado nos sistemas de reconhecimento de padrões, pois tem a característica de ser

invariante a rotação e a mudança de escala, já que o mesmo depende dos descritores

simples como a área e o perímetro, e esse por sua vez, não deveria depender da rotação

das regiões.

Os atributos de forma possibilitam a separação dos objetos que possuem formas

diferentes e mesma resposta espectral. A análise da forma do objeto é de fundamental

importância para estudos relacionados com o espaço urbano. Alguns objetos em

imagem de alta resolução possuem semelhanças na resposta espectral, sendo necessário

aplicar outros tipos de atributos para separar esses objetos. Por exemplo, os telhados, no

caso das áreas urbanas, podem ter semelhança na resposta espectral com as vias e ruas,

mas possuem formas diferentes. Essa análise poderia possibilitar o monitoramento e

planejamento da expansão de uma cidade através de imagem de satélite, principalmente

imagens de alta resolução espacial.

49

2.4 Seleção de Atributos

Pode-se pensar, erroneamente, que quanto maior o número de atributos para representar

um padrão (classe), maior o poder discriminatório do classificador. Porém, nem sempre

isso é verdade. Na prática, o que acontece, é uma degradação na acurácia dos resultados

da classificação com o aumento da dimensionalidade dos dados, mantendo-se constante

o número de amostras de treinamento. Segundo Jain et al. (2000), existem duas razões

para reduzir a dimensionalidade: diminuir o custo de processamento e aumentar a

acurácia da classificação.

As buscas por soluções mais rápidas, automáticas e de baixa complexidade

computacional, proporcionaram avanços significativos no desenvolvimento de

algoritmos de seleção de atributos. A forma ideal para se obter o melhor subconjunto de

atributos em processamento de imagem é através do cálculo do erro de classificação.

Para um número alto de atributos, esse método se torna inviável, pois o cálculo do erro

deverá ser feito para todas as combinações de atributos, o que envolve a classificação de

um número grande de padrões.

A seleção de atributos é uma tarefa de difícil realização, pois depende dos dados de

entrada, isto é, do domínio da aplicação (Dutra e Huber, 1999). O problema da seleção

de atributos começa com a seleção de um conjunto de m-dimensões, onde cada

dimensão representa um atributo, a partir de um conjunto de d-dimensões, onde m ≤ d

(Dutra e Huber, 1998). Métodos automáticos de seleção de atributos são importantes em

muitas situações em que se tem disponível um conjunto com um número grande de

atributos e deseja-se selecionar um subconjunto adequado para solucionar o problema.

A seleção de atributos é uma técnica de otimização que, dado um conjunto de d

atributos, tenta selecionar um subconjunto de tamanho requerido que maximiza uma

função critério.

Os algoritmos de seleção de atributos são desenvolvidos principalmente para reduzir a

dimensionalidade sem que ocorra perda na eficiência do poder de distinção das classes

pelo classificador. Essa fase é destinada à escolha dos atributos que melhor distinguem

as classes previamente selecionadas. A maioria dos métodos de seleção de atributos

50

utiliza princípios estatísticos, ou seja, medidas estatísticas dos atributos entre pares de

classes, selecionando os atributos que contém informações relevantes para reproduzir o

problema.

Há várias formas de medir a distância entre conjuntos de classes diferentes no espaço de

atributos. Dentre elas, pode-se citar (Theodoridis e Koutroumbas, 1999; Kohn, 1998):

Distância Euclidiana: distância entre dois pontos (Figura 2.7). No espaço de

atributos d-dimensional a distância euclidiana entre um ponto x qualquer e o centróide

(média) da classe k é definida por:

∑=

−=d

iikixk xE

1

2)( µ (2.34)

onde xi é o valor do atributo i no ponto x, µ ik é o valor médio do atributo i na classe k e

d é o número de atributos.

FIGURA 2.7 – Distância Euclidiana no espaço de atributos.

51

Distância de Mahalanobis: distância entre um ponto e o centróide de uma

distribuição (Figura 2.8). A distância de Mahalanobis entre um ponto x e a classe k é

definida por:

[ ] )()( 1 xxM kkt

kxk −−=−∑ µµ (2.35)

onde µk e Σk representam o vetor de média e a matriz de covariância da classe.

FIGURA 2.8 – Distância de Mahalanobis no espaço de atributos.

Distância de Bhattacharyya: medida da similaridade entre duas distribuições

estatísticas (Bhattacharyya, 1943). Na seleção de atributos, a distância de Bhattacharyya

entre a distribuição x e a distribuição da classe k é dada por:

xk

xk

xkxkt

xkkxB∑∑

∑+∑

+−

∑+∑

−=− 2ln

21)(

2)(

81 1

µµµµ (2.36)

onde µk e µx são os vetores de média e Σk e Σx representam as matrizes de covariância

da classe k e de x.

52

A Figura 2.9 apresenta um exemplo de aplicação da distância de Bhattacharyya,

calculando a distância da distribuição x entre as classes 1 e 2 em duas dimensões.

FIGURA 2.9 – Distância de Bhattacharyya no espaço de atributos.

Para executar a seleção de atributos com base em distâncias entre classes, é necessário

definir uma função critério que possa avaliar a separabilidade entre todas as classes de

uma maneira global. A função critério para a maioria das distâncias citadas acima pode

ser efetuada por uma simples operação de soma, média, desvio padrão e outras

características estatísticas entre os pares de classes existente (Dutra e Huber, 1998). É

desejável que a função critério seja maior quanto menor for a redundância entre os

atributos e quanto maior a facilidade de discriminar padrões de classes diferentes.

Ao utilizar uma função critério em métodos de seleção de atributos deve-se maximizar a

distância entre padrões de classes diferentes no espaço de atributos, visando otimizar o

conjunto de atributos para minimizar a probabilidade de erro na classificação.

A distância Jeffrerys-Matusita (distância JM) é uma função critério muito utilizada, que

expressa as medidas estatísticas de separabilidade entre duas distribuições (Richards,

1993). A distância JM entre as classes x e k é dada por:

53

)1(2 xkBxk eJM −−= , JM ∈ [0, 2 ) (2.37)

onde Bxk representa a distância de Bhattacharyya entre as classes x e k.

As medidas estatísticas citadas acima, representam um conjunto de distâncias utilizadas

no cálculo da separabilidade entre classes no espaço de atributo. Essa separabilidade é

usada nos métodos de seleção de atributos. Segundo Boz (2002), os algoritmos de

seleção de atributos são divididos em três grupos: exponenciais (busca exaustiva),

randômicos (algoritmo genético) e seqüenciais. De acordo com Jain e Zongker (1997),

tais abordagens podem ser agrupadas nas categorias de Reconhecimento Estatístico de

padrões (REP) e em redes neurais, cuja taxonomia é apresentada na Figura 2.10.

FIGURA 2.10 – Taxonomia dos métodos de seleção de atributos.

FONTE: Adaptada de Jain e Zongker (1997, p. 2).

Na área de REP, os métodos exploram as distribuições estatísticas dos atributos,

aplicando métodos determinísticos e estocásticos na obtenção dos subconjuntos de

atributos ótimos e sub-ótimos. Os métodos de seleção de atributos aplicados em redes

54

neurais buscam selecionar os melhores atributos para sua camada de entrada (utilizada

para a redistribuição da informação de entrada), selecionando o mais significativo na

etapa de classificação.

2.4.1 Seleção de Atributos em Redes Neurais Artificiais

O método Node Pruning é o método mais utilizado na literatura em aplicação de redes

neurais (Mao et al., 1994). Também chamado de “corte de nós”, funciona através de

uma rede neural multi-camadas com retro-alimentação, utilizando um algoritmo de

aprendizado baseado em retro-propagação (backpropagation). Segundo Campos (2001),

esse método é definido por uma medida de “significância de nós” e utiliza um algoritmo

que elimina os nós menos significativos. Dessa forma, reduz-se o conjunto de

treinamento da rede, diminuindo a complexidade.

2.4.2 Seleção de Atributos em Reconhecimento Estatístico de Padrões

O método de seleção de atributo utilizado para extrair um subconjunto ótimo do

conjunto global de atributos é a busca exaustiva. O número de possibilidades desse

método cresce exponencialmente, fazendo a busca exaustiva pouco utilizada para um

número alto de atributos. O que se faz é extrair um subconjunto ótimo do conjunto

global de n atributos para um número fixo de k atributos. A esse método dá-se o nome

de método de seleção de atributos exaustivo de escolha fixa (FIXO).

Segundo Narendra e Fukunaga (1994), o algoritmo branch-and-bound de seleção de

atributos extrai um subconjunto ótimo sem efetuar a busca exaustiva. A principal

característica do algoritmo é a propriedade monotônica da função critério, cujo valor

aumenta à medida que se adiciona um atributo no conjunto global de atributos.

Os métodos que extraem subconjuntos sub-ótimos utilizam duas abordagens:

determinística e estocástica. As duas abordagens proporcionam a seleção de uma única

solução (único caminho) ou de várias soluções (múltiplos caminhos) para o problema de

seleção de atributos. Os métodos seqüenciais são os mais utilizados para selecionar um

único subconjunto. Dos métodos que fornecem múltiplos caminhos para a solução do

55

problema, os algoritmos genéticos destacam-se por utilizar um conjunto de soluções a

cada iteração.

2.4.2.1 Algoritmo Genético (AG)

Os métodos tradicionais de seleção, que trabalham com apenas uma solução, são

aplicados para solucionar problemas com único caminho. A otimização por múltiplos

caminhos exige que o método de busca encontre um conjunto de soluções ideais, e não

uma solução global ideal.

Os algoritmos genéticos (AG) simulam a evolução de uma população de indivíduos

(conjunto global de atributos), baseados na teoria da seleção natural, com o objetivo de

encontrar a solução final de um determinado problema (Harper et al., 2005). A teoria da

seleção natural especifica que os indivíduos (subconjunto de atributos) mais aptos, com

relação a um determinado ambiente, têm maior probabilidade de sobreviverem e

aumentar a sua descendência neste ambiente.

A aplicação de um algoritmo genético a um determinado problema consiste em

especificar cada subconjunto de atributos como uma possível solução do problema,

determinar uma população formada por estes subconjuntos de atributos, e o mais

importante, determinar uma forma de avaliação da aptidão de cada subconjunto de

atributos com relação ao ambiente em que este se encontra. O ambiente é a

representação do problema que se quer solucionar.

A aptidão ou valor de aptidão do subconjunto de atributos representa o quão próxima da

solução ótima (melhor solução possível), está a possível solução representada pelo

subconjunto de atributos deste problema. Normalmente, os subconjuntos de atributos

mais aptos de uma população têm maior probabilidade de se reproduzirem ou serem

alterados através de operadores genéticos como recombinação genética e mutação (ação

do ambiente selecionando os subconjuntos de atributos mais aptos). Desta forma, novos

indivíduos são obtidos a partir de indivíduos com elevados valores de aptidão, com o

objetivo de gerar um indivíduo que represente a solução ótima do problema.

56

Algoritmos genéticos foram provados, teoricamente e empiricamente, eficientes em

buscas robustas em espaços complexos de soluções, podendo ser aplicados a problemas

de otimização de complexos sistemas de equações não lineares restritas. Diversos

artigos e dissertações estabelecem a validade do método em aplicações de otimização de

funções e controle, que necessitam de soluções com elevado índice de aproximação das

soluções exatas (Harper et al., 2005; Zhang et al., 2004; Meyer e Packard, 1992; Tsutsui

e Fujimoto, 1993; Mitchel, 1998).

Apesar das vantagens, os AG não são eficientes para muitos problemas. Segundo

Lacerda e Carvalho (1999), os AG são bastantes lentos. Enquanto os AG estão

avaliando a população inicial, muitos outros métodos de seleção de atributos

convencionais já encontravam a solução. Segundo Beasley et al. (1993), a área de maior

interesse para os AG é aquela que envolve problemas de difícil otmização pelas técnicas

convencionais. Quando uma técnica convencional pode ser utilizada, ela geralmente é

mais rápida e mais precisa que os AG.

2.4.2.2 Simulated Annealing

Simulated Annealing (SA) é um método de busca aplicado extensamente na solução de

muitos problemas de otimização combinatorial (Azizi e Zolfaghari, 2004). Este método

é utilizado para contornar o problema dos mínimos locais, e permite encontrar a solução

global ótima. O processo se inicia com um atributo qualquer do espaço de soluções,

normalmente gerado aleatoriamente, e seleciona um de seus vizinhos randomicamente.

Se este vizinho fornecer melhor discriminação entre as classes que o atributo original,

ele é aceito e substitui a solução corrente. Segundo Reeves (1993), se o algoritmo ao

incrementar o atributo, piorar por uma quantidade ∆, ele é aceito com uma

probabilidade e-∆/T, onde T decresce gradualmente conforme o progresso do algoritmo.

Esse processo é repetido até que T seja tão pequeno que mais nenhum movimento seja

aceito. A melhor solução encontrada durante a busca é tomada como uma boa

aproximação para a solução ótima.

Originalmente, Simulated Annealing foi derivado de simulações em termodinâmica e

por esta razão o parâmetro T é referenciado como temperatura e a maneira pela qual ela

57

é reduzida é chamada de processo de resfriamento. Diversos artigos estabelecem a

validade do método em aplicações de otimização (Azizi e Zolfaghari, 2004; Hajek,

1988; Huang et al., 1986; Thompson e Dowsland, 1995).

A área de aplicação do SA é em problemas de difícil otmização pelas técnicas

convencionais. Apesar do método SA convergir para a solução ótima, a velocidade de

redução de temperatura exigida implica em visitar um número exponencial de soluções.

A princípio é necessário um processo lento de redução da temperatura e isso resulta em

tempos de processamento elevados. Segundo Reeves (1993), outra desvatagem na

utilização dos método AS é a calibração de muitos parâmetros. Isso torna o processo de

seleção mais lento e com uma alta complexidade computacional.

2.4.2.3 Algoritmos Sequenciais de Seleção de Atributos

Os métodos seqüenciais de seleção de atributos têm sido estudados em vários trabalhos

(Dutra e Huber, 1999; Jain e Zongker, 1997). Segundo Dutra e Huber (1999), os dois

métodos seqüenciais mais proeminentes da seleção de atributos são: Sequential

Forward Feature Selection (SFS) e Sequential Backward Feature Selection (SBS).

O algoritmo de seleção seqüencial para frente (SFS) vem sendo utilizado na tentativa de

resolver a tarefa de seleção de atributos (Dutra e Huber, 1999; Jain et al., 2000;

Campos, 2001). O métodos SFS é facil de implementar, possui baixo custo

computacional e muito utilizado na solucão de problemas de otmização e busca.

Aplicado em sistemas, onde pretende-se obter um subconjunto de atributos com

eficiência e de forma rápida, o métodos SFS apresenta uma aceitável solução para o que

se propõe.

Nos sistemas de processamento de imagens, o método SFS é utilizado principalmente

na seleção dos canais que melhor discriminam as classes. Outra utilização é na escolha

dos melhores atributos que representam uma classe (variância, média, entre outros), e

que serão utilizados no preocesso de classificação.

58

O algoritmo SFS inicia com um conjunto vazio (Y0= φ) e, conforme o algoritmo é

executado, o melhor atributo x+ é inserido no subconjunto, resultante do máximo valor

da função critério J (YK + x+), quando combinado com os atributos YK que já tenha sido

selecionado (Figura 2.11).

FIGURA 2.11 – Algoritmo SFS.

Os passos de 2 a 4 são continuamente repetidos até que um critério de parada seja

satisfeito. Para os métodos sequenciais, a seleção de atributos pode ser interrompida

quando o número de atributos selecionados for igual ao número de amostra de

treinamento da classe que possui a menor quantidade de amostras de treinamento.

O método SFS tem menor custo computacional quando se deseja obter conjuntos

pequenos em relação ao total de atributos (Jain e Zongker, 1997). Uma vez que um

atributo tenha sido selecionado, ele não pode ser descartado do subconjunto, o que pode

provocar o chamado efeito nesting. Este efeito ocorre quando o subconjunto ótimo não

contém elementos do conjunto já selecionado, o que impossibilita que seja obtido o

conjunto de atributos ótimo.

O algoritmo SBS, assim com método SFS vem sendo utilizado em trabalho

direcionando ao estudo de seleção de atributos em sistemas de processamento de

imagens (Dutra e Huber, 1999; Jain et al., 2000; Campos, 2001).

O algoritmo SBS inicia com um conjunto de atributos completo (Y0= X) e, nas iterações

do algoritmo, remove-se o atributo com o mínimo valor da função critério J (YK – x-),

onde YK é o conjunto de atributos já selecionado e x- é o atributo a ser removido (Figura

59

2.12). O método SBS tem menor custo computacional, quando se deseja obter conjuntos

grandes em relação ao total de atributos.

Uma desvantagem desse método é que as primeiras interações são executadas com o

número global de atributos. Se existir uma alta correlação entre os atributos em estudo,

o método pode eliminar o atributo que representa melhor a separabilidade entre as

classes. Isso por que, a discriminação das classes por esse atributo, pode não representar

uma boa separabilidades entre as classes quando unido a um subconjunto maior. Uma

vez eliminado o atributo, ele não retornará ao subconjunto de atributos selecionado para

a classificação.

FIGURA 2.12 – Algoritmo SBS.

Assim como o método SFS, pode-se utilizar o número de amostra de treinamento da

classe que possui a menor quantidade de amostras de treinamento como o critério de

parada na seleção de atributos.

61

CAPÍTULO 3

MATERIAIS E MÉTODOS

Este capítulo apresenta a descrição do protótipo utilizado na classificação de imagens

por região e as implementações dos algoritmos desenvolvidos neste trabalho. O sistema

Texture (Rennó et al, 1998) foi aperfeiçoado a fim de agregar métodos de seleção de

atributos e extração de atributos de forma, fornecendo um produto de análise de imagem

com um grande potencial de uso. Os algoritmos de extração de atributos de forma e

seleção de atributos, assim como a interface gráfica, foram implementados na

linguagem de programação IDL (Interactive Data Language), utilizando algumas

funções do ENVI. As atividades realizadas na implementação dos métodos de extração

e seleção de atributos e as interfaces do sistema são apresentadas a seguir.

3.1 Sistema Texture

3.1.1 Extração de Atributos

No processamento digital de imagem, a representação de uma região consiste em duas

alternativas: a representação de sua fronteira (forma); ou em termos dos pixels que

compõem a região (textura). Quando se trabalha com classificação de regiões, as

informações contextuais e geométricas podem ser importantes para a representatividade

das regiões que representam uma determinada classe. Extrair informações significativas

das classes descreve a eficiência dos métodos de extração de atributos e possibilita uma

melhor discriminação das classes no processo de classificação.

O sistema desenvolvido possui métodos de extração de atributos de textura e de forma.

Os atributos de textura já existentes no sistema, foram reorganizados em 3 grupos:

Distribucional (dist), que se divide em dois subgrupos (básicos e particulares); co-

ocorrência (cooc); autocorrelação espacial (auto). A importância e a utilidade da textura

em sistema de reconhecimento de padrões é enfatizada pela grande quantidade de

trabalhos nestas áreas.

62

Nos últimos anos, muitos trabalhos têm se concentrado na utilização da informação

textural, em sistemas de processamento de imagens (Chang e Kuo, 1993; Manjunath e

Ma, 1996; Rennó et al., 1998; Arivazhagan e Ganesan, 2003). Neste caso, a eficiência

da representação dos atributos de textura é essencial para se obter uma boa

representação das classes, delimitando com maior precisão as fronteiras de

separabilidade das classes no espaço de atributos. Dessa forma, o classificador pode,

independente da sua complexidade, obter bons resultados na etapa de classificação.

Utilizou-se a estrutura do sistema Texture para agregar atributos de forma (shape), ao

processo de extração de atributos, que integrados ao sistema, fosse possível aumentar a

distinção entre as classes. A utilização dos atributos de forma é de fundamental

importância na análise da separabilidades das classes que possuem respostas espectrais

similares, mas apresentam geometrias diferentes. Dessa forma, a partição do espaço de

atributos se torna melhor definida, fornecendo um melhor desempenho do classificador

utilizado.

Os atributos são representados por vetores contendo medidas extraídas das imagens.

Utilizam-se esses vetores na seleção de atributos e na etapa de classificação,

examinando as distribuições estatísticas de cada atributo na distinção das classes. Deve-

se extrair atributos relevantes na separabilidade das classes para se obter bons resultados

no processo de classificação. Diante dessas características, o sistema pode disponibilizar

ao usuário a extração de um número elevado de atributos, tanto atributos de textura com

atributos de forma.

A Figura 3.1 apresenta um fluxograma dos atributos existentes no sistema

(distribucionais, co-ocorrência e autocorrelação espacial) e os atributos de forma dos

objetos (marcados por um retângulo vermelho).

63

FIGURA 3.1 - Fluxograma dos atributos existentes no sistema. O retângulo em

vermelho destaca os atributos implementados neste trabalho.

64

As informações (medidas) extraídas das regiões são registradas em uma estrutura de

dados que permite a imediata identificação da origem do atributo: nome da imagem,

banda utilizada, nome dos atributos e configuração. Separa-se a estrutura em layers,

onde cada layer possui informações do número de atributos e quais os atributos que

fazem parte desse layer, assim como a imagem na qual foram extraídas esses atributos.

A união de todos os dados, de todas as imagens, forma desta maneira, o espaço de

atributos.

Inicialmente, pode-se extrair todos os atributos existentes no sistema para um único

canal (banda de uma imagem) e fazer o mesmo procedimento para outros canais. O

sistema também suporta imagens de diferentes sensores na extração de atributos. O

objetivo de agregar essas características é a possibilidade de aumentar a eficiência do

classificador. É necessário que o usuário conheça as características de cada atributo,

pois fornecerão um melhor entendimento das medidas de separabilidade entre as

classes.

A possibilidade de extrair informações das regiões com objetivo de aumentar a

separabilidade entre as classes é grande, e a sua eficiência está diretamente ligada a

delimitação das regiões através do processo de segmentação ou pela aquisição dos ROI

(Region of Interest) a partir do ENVI.

Grande parte dos atributos de forma, em dados matriciais, utilizam os valores do

perímetro e da área de uma região na sua formulação, onde uma boa estimação do

perímetro e um preciso cálculo da área de uma região implica em uma melhor

representação dos atributos de forma. A seguir serão descritos os atributos de forma

implementados neste trabalho.

3.1.1.1 Área

Efetuou-se a implementação do atributo Área contando-se os pixels existentes em cada

região. Esse método de cálculo de área supõe que os pixels na imagem possuem a

mesma dimensão, ou seja, o tamanho do pixels seja constante.

65

3.1.1.2 Perímetro

Para o atributo Perímetro, primeiramente, desenvolveu-se um procedimento para a

detecção dos pixels pertencentes à borda, utilizando uma configuração de vizinhança 4

(Figura 3.2).

FIGURA 3.2 - Definição dos pixels vizinhos (em cinza) ao pixel k (em preto)

considerados na análise de borda.

Como todos os pixels pertencentes a uma determinada região possuem um mesmo

identificador, percorreu-se todos os pixels analisando a sua vizinhança. Se existir 4

pixels na configuração de vizinhança 4, que pertençam a mesma região, o pixel em

análise não faz parte da borda da região. Por exemplo, os pixels com valores diferentes

de 4 na Figura 3.3 são identificados como pixels de borda, os quais serão utilizados no

cálculo do perímetro.

FIGURA 3.3 – Detecção dos pixels de borda.

Os pixels pertencentes a borda são armazenados em uma estrutura que possui a

quantidade de pixels vizinhos ao mesmo e seus endereçamentos. A estimativa do

k

66

perímetro é feita através do cálculo da distância entre os centróides dos pixels de borda,

atributindo o valor 1 para pixels na horizontal e vertical ou 2 para pixels na diagonal.

Visando analisar as possíveis configurações dos pixels de borda, percorre-se todos os

pixels com uma vizinhança 8, estabelecendo as configurações de vizinhança para cada

pixel de borda.

O vetor criado para o cálculo do perímetro, inicia com um conjunto vazio. A medida

que percorre-se os pixels de borda, adiciona-se um determinado valor ao perímetro,

dependendo da configuração dos pixels. A Figura 3.4 apresenta exemplos de três

possíveis configurações de vizinhança 8 para cada pixel de borda. Na primeira

configuração (Figura 3.4a), o pixel em análise possui pixels adjacentes na horizontal e

vertical. Para o cálculo do perímetro, essa configuração acrescenta um valor de 2

unidades. A configuração apresentada na Figura 3.4b, possui um pixel na horizontal ou

vertical e um pixel na diagonal. Essa configuração adiciona ao valor do perímetro 1+

2 unidades. Na última configuração, os pixels de borda adjacentes ao pixel em

análise, encontram-se na diagonal, essa por sua vez, adiciona ao valor do perímetro

2 2 unidades. Como o pixel seguinte da análise encontra-se na configuração anterior,

ao final do cálculo do perímetro, somam-se os valores contido no vetor do perímetro e

divide-se o valor encontrado por 2. Dessa forma, calcula-se o valor do perímetro para

cada região existente na imagem.

(a)

(b)

(c)

FIGURA 3.4 – Exemplos de configurações de vizinhança 8 para os pixels de borda.

67

Para melhor percepção do cálculo do perímetro utilizando a metodologia descrita acima,

um exemplo de duas configuração dos pixels de borda (A e B) é apresentado na Figura

3.5. A configuração A apresenta uma análise para o pixel de borda, atributindo um valor

de 2 unidades (pixels adjacentes ao pixels em análise na horizontal e na vertical) no

cálculo do perímetro. Na configuração B, atribui-se o valor 1+ 2 (um pixel adjacente

na vertical e outro na diagonal) no cálculo do perímetro.

FIGURA 3.5–Delimitação do perímetro. Em detalhe, duas configurações (A e B) de

vizinhança para cada pixels de borda. A linha azul marca o perímetro estimado.

3.1.1.3 Complexidade

Implementou-se os atributos de complexidade com o objetivo de extrair informações da

forma das regiões, a fim de aumentar o poder discriminatório do classificador, conforme

Equação 2.32.

3.1.1.4 Circularidade

Definiu-se o atributo de circularidade ou coeficiente de compacidade (compactness),

conforme Equação 2.33. A circularidade é um atributo adimensional que varia de 0 a 1.

68

Um objeto que possui uma forma semelhante a um círculo, o valor da circularidade

aproxima-se a 1. Para outros objetos, o valor da circularidade é menor.

3.1.2 Seleção de atributos

No processamento de imagens, é necessário escolher diferentes atributos

(características) conforme as classes de interesse. Um número alto de atributos não

implica em uma boa classificação, ao contrário, pode existir uma alta correlação entre

os atributos, fazendo com que o custo de processamento aumente e podendo gerar

problemas matemáticos (inversão de matrizes). Faz-se então necessário escolher os

atributos mais representativos, ou seja, que melhor discriminam as classes de interesse.

Isso é possível aplicando os métodos de seleção de atributos descritos na seção 2.3.

O sistema dispõe, durante a etapa de extração de atributos no sistema, de uma grande

quantidade de atributos , pois existe possibilidade de extrair todos os atributos de várias

imagens diferentes e ainda o sistema proporciona muitas configurações, tanto para a

matriz de co-ocorrência como para as autocorrelações espaciais. Para um número alto

de atributos, a análise visual não proporciona um bom resultado na seleção dos

melhores atributos, decorrente da limitação do sistema em apresentar dados multi-

dimensionais.

A etapa de seleção de atributos é uma das principais tarefas de processamento de

imagens, utilizada para selecionar os atributos mais representativos na separabilidade

das classes. É importante lembrar, que um atributo é considerado relevante se ele é

capaz de distinguir objetos pertencentes a cada classe.

O sistema oferece uma ferramenta visual de análise dos atributos em duas dimensões

para cada classe (Figura 3.6). Pode-se visualizar dois gráficos nessa análise: o primeiro

apresenta a dispersão dos atributos para as amostras de treinamento em cada classe; e o

segundo apresenta essa dispersão de forma escalonada (entre 0 e 1), utilizada nos

processos de seleção e classificação. O usuário pode através dessa análise eliminar

alguns atributos que visualmente não apresentam uma boa separabilidade entre as

classes, ou ainda executar a fusão (merge) entre as classes que apresentam similaridades

69

na dispersão dos atributos. A Figura 3.6a apresenta a distribuição dos valores do

atributo de média das amostras de treinamento para cada classe (1, 2 e 3). Cada traço,

no gráfico, representa o valor do atributo. O traço maior é a média dos valores do

atributo de cada classe. Observa-se que na Figura 3.6b a separabilidade dos valores do

atributo de circularidade é maior que na Figura 3.6a.

(a) (b)

FIGURA 3.6 – Análise dos atributos em duas dimensões para cada classe. (a) Atributo de média e (b) atributo de circularidade.

Considera-se a melhor seleção de atributos aquela que resulta numa classificação com

mínimo erro. Esse procedimento é bastante custoso, pois é necessário fazer todas as

combinações de atributos e analisar os resultados da classificação, selecionando-se o

grupo de atributos que obtém o melhor desempenho do classificador. Para minimizar

este problema, de forma que não ocorra perda na eficiência do classificador,

implementaram-se três métodos de seleção de atributos no sistema Texture: Sequential

Forward Feature Selection (SFS), Sequential Backward Feature Selection (SBS) e o

algoritmo de escolha fixa do subconjunto de atributos (FIXO).

Um aspecto relevante na implementação é a possibilidade da aplicação dos métodos de

forma interativa, ou seja, pode-se utilizar os métodos sequenciais na seleção de um

subconjunto de atributos e posteriormente usar o método de busca exastiva de escolha

fixa na seleção de um subconjunto de atributos do subconjunto já selecionado pelo

70

método sequêncial. Isso torna-se importante, pois a complexidade do métodos de busca

exaustiva cresce exponencialmente, impossibilitando o seu uso para um número alto de

atributos. O que se faz é reduzir a dimensionalidade pelos métodos sequenciais e

posteriormente aplicar o método de busca exaustiva para selecionar o melhor

subconjunto no espaço reduzido. Todos os métodos são baseados em distâncias

estatísticas entre pares de classes.

Utilizou-se a distância JM com função critério no processo de seleção de atributos. O

primeiro passo é calcular a distância JM para todos os subconjuntos de atributos entre

pares de classes. Através do valor total da distância, de cada subconjunto de atributos,

efetua-se uma operação de média, ou seja, divide-se o valor total pelo número de

combinações entre pares de classes. A seleção do subconjunto de atributos é feita pelo

rank dos subconjuntos de atributos através do valor da maior distância média JM. O

primeiro subconjunto de atributos no rank (maior distância média JM) é selecionado

como o subconjunto que melhor discrimina as classes em estudo.

A partir das regiões de treinamento, fez-se a seleção de atributos pelos 3 métodos

propostos. A quantidade de atributos selecionados deve ser menor que o número

mínimo de amostras de treinamento para as classes analisadas. Isso porque, o cálculo da

distância de Bhattacharyya pode gerar problemas matemáticos de inversão de matrizes.

De acordo com as etapas de um sistema de processamento de imagens, implementaram-

se os métodos de seleção de atributos e posteriormente o algorimo de classificação por

região. Objetivando agregar essas etapas descritas anteriormente, implementou-se uma

interface de forma a conter as duas etapas. Com intuito de induzir o usuário a seguir as

etapas de processamento, desenvolveu-se algumas restrições que obriga o usuário a

primeiro selecionar os atributos e posteriormente efetuar a etapa de classificação.

3.1.3 Classificação

Uma classificação ideal, que corresponda totalmente a realidade, é muito difícil de ser

obtida, sendo uma tarefa mais geral, estimar a probabilidade de que um padrão (objeto)

71

pertença a uma determinada classe, baseando-se nos valores de algum atributo ou de um

conjunto de atributos.

A classificação por região analisa a variabilidade espacial de uma determinada região

em relação as classe em estudo. As regiões são extraídas pelo processo de segmentação.

Outra forma de extrair regiões de uma imagem é através da digitalização das regiões de

interesse (ROI). Assim como a etapa de extração de atributos pode ser executada

utilizando uma imagem segmentada ou regiões de interesse, o mesmo acontece com a

etapa de classificação.

O sistema Texture já dispunha de classificadores baseados na Máxima Verossimilhança

Gaussiana e na distância de Mahalanobis. Introduziu-se no sistema, um método baseado

em distância euclidiana. Esses métodos apresentam características peculiares e podem,

dependendo do problema, influenciar na eficácia da classificação.

3.2 Avaliação dos Métodos de Seleção e dos Atributos de Forma

Na avaliação, tanto para os atributos de forma quanto para os métodos de seleção de

atributos, foram desenvolvidos experimentos que evidenciam a sua eficiência em

sistemas de processamento de imagens. Os métodos de seleção de atributos foram

aplicados em todos os experimento a fim de selecionar o subconjunto que melhor

discrimina as classes definidas em cada experimento.

3.2.1 Imagens para Teste

Utilizaram-se imagens sintéticas e de sensoriamento remoto na validação dos métodos

de extração e seleção de atributos propostos. As imagens sintéticas foram usadas a fim

de obter um completo controle sobre as regiões existentes na mesma, tanto na análise

geométrica como nos valores espectrais.

Nas imagens sintéticas (960 x 720 pixels), foram representadas 3 formas geométricas

com diferentes dimensões: retângulo, círculo e triângulo. Cada forma geométrica possui

20 regiões, totalizando 60 regiões em toda a imagem. Através desse tipo de imagem,

procurou-se evidenciar a capacidade de discriminação dos objetos através de atributos

72

de forma e textura. Entretanto, como a representação de texturas é um problema

complexo, o álbum de texturas de Brodatz (1956) foi escolhido como fonte inicial de

dados de avaliação. O álbum de texturas de Brodatz tem sido frequentemente utilizado

em pesquisas de reconhecimento de padrões de texturas, pois apresenta grande variação

de tipos de texturas encontradas na natureza e de materiais sintéticos. Foram escolhidos

2 padrões de textura de Brodatz: Bark (D12) e Beach Sand (D29). Foram aplicados os

dois padrões de textura em cada forma geométrica como apresentada na em Figura 3.7.

Variaram-se aleatoriamente os valores de brilho e contraste de cada região.

FIGURA 3.7 – Imagem sintética com as duas texturas do álbum de Brodatz.

Para demonstrar a potencialidade dos métodos de extração e seleção de atributos

propostos para a classificação por região em imagens de sensoriamento remoto foi

utilizado uma imagem Landsat/TM banda 5 (400x400 pixels) da região da Floresta

Nacional Tapajós, situada no Estado do Pará (55° 03’ 35’’ a 55° 08’ 46’’ WGr, 03° 02’

07’’ a 03° 07’ 15’’S). A imagem Landsat/TM utilizada refere-se à órbita-ponto 227/062,

de 02 de agosto de 1999 (Figura 3.8).

73

FIGURA 3.8 – Imagem Landsat/TM banda 5.

3.2.2 Definição dos Experimentos

A fim de testar os métodos de extração e seleção de atributos para classificação de

regiões, desenvolveram-se experimentos, os quais utilizaram 38 atributos do sistema

proposto (Tabela 3.1). Utilizou-se a configuração da matriz de co-ocorrência 3x3 para

extrair os atributos de co-ocorrência.

TABELA 3.1– Atributos extraídos das regiões de treinamento.

F1 média (dist) F2 variância (dist) F3 desvio padrão (dist) F4 desvio absoluto da média (dist) F5 assimetria (dist) F6 curtose (dist) F7 coeficiente de variação (dist) F8 mediana (dist) F9 entropia (dist) F10 energia (dist) F11 média da log-normal (dist) F12 variância da log-normal (dist) F13 contraste (cooc) F14 entropia (cooc) F15 energia (cooc) F16 homogeniedade (cooc) F17 correlação (cooc) F18 dissimilaridade (cooc) F19 chi-quadrado (cooc)

F20 cluster shade (cooc) F21 cluster prominence (cooc) F22 média do vetor soma (cooc) F23 variância do vetor soma (cooc) F24 entropia do vetor soma (cooc) F25 energia do vetor soma (cooc) F26 média do vetor diferença (cooc) F27 variância do vetor diferença(cooc) F28 entropia do vetor diferença (cooc) F29 energia do vetor diferença (cooc) F30 contraste do vetor diferença (cooc) F31 área (shap) F32 perímetro (shap) F33 complexidade (shap) F34 circularidade (shap) F35 Lag 1,-1 (auto) F36 Lag 1,0 (auto) F37 Lag 1,1 (auto) F38 Lag 0,1 (auto)

74

O critério de avaliação da classificação, para todos os experimentos, foi executado

através da acurácia total (razão entre o número de regiões classificadas corretamente e

número total de regiões). Essa avaliação se deu na classificação das amostras de teste e

da imagem segmentada. Para a avaliação na imagem segmentada, foram escolhidas

aleatoriamente uma quantidade de amostras proporcional a cada classe no cálculo da

acurácia total.

3.2.2.1 Experimento Utilizando a Imagem Sintética

A partir da imagem sintética, foram preparados 3 experimentos a fim de testar a

eficiência dos métodos de extração e seleção de atributos na discriminação de objetos

com diferentes características de forma e textura. Para cada teste, extraíram-se amostras

de treinamento diferentes, com intuito de analisar todas as características dos atributos

existentes no sistema para cada região na imagem.

No primeiro experimento, buscou-se avaliar através dos processos de extração e

seleção, a viabilidade do uso dos atributos de forma na distinção de objetos com formas

geométricas distintas. Para tanto, a partir da imagem sintética, foram definidas 3 classes

de forma geométricas: retângulo, círculo e triângulo. Pode-se notar, pela Figura 3.9, que

cada classe (identificada por um retângulo colorido) apresenta as 2 texturas do álbum de

Brodatz, fazendo com que este experimento assemelhe-se ao estudo de separabilidade

entre classes que possuam padrões espectrais semelhantes, mas com a forma dos objetos

de cada classe diferente. Nesse experimento, selecionou-se de cada classe, 10 amostras

de treinamento (regiões destacados na Figura 3.9) utilizadas no processo de extração

dos atributos de forma e de textura (Tabela 3.1). As regiões restantes de cada classe

constituíram as amostras de teste utilizadas no cálculo da acurácia da classificação.

Utilizou-se o classificador de Mahalanobis e da distância Euclidiana no processo de

classificação das regiões.

75

FIGURA 3.9 – Imagem Original. O retângulo envolvente a cada forma geométrica

indica as classes em estudo. As regiões em destaque representam as amostras de treinamento.

O experimento 2 foi idêntico ao experimento 1 exceto pela rotação de algumas regiões

das amostras de treinamento e de teste, tendo por objetivo a análise dos atributos de

forma em relação a características de serem invariantes a rotação. Este teste consiste

em verificar se a representação dos atributos de forma através da rotação das regiões de

interesse extraídos pelos metódos propostos, é eficiente. A eficiência é verificada

quando os valores dos atributos extraídos nas duas imagens não tem alterações. A

Figura 3.10 apresenta a imagem com as regiões rotacionadas e as 10 regiões utilizadas

no treinamento.

FIGURA 3.10 – Imagem original. O retângulo envolvente a cada forma geométrica indica as classes em estudo. As regiões em destaque representam as amostras de treinamento.

76

No experimento 3, através da imagem sintética original (a mesma empregada no

experimento 1 e 2), procurou-se evidenciar as classes através das duas texturas álbum de

Brodatz: Bark (parte superior da Figura 3.11 ) e Beach Sand (parte inferior da Figura

3.11). O objetivo é analisar a eficiência dos métodos de seleção de atributos aplicados

ao número alto de atributo e verificar o desempenho do classificador para os

subconjuntos selecionados. Extrairam-se para cada classe, 15 amostras de treinamento

(regiões em destaque na Figura 3.11) e de teste.

FIGURA 3.11–Imagem original. A linha tracejada representa o limite entre as duas classes de textura. As regiões em destaque representam as amostras de treinamento.

3.2.2.2 Imagem de Sensoriamento Remoto

Na imagem de sensoriamento remoto, foram realizados dois experimento. Na extração

de atributos, utilizou-se apenas o canal 5 da imagem Landsat/TM, pois as classes em

estudo apresentam boa separabilidade nesse canal. Com base na imagem e no

conhecimento de campo, três classes de interesse foram definidas: Floresta primária

(FP), Desmatamento (DT) e água (AG).

77

No primeiro experimento, extrairam-se 20 amostras de treinamento e de teste para cada

classe, através da digitalização de ROI (Figura 3.12a), totalizando 120 regiões em toda a

imagem. As amostras de teste foram utilizadas na avaliação da classificação.

No segundo experimento, utilizou-se as mesmas amostras de treinamento do primeiro

experimento, mas na etapa de classificação, utilizaram-se uma imagem segmentada.

Usou-se na segmentação da imagem de sensoriamento remoto o segmentador proposto

por Sousa Junior et al (2003). Para a segmentação da imagem Landsat/TM utilizou-se

um limiar de área igual a 20 pixels e a similaridade de 10 níveis de cinza. Os valores

utilizados na segmentação foram estabelecidos pela análise visual do processo de

segmentação, os quais obtiveram uma melhor representatividade na delimitação dos

objetos. A Figura 3.12b apresenta a imagem segmentada utilizada no processo de

segmentação.

A imagem de referência utilizado neste trabalho foi confeccionada através dos dados

coletados em campo (Figura 3.12c). A metodologia usada para a confecção desse mapa

está descrita em Pardi Lacruz et al. (2001). Utilizaram-se as informações de campo na

definição das classes e na avaliação da classificação, analisando o desempenho do

classificador, visualizando não somente os acertos, mas também quais as classes cujas

amostras foram erroneamente classificadas e quais classes ocorreram confusão.

78

(a)

(b)

(c)

FIGURA 3.12 - Imagem de SR. (a) As regiões em destaque representam as amostras de treinamento, (b) imagem segmentada e (c) imagem de referência.

79

CAPÍTULO 4

RESULTADOS E DISCUSSÕES

O objetivo deste Capítulo é avaliar e discutir os resultados encontrados na aplicação dos

métodos de extração e seleção de atributos na classificação das diferentes classes

representadas através de atributos de forma e textura. Os resultados das atividades

realizadas na implementação dos métodos de extração e seleção de atributos e no

desenvolvimento e adaptação das interfaces no sistema são apresentados a seguir.

4.1 Teste com Imagens Sintéticas

Os resultados encontrados nos três experimentos utilizando imagens sintéticas para a

validação dos métodos de extração de atributos de forma e da aplicação dos métodos de

seleção de atributos para a classificação por região são apresentados a seguir.

4.1.1 Experimento 1

Os processos de extração, seleção e classificação descritos neste experimento, servem

de modelo para os outros experimentos. Com intuito de reorganizar os atributos por

classes de medidas, a interface de extração de atributos existente no sistema foi

modificada a fim de englobar todos os atributos por categorias (espectral, textura e de

forma).

A Figura 4.1 apresenta a interface de extração dos grupos de atributos. Cada grupo de

atributo possui características intrinsícas descritas na seção 3.1. Os atributos podem ser

extraídos de vários canais existentes na imagem. O sistema também oferece a

possibilidade de se extrair atributos de diferentes sensores.

80

FIGURA 4.1 – Interface de extração de atributos.

Com um conjunto global de 38 atributos extraídos (Tabela 3.1), selecionaram-se os

subconjuntos que melhor discriminaram as três classes definidas para este experimento.

A Figura 4.2 apresenta a interface de extração dos atributos de forma (área, perímetro,

complexidade e circularidade), implementados no sistema.

FIGURA 4.2 – Interface de extração dos atributos de forma.

A capacidade dos atributos de forma em separar as classes, no experimento, é

apresentada na análise visual na Figura 4.3, a qual apresenta a distribuição dos atributos

de forma: área (Figura 4.3a), perímetro (Figura 4.3b), complexidade (Figura 4.3c) e

circularidade (Figura 4.3d), extraídos das regiões de treinamento. As classes (Groups)

de interesse foram definidas como: 1-Retângulo, 2-Círculo e 3-Triângulo.

81

(a)

(b)

(c)

(d)

FIGURA 4.3 - Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade.

Pode-se observar a boa separabilidade dos atributos de complexidade e circularidade

entre as classes. Então, esses atributos devem ser selecionados e utilizados no processo

de classificação.

A interface de classificação existente no sistema foi modificada a fim de englobar os

métodos de seleção de atributos e a classificação pela distância euclidiana (Figura 4.4).

Convém notar que, a Figura 4.4 apresenta os atributos extraídos e as classes de interesse

(Available Groups), informando ao usuário quais os atributos usados, tanto na etapa de

seleção de atributos quanto no processo de classificação.

82

FIGURA 4.4 – Interface de classificação.

Através da estrutura criada para o armazenamento das informações das classes e dos

atributos extraídos, pode-se escolher manualmente o subconjunto de atributos que serão

utilizados na classificação ou aplicar os métodos de seleção para selecionar o melhor

subconjunto, utilizando a distância JM como função critério (JM Distance Feature

Selection).

A escolha dos melhores atributos é importante na obtenção de uma boa classificação. As

Figuras 4.5(a) e 4.5(b) apresentam os resultados das classificações do classificador de

Mahalanobis e do classificador pela distância Euclidiana, respectivamente, utilizando o

conjunto de 38 atributos.

83

(a) (b)

FIGURA 4.5 – Resultado da classificação utilizando todos os 38 atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana.

Observa-se que a utilização de um número alto de atributos não implica em uma boa

classificação, ao contrário, pode existir uma alta correlação entre os atributos, fazendo

com que o custo de processamento aumente, gerando problemas matemáticos (inversão

de matrizes), sendo necessário escolher os atributos mais representativos, ou seja, que

melhor discriminam as classes de interesse.

A Figura 4.6 apresenta a interface de seleção de atributos com os três métodos

propostos. Ao aplicar os métodos de seleção de atributos, o sistema seleciona um

subconjunto de atributos (à direita) do conjunto global de atributos (à esquerda). A

quantidade dos atributos que podem ser selecionados pelos métodos de seleção é

definida pelo usuário.

FIGURA 4.6 – Interface de seleção de atributos.

84

Aplicando-se os métodos de seleção propostos neste trabalho, obteve-se o valor da

distância média JM e a acurácia total da classificação para cada subconjunto de

atributos selecionados (Tabela 4.1). Para se alcançar uma avaliação mais eficaz na etapa

de classificação, utilizou-se um conjunto de amostras diferente do conjunto utilizado no

treinamento. A utilização desse conjunto de amostras evita que a classificação seja

tendenciosa.

TABELA 4.1– Atributos selecionados através dos métodos de seleção propostos.

Métodos Média JM

Acurácia Total (%)

Dist. Euclidiana

Acurácia Total (%)

Dist. Mahalanobis

SFS 1,3478 100 100SBS 1,0302 76,67 73,33FIXO 1,3478 100 100

SFS 1,4033 100 100SBS 1,0332 70 86,67FIXO 1,4033 100 100

Quant. De Atributos Atributos Selecionados

1

2 desvio absoluto da média (dist) e Correlação (cooc)Circularidade (shap) e Complexidade (shap)

Circularidade (shap)Correlação (cooc)

Circularidade (shap)

Circularidade (shap) e Complexidade (shap)

Observa-se que existem diferentes resultados de classificação para um mesmo

subconjunto de atributos, selecionado pelo método SBS. Isso ocorre, pois os métodos de

seleção que utilizam distâncias estatísticas garantem uma boa separabilidade entre as

classes, mas uma boa classificação não depende apenas dos métodos de seleção, mas

também do classificador utilizado.

Nesse experimento, com apenas o subconjunto de 1 atributo selecionado, pelos métodos

SFS e FIXO, obteve-se 100% de acerto na classificação das amostras de teste utilizando

os dois classificadores. Isso foi possível, pois o atributo de circularidade selecionado

possue uma alta separabilidades entre as classes no espaço de atributos. Para o método

SBS, a seleção de apenas um atributo não foi suficiente para classificar corretamente

todas as amostras de teste.

Na escolha de um subconjunto de 2 atributos, o resultado obtido pelo método SBS

apresenta valores menores na avaliação da classificação (acurácia total) e para a

distância média JM em relação aos métodos SFS e FIXO. Esse resultado era esperado,

pois os atributos mais significativos na discriminação das classes quando combinados

com uma quantidade alta de atributos correlacionados, pode não ser relevante na

85

separabilidade entre as classes, ou seja, ao aplicar o método SBS na escolha de um

subconjunto com poucos atributos em relação ao conjunto global, ocorre que, o

processo de busca do método eliminou os atributos relevantes na separabilidade entre as

classes.

A Figura 4.7 apresenta as distribuições dos subconjuntos de dois atributos selecionados

pelos métodos de seleção de atributos. Pode-se observar como a dispensão dos valores

dos atributos de circularidade e complexidade (Figura 4.7a) são bastante representativos

na separabilidade entre as classes do que os atributos de correlação e o desvio absoluto

da média (Figura 4.7b).

(a)

(b)

FIGURA 4.7– Distribuição em duas dimensões dos subconjuntos de dois atributos selecionados pelos métodos propostos: a) pelos métodos SFS e FIXO, b) pelo método SBS

86

4.1.2 Experimento 2

Neste experimento utilizou-se a mesma imagem empregada no experimento 1. A

modificação está no rotacionamento de algumas regiões de treinamento e de teste.

Analisou-se a distribuição dos valores dos atributos de forma, no espaço de atributo,

tendo com base os resultados dos valores obtidos no experimento 1.

A Figura 4.8 apresenta a distribuição dos atributos da forma das regiões rotacionadas:

área (Figura 4.8a), perímetro (Figura 4.8b), complexidade (Figura 4.8c) e circularidade

(Figura 4.8d), extraídos das regiões de treinamento. As classes (Groups) de interesse

foram definidas como: 1-Retângulo, 2-Círculo e 3-Triângulo.

(a)

(b)

(c)

(d)

FIGURA 4.8– Distribuição dos atributos de forma -Experimento 1. Groups: 1-Retângulo, 2-Círculo e 3-Triângulo. a) atributo de área, b) atributo de perímetro, c) atributo de complexidade e d) atributos de circularidade.

87

Verificou-se que houve modificação nos valores dos atributos de área e perímetro. Essa

modificação era esperada, pois a extração desses atributos em dados matriciais,

dependendo dos métodos e modelos utilizados nos seus cálculos, não é invariante a

rotação. Essa característica é apresentada na seção 2.3.5.

Para os atributos de complexidade e circularidade, a representação das regiões das

classes manteve-se aproximadamente com o mesmo grau de separabilidade em relação

ao experimento 1. Isso ocorre, pois existe uma relação entre os valores de área e

perímetro extraídos nos dois experimentos. Ou seja, se a área aumentou numa proporção

de 10 pixels, com a rotação de uma determinada região, o valor do perímetro aumentou

aproximadamente na mesma proporção. Os valores dos atributos de área e perímetro são

intrínsecos aos cálculos dos atributos de complexidade e circularidade. Desse modo, não

há modificações significativas nos valores dos atributos de complexidade e

circularidade na representação das classes com as variações nos valores dos atributos de

área e perímetro.

Com objetivo de analisar a classificação sem utilizar os métodos de seleção de atributos,

classificou-se as amostras de teste com o conjunto global de atributo, verificando o

desempenho dos dois classificadores propostos. As Figuras 4.9 (a) e 4.9 (b) apresentam

os resultados das classificações do classificador de Mahalanobis e do classificador pela

distância Euclidiana, respectivamente, para este teste.

(a) (b)

FIGURA 4.9 – Resultado da classificação com o conjunto global de atributos. a) usando a distância de Mahalanobis e b) usando a distância Euclidiana.

88

Os métodos de seleção de atributos tornam-se indispensáveis na obtenção de uma boa

classificação, selecionando os atributos mais significativos na separabilidade das

classes. Isso pode ser mais notável quando se utiliza o conjunto global de atributos na

classificação.

A metodologia aplicada na seleção dos subconjuntos de atributos para esse experimento

segue os mesmos procedimentos do experimento 1: após a extração dos atributos, o

sistema deve selecionar o atributo que melhor discrimina as classes de interesse, através

dos métodos propostos. Os dois classificadores utilizados no experimento 1 também

foram aplicados. A Tabela 4.2 apresenta os valores da distância média JM e a acurácia

da classificação para cada subconjunto de atributos selecionado.

TABELA 4.2 Resultado dos métodos de seleção de atributos e classificação das amostras de teste no Experimento 2.

Métodos Média JM

Acurácia Total (%)

Dist. Euclidiana

Acurácia Total (%)

Dist. Mahalanobis

SFS 1,3308 100 100SBS 0,7439 53,33 36,67FIXO 1,3308 100 100

SFS 1,4005 100 100SBS 0.9879 63,33 63,33FIXO 1,4005 100 100

Quant. De Atributos Atributos Selecionados

1

2 variância da log-normal (dist) e dissimilaridade (cooc)Circularidade (shap) e Complexidade (shap)

Circularidade (shap)variância da log-normal (dist)

Circularidade (shap)

Circularidade (shap) e Complexidade (shap)

* As siglas referem-se aos atributos descritos na Tabela 3.1.

Com apenas o subconjunto de um atributo obteve-se 100% de acerto na classificação

das regiões utilizando os dois classificadores. Ou seja, não é necessário selecionar

outros subconjuntos de atributos, pois com apenas um atributo o sistema alcançou o

maior valor da acurácia total da classificação. Efetuou-se a seleção de outro subconjunto

com o intuito de validar os métodos de seleção. A dimensionalidade é diretamente

proporcional à complexidade computacional, ou seja, quanto menor a dimensionalidade

dos dados, menor a complexidade computacional.

Para o classificador pela distância euclidiana, houve um decréscimo no valor da

acurácia total da classificação, utilizando as regiões rotacionadas. Isso ocorre, pois com

89

a modificação nos valores dos atributos, é possível que o valor de apenas um atributo de

uma região pertencente a uma determinada classe esteja mais próximo do valor da

média do mesmo atributo de outra classe, classificando a região erroneamente. Na

verdade, a aplicação desse classificador neste trabalho é apenas para ilustrar que uma

boa classificaçao não depende apenas dos métodos de seleção de atributos, mas também

da classificador utilizado.

4.1.3 Experimento 3

Neste experimento são utilizados, além dos atributos de forma, os atributos de textura

descritos na seção 2.2. As texturas são representadas através do álbum de texturas de

Brodatz (1956). A Tabela 4.3 apresenta os resultados da classificação através da

distância de Mahalanobis e o valor da distância média JM para cada subconjunto de

atributos selecionado.

TABELA 4.3– Resultado dos métodos seleção de atributos e classificação das amostras de teste no Experimento 3.

Métodos Média JM Acurácia Total (%)SFS 1,1259 93,33SBS 0,9752 50FIXO 1,1259 93,33

SFS 0,5775 96,66SBS 0,6217 66,66FIXO 0,6217 66,66

SFS 0,6609 93,33SBS 0,6863 80FIXO 0,6863 80

SFS 0,6959 96,66SBS 0,6975 86,66FIXO 0,6975 86,66

SFS 0,7017 96,66SBS 0,7003 90FIXO 0,7017 96,66

SFS 0,7042 96,66SBS 0,7037 96,66FIXO 0,7042 96,66

SFS 0,7057 96,66SBS 0,7055 96,66FIXO 0,7057 96,66

SFS 0,7064 100SBS 0,7062 96,66FIXO

F26, F15, F10, F9, F13 e F376 F2, F6, F9, F10, F15 e F17

Atributos Selecionados*

F10 e F15F10 e F15

Quant. De AtributosF26F15F26

F26 e F15

F6, F9, F10 e F15F6, F9, F10 e F15

F9, F10, F13, F15 e F26

F9, F10 e F15F9, F10 e F15

F26, F15, F10 e F9

F26, F15, F10, F9 e F13

1

3

4

2

5 F2, F6, F9, F10 e F15

F26, F15 e F10

F9, F10, F13, F15, F26 e F37

7

F26, F15, F10, F9, F13, F37, F6 e F12

F26, F15, F10, F9, F13, F37 e F6F2, F6, F9, F10, F15, F17 e F19F4, F6, F9, F10, F12, F15 e F37

F2, F5, F6, F9, F10, F15, F17 e F198


90

Observa-se que na maioria dos subconjuntos de atributos selecionados pelos três

métodos propostos, houve uma concordância entre a distância média JM com os valores

obtidos na acurácia total da classificação. Ou seja, o subconjunto selecionado que

obteve a maior média JM, alcançou a melhor acurácia na etapa de classificação. Nem

sempre isso é verdade, pois um bom resultado na avaliação da classificação não

depende apenas da aplicação dos métodos de seleção de atributos, mas também do

classificador utilizado.

O valor da acurácia total aumentou com o acréscimo de atributos nos subconjuntos de

atributos selecionados. Esse aumento é possível, pois a cada atributo adicionado ao

subconjunto utilizados na classificação, a separabilidade entre as classes no espaço de

atributos torna-se mais bem definida. Em alguns casos, com apenas um atributo

selecionado pode-se alcançar o melhor resultado na classificação. Ou seja, nem sempre

o acréscimo de atributo representa uma melhora desempenho do classificador. Isso

depende da distribuição dos dados. Os métodos de seleção de atributos foram

executados até um subconjunto de 8 atributos, pois o resultado encontrado na acurácia

total da classificação alcançou 100%, utilizando o método SFS.

Executou-se o método de busca exaustiva de escolha fixa (FIXO) até um subconjunto

de 5 atributos. Para os subconjuntos maiores, utilizando-se o método FIXO, usou-se o

método sequencial SFS na seleção de um subconjunto de 14 atributos e posteriormente

aplicou-se o método FIXO na seleção dos subconjuntos de atributos do subconjunto já

selecionado pelo método sequencial. Essa característica mostra a flexibilidade no uso

dos métodos de seleção de atributos no sistema. Isso é de fundamental importância na

utilização do método FIXO, pois a complexidade dos métodos de busca exaustiva

cresce exponencialmente, impossibilitando o seu uso para um número alto de

combinações. A Figura 4.10 apresenta o gráfico dos valores da acurácia total para cada

subconjunto de atributos selecionados neste experimento.

91

FIGURA 4.10 – Acurácia total da classificação para cada subconjunto de atributos

selecionado.

4.2 Imagens de Sensoriamento Remoto

Para este teste foram utilizadas imagens da superfície terrestre. Da mesma forma que no

teste com o álbum Brodatz, utilizou-se o classificador de Mahalanobis. A fim de testar

os métodos de extração e seleção para classificação de regiões, utilizou-se os 38

atributos de texturas e de forma existentes na Tabela 3.1.

A partir das regiões de treinamento, fez-se a seleção de atributos pelos 3 métodos

propostos, formando subconjuntos de até 12 atributos. Não foi possível selecionoar

subconjuntos maiores, pois ocorreram problemas matemáticos de inversão de matrizes,

decorrente da alta correlação entre os atributos extraídos. Para testar os métodos

propostos, realizaram-se dois experimentos: a) classificação de regiões digitalizadas

sobre a imagem Landsat/TM (experimento 1); b) classificação de regiões de uma

imagem segmentada a partir da mesma imagem Landsat/TM (experimento 2).

92

4.2.1 Experimento 1

No primeiro experimento, cada subconjunto de atributos selecionado pelos três métodos

(SFS, SBS e EF) foi avaliado pela classificação das regiões de teste, através da acurácia

total.

Esperava-se que o método FIXO obtivesse a melhor acurácia na classificação para todos

os subconjuntos de atributos selecionados em relação aos outros métodos de seleção,

pois esse método extrai um subconjunto ótimo do conjunto global de atributos, ou seja,

o método executa todas as combinações e seleciona o subconjunto que possui a maior

distância média JM. Mas isso não ocorreu porque os métodos de seleção que utilizam

distâncias estatísticas garantem uma boa separabilidade entre as classes, porém uma boa

classificação depende também do classificador utilizado.

A Tabela 4.4 apresenta os valores da distância média JM e a acurácia total para cada

subconjunto de atributos selecionados pelos três métodos de seleção propostos neste

trabalho.

TABELA 4.4 – Resultado dos métodos de seleção de atributos e classificação das amostra de teste em imagens de SR.

Métodos Média JM Acurácia Total (%)SFS 1,4142 98,33SBS 1,3468 96,66FIXO 1,4142 98,33

SFS 1,4129 98,33SBS 1,4122 100FIXO 1,4141 100

SFS 1,4139 98,33SBS 1,4135 100FIXO 1,4142 95

SFS 1,4142 93,33SBS 1,4139 98,33FIXO 1,4142 95

1

3

4

2

F8, F15 e F20F8, F10 e F11F1, F10 e F11

F8, F15, F20 e F23F8, F9, F10 e F11

F1, F10, F11 e F20

Atributos Selecionados

F8 e F11F1 e F11


F8 e F15


Para a classificação das regiões de teste, obteve-se um excelente resultado, alcançando

100% no valor da acurácia total, utilizando-se apenas 2 atributos selecionados pelos

métodos SBS e FIXO. A obtenção desse resultado foi possível, pois as classes em

93

estudo são bem separáveis, e com apenas a obtenção de estatística de primeira ordem,

como a média ou a mediana pode-se obter um bom desempenho na classificação.

Observa-se ainda que o acréscimo de atributo pode significar um melhor desempenho

do classificador, mas a partir do subconjunto de 3 atributos houve um decrécimo no

valor da acurácia da classificação, decorrente da seleção de atributos correlacionados.

4.2.2 Experimento 2

No segundo experimento, utilizaram-se as mesmas amostras de treinamento do

experimento 1. O classificador pode também ser treinado através das regiões extraídas

da imagem segmentada. Geralmente as regiões da imagem segmentada são utilizadas

quando se quer discriminar os objetos através da forma. No experimento proposto, as

classes são definidas através da características espectrais. Por isso, utilizou-se as regiões

digitalizadas na imagem.

A Tabela 4.45 apresenta os valores da distância média JM e a acurácia total para cada

subconjunto de atributos selecionados pelos três métodos de seleção propostos neste

trabalho. Para o cálculo da acurácia total utilizaram-se 684 pixels da classe floresta, 123

pixels da classe água e 100 pixels da classe desmatamento. Os pixels de cada classe

foram escolhidos aleatoriamente em uma quantidade proporcional a cada classe.

TABELA 4.5 – Resultado dos métodos de seleção de atributos e classificação da imagem segmentada.

Métodos Média JM Acurácia Total (%)SFS 1,4142 96,14SBS 1,3468 89,97FIXO 1,4142 96,14

SFS 1,4129 96,36SBS 1,4122 95,81FIXO 1,4141 93,94

SFS 1,4139 96,03SBS 1,4135 95,81FIXO 1,4142 93,71

SFS 1,4142 95,14SBS 1,4139 95,81FIXO 1,4142 94,93

1

3

4

2

F8, F15 e F20F8, F10 e F11F1, F10 e F11

F8, F15, F20 e F23F8, F9, F10 e F11

F1, F10, F11 e F20

Atributos Selecionados

F8 e F11F1 e F11


F8 e F15


94

Na etapa de classificação usou-se as regiões extraídas pelo processo de segmentação

(Figura 4.11a). O resultado da classificação da imagem segmentada utilizando o

classificador da distância de Mahalanobis com o subconjunto dos 2 atributos,

selecionado pelo método SFS (F8-mediana e F15-energia) é apresentado na Figura

4.11c. Para efeito de visualização do problema de classificar uma imagem utilizando

informações redundantes (atributos correlacionados), apresenta-se uma imagem

classificada, pela distância de Mahalanobis, utilizando os 38 atributos (Figura 4.11d).

Observa-se que, na Figura 4.11d, há muita confusão, ou seja, o número de regiões

classificadas corretamente é menor que na Figura 4.11c. Pode-se observar ainda que

com um número menor de atributos obteve-se um melhor resultado na classificação.

Estes resultados em imagens de sensoriamento remoto mostram que os métodos de

seleção propostos ao problema em estudo reduzem a dimensionalidade do espaço de

atributos, aumentando o poder discriminatório. Desta forma, os métodos podem ser

considerados um processo de redução de dimensionalidade. Esta redução elimina os

atributos que tem a menor relevância na separabilidade das classes. A dificuldade em se

classificar regiões decorrentes do processo de segmentação está na aceitação de que a

segmentação representa fielmente os objetos na imagem.

95

FIGURA 4.11 – Imagem de SR. (a) Imagem segmentada; (b) imagem de referência; (c) Imagem classificada utilizando um subconjunto de 2 atributos e (d) Imagem classificada com o conjunto global de atributos.

97

CAPÍTULO 5

CONCLUSÕES E RECOMENDAÇÕES

Os objetivos propostos neste trabalho foram alcançados, pois os algoritmos de extração

de atributos de forma e seleção de atributos implementados obtiveram resultados

bastante satisfatórios. Os métodos de extração e seleção de atributos aplicados à

classificação por regiões apresentaram resultados eficazes para o que se propunham.

Através do aprendizado adquirido ao longo desse trabalho e dos resultados obtidos nos

experimentos, elaborou-se uma descrição das conclusões e recomendações, com o

intuito de aprimorar o sistema desenvolvido.

5.1 Conclusões

Esse trabalho apresentou métodos de extração e seleção de atributos na classificação por

regiões. Através desses métodos, foi possível extrair atributos de textura e de forma dos

objetos (regiões) nas imagens sintéticas, selecionando os atributos mais relevantes na

separabilidade das classes. No processo de classificação, uma quantidade alta de

atributos pode não aumentar a precisão do classificador. Isso ocorre devido à

redundância das informações.

Os atributos de forma, agregados ao sistema, obtiveram resultados eficientes no

processo de classificação por regiões, nas imagens sintéticas utilizadas nos

experimentos, os quais comprovaram a viabilidade da utilização desses atributos em

análise de imagens. Observou-se que houve valores diferentes dos atributos de forma no

processo de rotação das regiões na imagem. Percebeu-se que esta variação de valores

não foi significativa, pois a variação dos valores do atributo de área era

aproximadamente proporcional à modificação no valor do atributo perímetro. Como os

atributos de circularidade e complexidade dependem dos atributos de área e perímetro,

os seus valores não tiveram variações significativas na imagem, entre os valores

encontrados nas regiões originais e nas imagens com as regiões rotacionadas.

98

O teste realizado com as texturas extraídas do álbum de Brodatz, revelou a

potencialidade do sistema em extrair uma quantidade alta de atributos (textura e forma).

Essa característica gera uma alta dimensionalidade, que influencia diretamente no

resultado da classificação. Assim, ao aplicar os métodos de seleção de atributos ao

conjunto global extraído pelo sistema, selecionou-se um subconjunto que aumentou o

desempenho do classificador.

Os resultados encontrados mostraram a viabilidade em se utilizar os métodos de seleção

de atributos, quando o objetivo é a redução da dimensionalidade sem que haja perda no

poder discriminatório entre as classes. Como não existe nenhuma relação determinística

entre métodos de seleção de atributos padrão e erro de classificação, conclui-se que

todas as estratégias de busca devem ser usadas para diminuir o número de avaliações na

escolha da decisão final baseada no erro da classificação.

Quanto à aplicação dos métodos de seleção de atributos, o critério de parada executado

pela avaliação da classificação ou pelo número de atributos que se deseja selecionar, foi

suficiente na verificação do desempenho do classificador nos testes da imagem sintética

e de sensoriamento remoto.

Foi verificada que com apenas um subconjunto de dois atributos selecionado obteve-se

o melhor valor na classificação da imagem de sensoriamento remoto. Isso depende, não

só do tipo de sensor utilizado, mas também da aquisição das amostras de treinamento. É

necessário que as amostras de treinamento representem fielmente cada classe, com isso

os limites de decisão no espaço de atributos apresentarão uma boa separabilidade entre

as classes.

Na implementação do método FIXO, na seleção de atributos, esperava-se que os

subconjuntos selecionados por esse método apresentassem uma melhor acurácia na

classificação, pois esse método extrai um subconjunto ótimo do conjunto global de

atributos, mas isso não ocorreu, porque os métodos de seleção que utilizam distâncias

estatísticas garantem uma boa separabilidade entre as classes, mas uma boa

classificação depende também do classificador utilizado.

99

As interfaces gráficas implementadas no sistema Texture, que acompanha as etapas do

sistema de processamento de imagens, são interfaces intuitivas e fáceis de usar. No

entanto, é de fundamental importância compreender as etapas do sistema de

processamento de imagens para se obter uma melhor compreensão da seqüência das

interfaces.

Uma das contribuições deste trabalho foi a pesquisa da influência do processo de

seleção de atributo nos sistemas de processamento de imagens, fundamental na

obtenção de uma boa classificação. Pode-se, então, concluir que os métodos de seleção

apresentaram os subconjuntos que melhor discriminam as classes de interesse, mas não

garante que com esses subconjuntos o sistema obterá uma melhor classificação. Isso

porque uma classificação que apresente uma boa acurácia, não depende apenas dos

métodos de seleção, mas também do classificador utilizado.

5.2 Recomendações

A principal contribuição deste trabalho é o aperfeiçoamento do processo de extração de

atributos proposta por Rennó et al. (1998) e aplicação de métodos de seleção de

atributos na classificação por regiões. Para continuar o trabalho nesta área, que se utiliza

processo de extração e seleção de atributos, existem outras pesquisas que poderiam dar

continuidade e auxiliar futuros estudos.

Ampliar o conjunto de extratores da forma das regiões. Da mesma forma que

se implementaram os atributos nesse trabalho, incorporar ao sistema outras

técnicas que mapeiem a distribuição da forma no espaço de atributos. Agregar

ao sistema de classificação por região um processo de segmentação de

imagens. Através da implementação desses métodos, o sistema abrangeria

todas as etapas do processamento de imagens digitais.

Implementar outros métodos de seleção de atributos, com o objetivo de

selecionar os subconjuntos mais relevantes na separabilidade das classes,

aplicando métodos estocásticos (determinados pelas leis da probabilidade;

aleatórios) ou métodos determinísticos que evitem o efeito de nesting.

100

Desenvolver métricas de avaliação e comparação com outros algoritmos de

seleção de atributos e aplicar em outras áreas de estudos com dados oriundos

de vários sensores.

Agregar ao sistema medidas de avaliação da classificação através de análise

estatística.

Considerando a possibilidade do desenvolvimento de um sistema de processamento de

imagens de acesso livre, algumas questões precisam ser resolvidas para uma maior

eficiência. Em primeiro lugar, deve ser elaborado um estudo para a modificação das

funções do ENVI para funções específicas do IDL. Isso porque o IDL possui um

utilitário (IDL Virtual Machine) multi-plataforma de distribuição gratuita para rodar

dados compilados em código IDL. O IDL Virtual Machine proporciona aos usuários

IDL distribuir suas aplicações, permitindo aos desenvolvedores de softwares

distribuírem facilmente seus softwares compilados em código IDL, ou aplicações sem a

necessidade de licença adicional.

Espera-se que este trabalho possa ter contribuído para mostrar a importância da

utilização da extração dos atributos de forma e a necessidade da aplicação dos métodos

de seleção de atributos em sistemas de processamento de imagens. Os códigos

desenvolvidos estão disponíveis na biblioteca digital URLib: www.dpi.inpe.br/texture/

(Oliveira e Rennó, 2005).

101

REFERÊNCIAS BIBLIOGRÁFICAS

Arivazhagan, S.; Ganesan, L. Texture classification using wavelet transform. Pattern Recognition Letters, v.24, n.12, p.1513-1521, 2003.

Azizi, N.; Zolfaghari, S. Adaptive temperature control for simulated annealing: a comparative study. Computers & Operations Research, v.31, n.14, p.2439-245. Dec. 2004.

Ballard, A.; Brown, C.M. Computer Vision. Englewood Cliffs: Prentice-Hall, 1983. 523p.

Beasley, D.; Bull, D. R.; Martin, R. R. An overview of genetic algorithms: part 1, fundamentals. University computing, v. 15, n.2, p.58-69, 1993.

Bhattacharyya, A. On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the Calcutta Mathematics Society, v.35, p.99–110, 1943.

Boz, O. Feature subset selection by using sorted feature relevance. In: International Conference on Machine Learning and Applications, 2002, Las Vegas, USA. Proceedings… [S.l.]: [S.n.], 2002.

Campos, T. E. Técnicas de seleção de características com cplicações em reconhecimento de Faces. 2001. 160p. Dissertação (Mestrado em Ciência da Computação) – Universidade de São Paulo, São Paulo, 2001.

Chang, T.; Kuo, J. C. Texture analysis and classification with tree-structured wavelet transform. IEEE Transactions on Image Processing, v.2, n.4, p.429-441, Oct. 1993.

Chen, S.; Zhu, Y.; Zhang, D.; Yang, J Y. Feature extraction approaches based on matrix pattern: MatPCA and MatFLDA. Pattern Recognition Letters, v.26, n.8 p.1157-1167, June 2005.

Curlander, J.; Kober, W. Rule based system for thematic classification in SAR imagery. IEEE Transactions on Geoscience and Remote Sensing, New York, p. 854– 856, july 1992. Special issue on the 1992 International Geoscience and Remote Sensing Symposium (IGARSS’ 92).

Donnay, J. P. Use of remote sensing information in planning. In: Stillwell, J.; Geertman, S.; Openshaw, S. (eds). Geographical Information and Planning. Berlin: Springer-Verlag, 1999. p.242- 260.

Duda R.O.; Hart P.E.; Stork D.G. Pattern classification. New York: Wiley, 2001. v.2, 654p.

Dutra, L. V.; Huber, R. Feature Selection For Ers-1/2 Insar Classification: High Dimensionalty Case. In: International Geoscience and Remote Sensing Symposium, 1998, Seattle, USA. Proceeding... [S.l.]: [S.n.], 1998.

Dutra, L. V.; Huber, R. Feature extraction and selection for ERS 1/2 InSAR classification. International Journal Remote Sensing, v.20, n.5, p.993-1016, 1999.

102

Fonseca, L. M. G. Processamento digital de imagens de sensores semotos. São José dos Campos: INPE, 2004. Disponível na biblioteca digital URLib: < http://www.dpi.inpe.br/%7Eleila/ser437.html >. Acesso em: 15 maio 2004.

Gonzales, R. C.; Woods, R. E. Processamento de imagens digitais. [S.l.]: Edgard Blücher, 2000. 509p.

Gose, E.; Johnsonbaugh. R.; Jost, S. Pattern recognition and image analysis. New Jersey: A Simon & Schuster, 1996. 484 p.

Haindl, M. Texture Synthesis. CWI Quarterly, v.4, n.4, p.305-331, 1991.

Haralick, R. M.; Shunmugan, K.; Dinstein, I. Texture feature for image classification. IEEE Transactions Systems, Man and Cybernetics, v. 3, n. 6, p.6610-621, Nov. 1973.

Haralick, R. M. Statistical and structural approaches to texture. IEEE Transactions on Image Processing, v.67, p.786-804, May 1979.

Harper, P. R.; Senna, V.; Vieira, I. T.; Shahani, A. K. A genetic algorithm for the project assignment problem. Computers & Operations Research, v.2, n.5, p.1255-1265, May 2005. No prelo.

Huang M. D.; Romeo, F.; Sangiovanni-Vincentelli, A. An efficient general cooling schedule for simulated annealing. In: IEEE international conference on computer aided design, 1986, Santa Clara, USA. Proceedings... Santa Clara: [S.n], 1986. p. 381-384.

Hussain, Z. Digital image processing: practical applications of parallel processing techniques. New York: Ellis Horwood, 1991. 406p.

Jahne, B. Digital image processing. Berlin: Springer-Verlag, 1997. 555p.

Jain, A. K.; Zongker, D. Feature-selection: evaluation, application, and small sample performance. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.19, n.2, p.152-157, Feb. 1997.

Jain, A. K.; Robert, P. W.; Moa, D.; Moa, J. Statistical pattern recognition: a review. IEEE Transactions On Pattern Analysis And Machine Intelligence, v.22, n.1, Jan. 2000.

Jensen, J. R.; Cowen, D. C. Remote sensing of urban/suburban infrastructure and socio-economic attributes. Photogrammetric Engineering and Remote Sensing, v.65, n.5, p.611-622, 1999.

Kohn, A. F. Reconhecimento de padrões, uma abordagem estatística. São Paulo: PEE/EPUSP, 1998. 205p.

Lambert, P.; Macairne, L. Filtering and segmentation: the specifity of color images. In: International Conference on Color In Graphics Image Processing, 2000, Saint Etienne, France. Proceedings... [S.l.]: [S.n.], 2000.

Lacerda, E. G. M.; Carvalho, A. C. P. L. Introdução aos algoritmos genéticos. In: Galvão, C. O.; Valença, M. J. S. Sistemas inteligentes: aplicações a recursos hídricos e ciências ambientais. Porto Alegre: Universidade/UFRGS; Associação Brasileira de Recursos Hídricos, 1999. p. 99-150.

http://www.dpi.inpe.br/%7Eleila/ser437.html

103

Luiz, S.; Oliveira, C. G.; Okida, R. Comparação entre diferentes métodos de correção geométrica em imagem RADARSAT-1 no Flona Tapajós. In: Simpósio Brasileiro de Sensoriamento Remoto, 11., 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 325-332.

Mao, J.; Mohiuddin, K.; Jain, A. K. Parsimonious network design and feature selection through node pruning. In: International Conference on Pattern Recognition, 12., 1994, Jesusalem. Proceedings... 1994. p. 622-624. [S.l]: IAPR, 1994.

Marques Filho, O.; Vieira Neto, H. Processamento digital de imagens. Rio de Janeiro: Brasport, 1999. 406 p.

Meyer, T. P.; Packard, N. H. Local forecasting of high-dimensional chaotic dynamics. In: Workshop on Nonlinear Modeling and Forecasting, 1992, New York. Proceedings… New York: [S.n], 1992.

Nijenhuis, A.; Wilf, H. S. Combinatorial algorithms for computers and calculators. 2. ed. [S. l.]: Academic Press, 1978. 320p.

Oliveira, J. A.; Rennó, C. D. Texture 1.0: a region classifier using textural measures. São José dos Campos: INPE.DPI, 2005. Disponível na biblioteca digital URLib: <www.dpi.inpe.br/~camilo/texture>. Acesso em: 03 maio 2005.

Pardi Lacruz, M. S.; Shimabukuro, Y. E.; Williams, M.; Rennó, C. D.; Herbert, D. A; Rastetter, E. B. Utilização do sensoriamento remoto e dados de campo para amodelagem das atividades biogeoquimicas na Floresta Nacional de Tapajós. In: Simpósio Brasileiro de Sensoriamento Remoto, 10., 2001, Foz do Iguaçu. Anais... São José dos Campos: Instituto Nacional de Pesquisa Espacial, 2001. 1 CD-ROM.

Pratt, W. K. Digital image processing. [S. L.]: Wiley Interscience, 1991. 698p.

Reeves, C. R. Modern heuristic techniques for combinatorial problems. New York: Blackwell, John Wiley & Sons, 1993. 320p.

Rennó, C. D.; Freitas, C. C.; Frery, A. C. A system for region image classification based on textural measures. In: Latino-American Seminar on Radar Remote Sensing: Image Procesing Techniques, 2., 1998, Santos. Anais.... Santos: ESA, 1998.

Rennó, C. D. Avaliacao de medidas texturais na discriminacao de classes de uso utilizando imagens SIR-C/X-SAR do perímetro irrigado de Bebedouro, Petrolina, PE. 1995. 111 p. (INPE-10441-TDI/926). Dissertação (Mestrado em Sensoriamento Remoto) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 1995. Disponível na biblioteca digital URLib: <http://iris.sid.inpe.br:1912/rep-/sid.inpe.br/jeferson/2004/03.05.11.22>. Acesso em: 06 jan. 2005.

Richards, J. A. Remote sensing digital image analysis: an introduction. New York: Springer-Verlag, 1993. v. 2, 340p.

Serpico, S.; Roli, F. Classification of multisensor remote sensing images by structured neural networks. IEEE Transactions on Geoscience and Remote Sensing, v.33, n.3, p.562– 577, 1995.

http://iris.sid.inpe.br:1912/rep-/sid.inpe.br/jeferson/2004/03.05.11.22

104

Soares, J. V.; Rennó, C. D.; Formaggio, A. R.; Yanasse, C. C. F.; Frery, A. C. An investigation of the selection of texture features for crop discrimination using SAR imagery. Remote Sensing Environment, v.59, n.2, p.234-247, 1997.

Soltanian-Zadeha, H; Rafiee-Rad, F.; Pourabdollah-Nejad, D. S. Comparison of multiwavelet, wavelet, Haralick, and shape features for microcalcification classification in mammograms. Pattern Recognition: The Journal of the Pattern Recognition Society, v.37, n.10, p.1973-1986, 2004.

Sousa Junior, M. A.; Dutra, L. V.; Freitas, C. C. Desenvolvimento de um Segmentador Incremental Multi-nível (SIM) para imagens ópticas e de radar. In: Simpósio Brasileiro de Sensoriamento Remoto, 11., 05 a 10 abr. 2003, Belo Horizonte. Anais... São José dos Campos: Instituto Nacional de Pesquisas Espaciais, 2003. p.2293-2300.

Tari, Z. S. G.; Shah, J.; Pien, H. Extraction of shape skeletons from grayscale images.

Proceedings of the Computer Vision and Image Understanding, v.66, p.133-146, 1997.

Theodoridis, S.; Koutroumbas, K. Pattern recognition. New York: Academic Press, 1999. v.1.

Thompson, J.; Dowsland, K. A. General cooling schedules for a simulated annealing based timetabling system. In: International Conference on the Practice and Theory of Automated Timetabling, 1., 1995, Edinburgh. Proceedings... Edinburgh: Napier University, 1995.

Townshend, J. R. G. The spatial resolving power of earth resource satellites. Progress in Physical Geography, v.5, p. 32-55, 1981.

Tsutsui, S.; Fujimoto, Y. Forking genetic algorithm with blocking and shrinking modes (fGA). In: Internacional Conference on Genetic Algorithms, 5., 1993. Proceedings… [S.l.]: University of Illinois, 1993. p.206-213.

Unser, M. Sum and difference histograms for texture classification. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.8, n.1, p.118-125, Jan. 1986.

Welch, R. M.; Kuo, K. S; Sengupta, S. K. Cloud and surface textural features in polar regions. IEEE Transaction on Geoscience and Remote Sensing, v.28, n.4, p.520-528, July 1990.

Yanasse, C. C. F.; Frery, A. C.; Sant’Anna, S. J. S.; Hernandes, P. F.; Dutra, L. V. Statistical analysis of SAREX data over Tapajós - Brazil. In: South American Radar Experiment (SAREX), 6-8 Dec. 1993, Paris. Proceedings… Paris: ESA, 1993. p.25-40.

Zhang, P.; Verma, B.; Kumar, K. Neural vs. statistical classifier in conjunction with genetic algorithm based feature selection. Pattern Recognition Letters, v.26, n.7, p.909-919, May 2005.

classificaÇÃo de regiÕes usando atributos de...

Documents