localização de placas de veículos baseada em métodos estatísticos

PONTIFICIA UNIVERSIDADE CATOLICA DE MINAS GERAIS

Instituto de Informatica

LOCALIZACAO DE PLACAS DE VEICULOS BASEADA EM

METODOS ESTATISTICOS

Edgard Davidson Costa Cardoso

Belo Horizonte

2006




Trabalho de Diplomacao apresentado ao Curso

de Graduacao em Sistemas de Informacao

da Pontifıcia Universidade Catolica de Minas

Gerais, como requisito parcial para obtencao do

Grau de Bacharel em Sistemas de Informacao.

Orientador: Prof. Silvio J. F. Guimaraes, D.Sc..

Belo Horizonte

2006

ii




Trabalho de Diplomacao apresentado ao Curso de

Graduacao em Sistemas de Informacao da Pontifıcia

Universidade Catolica de Minas Gerais, como requisito

parcial para obtencao do Grau de Bacharel em Sistemas

de Informacao.

Aprovada em de 2006

BANCA EXAMINADORA:

Prof: Silvo Jamil F. Guimaraes, D.Sc.

Pontifıcia Universidade Catolica de Minas Gerais

Professor


Professor


Belo Horizonte

2006

iii

Resumo

No meio academico, varias pesquisas vem sendo apresentadas sobre o reconhe-

cimento de placas de veıculos, utilizando o processamento de imagens. A utilizacao de

tecnicas de OCR (Optical Character Recognition) e extremamente importante para a

identificacao de placas de veıculos, em um ambiente controlado ou nao. Entretanto,

o simples fato de utiliza-las, nao garante, suficientemente, a sua perfeita identificacao.

Nesse caso, procedimentos que auxıliem a localizacao e a identificacao da referida placa

devem prover, de forma satisfatoria, a condicao ideal para que o uso do OCR seja eficiente e

eficaz. De fato, o fator crıtico de sucesso para o reconhecimento automatico dos caracteres

contidos na placa e uma etapa anterior de localizacao. Nesse contexto, este trabalho tem

como objetivo desenvolver um metodo capaz de localizar a placa do veıculo e preparar os

caracteres de tal forma que um algoritmo de OCR possa reconhecer e identifica-las, com

a mınima intervencao humana. O metodo proposto utiliza tecnicas de processamento de

imagens aplicada na analise estatıstica dos perfis de linha da imagem.

iv

Lista de Tabelas

4.1 Tabela que demonstra as caracterısticas das imagens utilizadas no trabalho 24

4.2 Tabela que demonstra as caracterısticas de hardware e software utilizados . 25

4.3 Tabela que demonstra os tempos medios obtidos do algoritmo em cada etapa 25

4.4 Tabela que demonstra a taxa de acerto da etapa de localizacao da placa e

da etapa de preparacao dos caracteres, utilizando placas de varios paıses . 26

v

Lista de Figuras

2.1 a) flood-fill com 4 direcoes; b) flood-fill com 8 direcoes . . . . . . . . . . . . 7

2.2 Ilustracao que demonstra o comportamento do perfil de linha em tres linhas

distintas da imagem. a) Imagem Original; b) Perfil de Linha 1 (linha

superior); c) Perfil de Linha 2 (linha central); d) Pefil de linha 3 (linha

inferior) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.1 Visao macro da sequencia logica das etapas . . . . . . . . . . . . . . . . . . 12

3.2 Demonstracao do perfil de linha. a) Imagem original com duas analises

de “assinatura”ortogonais a placa. b) Perfil de linha superior, cortando os

farois. c) Perfil de linha inferior cortando a placa. . . . . . . . . . . . . . . 13

3.3 Identificacao dos pontos de maximos e mınimos, a partir da analise es-

tatıstica do perfil de linha . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.4 Linha encontrada com base na analise estatıstica do perfil de linha. . . . . 19

3.5 Regiao encontrada apos analisar a condensacao dos pontos de maximo . . . 20

3.6 Estruturas de dados utilizadas para localizacao da placa a) Estrutura de

dados para localizacao da linha candidata; b) Estrutura de dados usada

para localizar as coordenadas exatas da placa na linha candidata identifi-

cada pela estrutura da Figura a). . . . . . . . . . . . . . . . . . . . . . . . 20

3.7 Area dos caracteres localizada com a utilizacao do flood-fill adaptado. . . . 22

4.1 Resultado do algoritmo de localizacao da placa em diversos nıveis de lumi-

nosidade, angulo de distancia de tomada . . . . . . . . . . . . . . . . . . . 26

4.2 Resultado do algoritmo de preparacao dos caracteres em diversos nıveis de

luminosidade, angulo de distancia de tomada . . . . . . . . . . . . . . . . . 27

4.3 Exemplo de uma situacao em que o metodo proposto falha. 4.3(a) Imagem

da placa indicando um perfil de linha. 4.3(b) Exemplo de um perfil de linha

em que o metodo proposto nao e capaz de identificar a “assinatura”. . . . . 27

vi

Sumario

1 Introducao 1

2 Revisao Bibliografica 5

2.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Flood Fill . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3 Perfil de Linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.4 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3 Metodo Proposto 11

3.1 Localizacao da Placa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.2 Preparacao dos Caracteres . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.3 Reconhecimento dos Caracteres . . . . . . . . . . . . . . . . . . . . . . . . 22

4 Experimentos e Resultados 24

5 Conclusao 28

5.1 Sugestao de Estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Bibliografia 30

Capıtulo 1

Introduc ao

O uso de sistemas de informacao baseados em recuperacao de informacoes vem, a

cada dia, se consolidando como uma importante area de estudo, recebendo, consequen-

temente, uma consideravel atencao no meio academico, devido a sua capacidade de criar

mecanismos, que viabilizam o desenvolvimento de tecnicas e metodos, a fim de otimizar

ou automatizar processos de reconhecimento, extracao, indexacao e recuperacao de in-

formacoes de interesse em uma imagem digital.

Apesar de todo o desenvolvimento tecnologico ja alcancado na area da computacao,

a recuperacao de informacoes baseadas na analise de imagens mostra-se muito difıcil e

complexa.

No entanto, mesmo com otimizacoes ou automatizacoes sendo realizadas nos referi-

dos processos, seja no reconhecimento ou extracao de dados, seja na indexacao ou na recu-

peracao desses dados utilizando algoritmos de buscas, ainda existem varios desafios cau-

sados pelo rapido crescimento do volume de informacoes definidas como “interessantes”,

para um determinado grupo de pessoas ou organizacoes, em detrimento da falta de ca-

pacidade em como administra-las.

Contudo, cresce cada vez mais a necessidade de desenvolver sistemas de recu-

1

CAPITULO 1. INTRODUCAO 2

peracao de informacao automaticos, para serem aplicados as varias atividades cotidianas,

a fim de gerar procedimentos eficientes e eficazes, reduzindo, ou ate mesmo eliminando,

processos que ate entao seriam caros, demorados e propensos a erros.

Sobre esse contexto, especificamente na area de processamento de imagens, e

possıvel citar varios exemplos de aplicacao que estao baseadas nessas necessidades, tais

como sensoriameto remoto, robotica, medicina, biometria, reconhecimento otico de carac-

teres, assinaturas, codigos de barras, placa de veıculos, entre outros.

Por sua vez, e possıvel perceber que mesmo essas aplicacoes estando inseridas na

area de processamento de imagens, cada uma necessita de tecnicas ou metodos diferentes,

definindo com isso, uma grande variedade de sub-areas de conhecimento, elevando natu-

ralmente uma grande variacao de pesquisas, muitas vezes utilizadas em conjunto, a fim

de solucionar um determinado tipo de problema.

Um exemplo disso pode ser visto na pesquisa que aborda o reconhecimento da

placa de veıculos. Sobre esse assunto, e possıvel estudar uma variedade de tecnicas, seja

na compreensao de determinadas informacoes contidas na imagem utilizando tecnicas de

OCR (“Optical Recognition Characters”), seja na implementacao de filtros que possi-

bilitem a segmentacao de elementos especıficos em determinadas areas ou na identificacao

de padroes que podem definir um grupo ou varios grupos de dados.

Apesar de, inicialmente, o trabalho de reconhecimento da placa de veıculos parecer

uma aplicacao de solucao trivial, pois o objeto do reconhecimento, a placa, e constituıda

de caracteres impressos com formas bem definidas, induzindo ao pensamento que a simples

utilizacao de um sistema de reconhecimento otico de caractere OCR convencional pode,

sem grande dificuldade, resolver o problema. Entretanto, a realidade mostra o contrario.

Os algoritmos de OCR existentes no mercado nao sao suficientes para reconhecer em uma

imagem, os caracteres contidos na placa de um veıculo. Esse fato poder ser entendido por

meio de varios fatores, entre eles o fato de que:


• os algoritmos de OCR trabalham com imagens binarias, ja as imagens de veıculos

sao coloridas ou em nıveis de cinza;

• os referidos algoritmos nao foram concebidos com o proposito de identificar carac-

teres em um ambiente especıfico com o de placa de veıculos;

• a simples segmentacao por meio de uma binarizacao1 da imagem da placa nao e sufi-

ciente para o bom funcionamento do OCR, pois eventualmente essa tecnica sozinha

nao e capaz de segmentar os caracteres.

Alem desses fatores, o reconhecimento da placa do veıculo apresenta caracterısticas

proprias advindas, por exemplo, de diversos efeitos introduzidos por fatores, como a ve-

locidade de deslocamento do veıculo, o angulo de tomada da imagem, a distancia e a

qualidade tecnica do equipamento de captura, a luminosidade natural ou falta da mesma,

sombra, reflexo, diferencas de padrao, estado da placa, entre outras adversidades, que

tornam o problema muito mais complexo de ser tratado.

Apesar da identificacao manual da placa ser uma atividade simples, ela e restrin-

gida com a intrınseca limitacao humana, quando se tem um grande fluxo de veıculos,

caracterizando-se em um processo lento, ou ate mesmo inviavel. Essa limitacao se da pela

falta de uma ferramenta especıfica capaz de fazer a identificacao dos caracteres contidos

nas placas de automoveis. Com um sistema automatizado, o ganho nao se restringe

tao somente ao tempo de resposta, mas principalmente na imediata disponibilidade da

informacao para uso em inumeras aplicacoes.

Um sistema de informacao automatico de reconhecimento da placa de um veıculo

pode auxiliar e aumentar o desempenho de diversos setores, que necessitam desta in-

formacao para desenvolverem seu trabalho e mesmo ampliar para outros usuarios em

potencial. Um sistema de reconhecimento automatico de placas seria um excelente aliado

1Onde a imageme convertida de nıvel de cinza para preto e branco, a partir de um limiar determinado. Valoresabaixo do limiar assumem preto. Valores acima do limiar assumem branco.


aos orgaos de fiscalizacao, aos estacionamentos de grande rotatividade, as concessionarias

das rodovias privatizadas e a outros setores que possam fazer uso da informacao colocada

rapidamente a disposicao de forma facilitada e com um custo mais baixo.

O grande problema de identificacao de placa de veıculos e que como ja mencionado,

o simples fato de utilizar um OCR e necessario, entretanto, nao e suficiente para a sua

identificacao. Assumindo este fato como verdade, e necessario, a priori, o desenvolvimento

de um algoritmo que seja capaz de “entender”o que e placa e apos esse “entendimento”,

ser capaz de preparar os caracteres de forma satisfatoria a ponto de que um algoritmo de

OCR possa reconhece-los.

Este trabalho tem como objetivo desenvolver um metodo capaz de localizar a placa

do veıculo e preparar os caracteres, de tal forma que um algoritmo de OCR possa reconhe-

cer e identifica-los, com a mınima intervencao humana. Esse metodo utiliza tecnicas de

processamento de imagens aplicada na analise estatıstica dos perfis de linha da imagem.

O trabalho esta organizado da seguinte forma: No Capıtulo 2, sao apresentadas as

revisoes bibliograficas e as definicoes utilizadas ao longo do trabalho, alem de uma breve

abordagem sobre o estado da arte dos trabalhos relacionados publicados na literatura. O

Capıtulo 3 descreve o metodologia utilizada no trabalho, abordando o metodo de local-

izacao e preparacao dos caracteres da placa, para serem reconhecidos por um algoritmo

de OCR. A analise dos experimentos e os resultados do trabalho sao descritos no Capıtulo

4, onde e possıvel analisar o desempenho do metodo desenvolvido. O Capıtulo 5 descreve

as conclusoes obtidas com o desenvolvimento deste trabalho e as sugestoes de estudos

futuros.

Capıtulo 2

Revisao Bibliografica

2.1 Definicoes

Definicao 2.1.1 Imagem Digital ⇒ Segundo [GW02], uma imagem digital pode ser des-

crita por uma funcao f(x,y), que assume M linhas e N Colunas.

f(x, y) =

f(0, 0) f(0, 1) · · · f(0, N − 1)

f(1, 0) f(1, 1) · · · f(1, N − 1)...

... · · · ...

f(M − 1, 0) f(M − 1, 1) · · · f(M − 1, N − 1)

Definicao 2.1.2 Media Aritmetica ⇒ A media aritmetica pode ser descrita como um

conjunto de n observacoes x1, x2, ..., xn, onde a soma dos valores dessas observacoes e

o quociente da divisao por estas n observacoes. A media e largamente empregada, para

indicar a tendencia central de um conjunto de observacoes[FSC98]. A media aritmetica

e denominada por x:

x =x1 + x2 + ... + xn

n=

∑xi

n(2.1)

5

CAPITULO 2. REVISAO BIBLIOGRAFICA 6

em que xi e o sımbolo que indica a observacao de ordem i, onde i = 1,2,...,n.

Definicao 2.1.3 Variancia ⇒ A variancia e uma medida que indica o grau de dispersao,

ou variabilidade, em relacao ao valor central de um determinado conjunto de observacoes

[FSC98]. Considerando entao a soma dos quadrados dos desvios em relacao a media, e

sendo denotada por s2 e e definida como:

s2 =

∑(xi − x)2

n(2.2)

Definicao 2.1.4 Desvio Padrao ⇒ Ao contrario da variancia que envolve a soma dos

quadrados de um conjunto de observacoes e que nao exprime a mesma unidade do conjunto

de dados original, o desvio padrao atraves do calculo da raız quadrada da variancia e capaz

de obter a mesma unidade de medida dos dados originais [FSC98]. Entao, o desvio padrao

e denotado por s e e definido como:

s =

√∑(xi − x)2

n(2.3)

2.2 Flood Fill

O flood-fill e um algoritmo que tem como proposito preencher areas definidas por

componentes conexos da mesma cor, ou na sua forma estendida, componentes conexos den-

tro de um intervalo de cor. Na sua forma classica o flood-fill necessita de tres parametros:

1- Ponto inicial P (x, y); 2- Nova cor de preenchimento; 3- Cor anterior do componente

conexo. Na sua forma estendida, a cor anterior do componente conexo nao precisa ser

uma cor especıfica, mas um intervalo de cores pre-determinadas.

Existem algumas formas nas quais o algoritmo pode ser estruturado, entretanto ele

sempre usa uma estrutura explıcita ou implıcita de pilha, que e a sua forma recursiva. O

caminhamento do algoritmo pode ser implementado de duas formas: com quatro direcoes,


ou com oito direcoes como ilustrado na Figura 2.1. A diferenca e que com oito direcoes,

o algoritmo e capaz preencher areas que o de quatro direcoes nao tem acesso, devido a

vizinhanca que cada um consegue alcancar.

(a) (b)

Figura 2.1: a)flood-fill com 4 direcoes; b)flood-fill com 8 direcoes

2.3 Perfil de Linha

O perfil de linha de uma imagem com 256 tons de cinza e uma projecao da dis-

tribuicao do nıvel de cinza de cada pixel contido em cada posicao ao longo de uma deter-

minada linha. O perfil de linha PLx de uma imagem f poder ser definido por:

PLx = {f(x, y),∀y ∈ [0, N − 1]} (2.4)

onde x e a linha que esta sendo analisada, y e a coluna e N e a largura da imagem f

analisada. [MG04]

(a) (b) (c) (d)

Figura 2.2: Ilustracao que demonstra o comportamento do perfil de linha em tres linhas distintasda imagem. a) Imagem Original; b) Perfil de Linha 1 (linha superior); c) Perfil de Linha 2 (linhacentral); d) Pefil de linha 3 (linha inferior)


2.4 Trabalhos Relacionados

No trabalho desenvolvido por [BDRBC97], foi proposto um metodo de localizacao

de placas, baseado no fato de que a area da placa possui um padrao de variacao tonal

diferente do restante da imagem. A essa caracterıstica deu-se o nome de “assinatura”,

que em outras palavras, e a area provavel da localizacao da placa, a partir de um padrao

previamente observado. A referida “assinatura”e caracterizada por sucessivos pontos de

maximos e mınimos, caracterizados pela intercalacao de caracteres e fundo presentes no

perfil de linha, que corta horizontalmente a regiao da placa. Por fim, no referido tra-

balho, apos a localizacao de uma linha que possui as caracterısticas de uma “assinatura”,

a localizacao da placa dar-se-a pela comparacao de caracterısticas pre-definidas empiri-

camente com medidas calculadas dinamicamente, como distancia e amplitude dos pontos

de maximos e mınimos da linha candidata.

A tecnica descrita em [BDRBC97] apresenta um bom desempenho, entretanto, os

autores nao explicitaram como a “assinatura”tratou da dificuldade de identificar quais

pontos maximos e mınimos sao relevantes para a identificacao da assinatura, que muitas

vezes retorna um falso positivo, devido a presenca de outros elementos na imagem com a

mesma caracterıstica.

Para tratar essa dificuldade, [MG04] aperfeicoou o metodo de localizacao de placas

desenvolvido por [BDRBC97], utilizando para isso operadores morfologicos de white-top

hat e black top-hat concebido por [SER88], para filtrar o perfil de linha com o proposito

de diminuir a ocorrencia de falsos positivos na analise da assinatura.

Ja [CPR04] apresentou uma tecnica baseada na variancia do perfil de linha, para

localizar a placa. O algoritmo proposto pelo autor identifica a linha de maior variancia

na imagem, e apos encontrada, e determinada uma faixa otima que segundo o autor,

e a faixa provavel onde esta localizada a placa. Apos encontrada essa faixa otima, o


algoritmo percorre novamente a imagem em busca da localizacao da area candidata. Nesta

nova iteracao, o algoritmo encontra o valor do limiar calculado a partir dos valores do

maior e menores picos da linha amostrada. Para analisar os picos encontrados na analise

anterior, o algoritmo trabalha com valores pre-definidos, que caracterizam a largura da

placa. Segundo o autor, a abordagem utilizada no metodo proposto mostrouse eficiente

na localizacao e extracao de placas de veıculos. Entretanto, a referida abordagem, esta

condicionada ao conjunto de imagens testadas. Este fato fica transparente se for observado

que o autor utilizou valores pre-definidos para determinar a faixa otima e para determinar

a largura da placa, alem de nao levar em consideracao a presenca de outros elementos na

imagem com a mesma caracterıstica da “assinatura”.

O trabalho de [SS00] tambem aborda a tecnica de “assinatura”para localizar o

padrao de variacao tonal, efetuando uma busca em toda a imagem a procura de linhas

horizontais que possuam um padrao diferente do restante da imagem. Apos encontrar a

area que mais se enquadra ao padrao da “assinatura”, o algoritmo passa para uma segunda

fase onde a regiao encontrada e binarizada, utilizando o algoritmo Niblack1 proposto por

[NIB86], para ser analisada posteriormente por um algoritmo de procura e verificacao de

dıgitos.

[SCY00] propos um metodo que tambem se enquadra na categoria analise da “assi-

natura”por variacao tonal. O referido trabalho, no entanto, realiza um pre-processamento

aplicando o operador unidimensional Sobel2, que pode ser visto com mais detalhes em

[GW02]. Em cada linha da imagem, utiliza-se uma mascara M = [−1, 0, 1] sobre a ima-

gem para realca-la, afim de explicitar mais o contraste existente entre os caracteres e o

fundo da imagem. O operador Sobel tem o objetivo de pre-processar a imagem, com o

proposito de facilitar a identificacao do perfil que caracteriza a placa. O referido metodo

pode ser visto tambem no trabalho desenvolvido por [FER03]. Os picos encontrados no

1Algoritmo que calcula para cada pixel da imagem a media e o desvio padrao da vizinhanca em torno dele, e aseguir, compara o valor do pixel analisado com o limiarf(x, y). Se o valor do pixel for maior quef(x, y), eleeconsiderado pertencente ao fundo, caso contrario, e considerado pertencente a algum objeto.

2Operador utilizado para realizar a deteccao de borda em uma imagem.


perfil de linha menores que um valor Θ e os picos negativos sao descartados. Uma codi-

ficacao em funcao da largura dos picos e feita, resultando em intervalos que representam

as distancias entre os elementos encontrados. A fase subsequente analisa os elementos en-

contrados quanto a suas dimensoes horizontais. Aqueles intervalos que estiverem dentro

das dimensoes esperadas sao agrupados ate formarem grupos com dimensoes proximas as

das placas. Devido a possibilidade de existirem diversas areas candidatas, e necessario

um modo de verificar qual delas e realmente valida. Este procedimento e feito atraves de

uma procura bidirecional nas linhas adjacentes a linha amostrada. Quando um grupo de

linhas e aproximadamente igual a dimensao vertical dos caracteres, este e considerado o

local da placa.

Outro trabalho que tambem apresenta a utilizacao da “assinatura”e o desenvolvido

por [YM05], que como o trabalho de [SCY00] e [FER03], utiliza o operador unidimen-

sional Sobel para determinar areas candidatas a placa e usa a morfologia matematica para

efetivamente localizar a placa.

Dentre os inumeros trabalhos relacionados na literatura que tratam do assunto

desta monografia, foi conveniente destacar aqueles que possuem alguma influencia sobre o

modelo proposto neste trabalho. Entretanto, existe outro grande numero de trabalhos que

utilizaram outros tipos de tecnicas para localizar a placa que valem a pena ser brevemente

citados, como por exemplo o trabalho de [YS05], que utiliza de tecnicas de logica Fuzzy ;

o desenvolvido por [GRT02], [KTK+03], [TK99], que utiliza de redes neurais artificiais,

o proposto por [YGN+03] que localiza a placa utilizando uma combinacao da tecnica de

Hough concebida inicialmente por [Hou62] para localizar linhas em uma imagens e uma

tecnica denominada pelo autor de Voted Block Matching, para localizar a regiao da placa.

Capıtulo 3

Metodo Proposto

Para realizar este trabalho, foram assumidas duas premissas basicas, que condi-

cionaram a forma do desenvolvimento de uma sequencia logica de etapas e, consequen-

temente, dos algoritmos necessarios para o desenvolvimento deste trabalho. As referidas

premissas sao descritas como:

• Eficiente - que o algoritmo proposto percorra o mınimo possıvel na imagem;

• Adaptavel - que o algoritmo se adapte as situacoes de variacao de luminosidade,

contraste e resolucao de cada imagem de forma dinamica.

Tendo em vista que o principal fator crıtico de sucesso para um sistema de iden-

tificacao automatico de placas de veıculos e a fase de localizacao da placa, o metodo

proposto foca principalmente no referido fator crıtico, acreditando que o sucesso de um

OCR depende totalmente do sucesso da etapa de localizacao. Ademais, atrelando aos ob-

jetivos apresentados pelas premissas, condicionou-se ao desenvolvimento de uma sequencia

logica de etapas, que fizesse uso das vantagens apresentadas por cada um dos algoritmos

dos outros trabalhos estudados, evitando suas deficiencias. Sendo assim, as etapas pro-

postas neste trabalho foram escolhidas de forma semelhante aos varios outros trabalhos

publicados na literatura sobre este mesmo assunto, que em outra palavras, sao etapas in-

11

CAPITULO 3. METODO PROPOSTO 12

tuitivas e necessarias para o desenvolvimento de tal trabalho. Como ilustrado da Figura

3.1, as etapas foram divididas em aquisicao da imagem, localizacao da placa, preparacao

dos caracteres e reconhecimento dos caracteres.

Figura 3.1: Visao macro da sequencia logica das etapas

3.1 Localizacao da Placa

A regiao onde a placa esta localizada e caracterizada necessariamente por uma

variacao entre pontos de maximo e de mınimo, intercalados com amplitude e distancia

semelhantes. A referida caracterıstica, deu-se o nome de “assinatura”, inicialmente pro-

posta por [BDRBC97] e tambem utilizada nos trabalhos de [MG04], [CPR04], [SS00],

[SCY00], [FER03]. A “assinatura”pode ser facilmente observada no perfil de linha da

Figura 3.2.

A etapa de localizacao da placa possui como entrada uma imagem digital em nıvel

de cinza, que foi previamente adquirida por algum tipo de equipamento de aquisicao de

imagem, camera digital, filmadora, entre outros. Eventualmente, a imagem adquirida

pode ou nao conter uma placa. Caso nao haja placa na imagem, o algoritmo retorna

as coordenadas da regiao que mais se assemelha as caracterısticas pre-definidas de uma


Figura 3.2: Demonstracao do perfil de linha. a) Imagem original com duas analises de “assi-natura”ortogonaisa placa. b) Perfil de linha superior, cortando os farois. c) Perfil de linhainferior cortando a placa.

placa. Caso contrario, a etapa de localizacao da placa tem como saıda as coordenadas

referentes a placa. Quem vai dizer se a regiao selecionada e placa ou nao e a etapa de

reconhecimento dos caracteres e sera explicada com detalhes posteriormente.

O metodo utilizado neste trabalho para localizar a placa esta fortemente embasado

na estatıstica descritiva que se justifica para atender a segunda premissa enunciada na

metodologia. A escolha da estatıstica, representada aqui neste trabalho por tres dos seus

varios conceitos: media(x), variancia(s2) e desvio padrao(s), adequa-se muito bem a um

ambiente com situacoes de variacao de luminosidade, contraste e resolucao, como e uma

situacao real de um sistema de localizacao automatica de placa de veıculos. Esses tres

conceitos, na etapa de localizacao da placa, sao utilizados sobre o perfil de linha PLx.

A adocao da estatıstica neste trabalho e necessaria, para que a analise de PLx seja feita

de forma dinamica, afim de encontrar alguns padroes que caracterizam uma placa. Nesta

etapa, os tres conceitos sao utilizados da seguinte forma:


x(PLx) =

n−1∑y=0

PLx[y]

n(3.1)

s2(PLx) =

n−1∑y=0

(PLx[y]− x(PLx))2

n(3.2)

s(PLx) =√

s2(PLx) (3.3)

A etapa de localizacao da placa inicia-se com uma varredura na imagem em busca

de linhas horizontais, que possuam um padrao de variacao tonal esperado, caracterizando

a “assinatura”. Para reduzir o tempo gasto na procura da placa, as linhas sao amostradas

em intervalos regulares τ . A escolha do valor de τ depende do tamanho dos caracteres

procurados, devendo, entretanto, ser necessariamente menor que a sua dimensao vertical.

Embora quanto maior o valor de τ , mais a premissa de eficiencia citada anteriormente

sera atendida. Uma imagem f de M linhas pode ter o seu processamento reduzido, se as

linhas a serem analisadas na varredura respeitarem a seguinte definicao:

f ′(x′, y) = {f(x, y),∀x ∈ [0, M − 1] ⇔ x mod τ = 0} (3.4)

onde f ′(x′, y) representa as linhas x da imagem f(x, y), se e somente se, a linha x for

multipla de τ . As linhas, sao representadas por x, e y sao as colunas.

Para a compreensao do metodo desenvolvido para localizar a placa, foram criados

dois conceitos: PMax, que representa um ponto de maximo do perfil de linha PLx′ da

imagem f ′ e PMin, que representa um ponto de mınimo do perfil de linha PLx′ da imagem

f ′. Os dois conceitos sao definidos como:

PMax =

{PLx′ [y] ≥

(x(PLx′) +

s(PLx′)

λ

)∀y ∈ [0, N − 1]

}(3.5)

PMin =

{PLx′ [y] ≤

(x(PLx′)− s(PLx′)

λ

)∀y ∈ [0, N − 1]

}(3.6)


onde PLx′ [y] corresponde ao valor do pixel em cada posicao do perfil de linha PLx′

Como ja citado, a regiao onde a placa se encontra e fortemente caracterizada por

um padrao denominado “assinatura”. No trabalho proposto por [MG04], a placa e lo-

calizada atraves da analise das distancias dos pontos de maximo e mınimo presentes no

padrao da “assinatura”. Nao obstante, outro trabalho com o mesmo proposito desen-

volvido por [CPR04] determina, a partir da variancia do perfil de linha, os pontos de

maximo e mınimo.

Neste trabalho, os pontos de maximo e mınimo sao determinados de forma seme-

lhante aos trabalhos de [MG04] e [CPR04]. Entretanto, a estatıstica e usada de forma

mais efetiva em relacao ao trabalho de [CPR04] e sem a necessidade de pre-processamento

como e o caso do trabalho de [MG04]

Os pontos de maximos PMax e mınimos PMin sao escolhidos, a partir de uma

varredura da esquerda para a direita no perfil de linha PLx′ de cada linha x′ da ima-

gem f ′. A partir de observacoes empıricas do comportamento das caracterısticas da

“assinatura”, nota-se que apenas a utilizacao da media dos valores dos pixels do perfil de

linha e necessaria, entretanto, nao e suficiente para discernir o que e ponto de maximo e

o que e ponto de mınimo de forma coesa.

Observando a diferenca abrupta de tons de cinza referentes ao fundo da placa

em relacao aos seus caracteres, e possıvel notar duas caracterısticas marcantes da “assi-

natura”:

• Uma aplitude dos nıveis de cinza entre o fundo da placa e seus respectivos caracteres.

• Uma condensacao entre os pontos de maximos e mınimos da amplitude.

A partir dessas duas caracterısticas, e entao necessario atribuir duas pre-condicoes,

para diminuir a taxa de falsos positivos:


• s2(PLx′) < (Θ.x), onde Θ e um multiplicador definido empiricamente, s2(PLx′)

refere-se ao valor da variancia do perfil de linha. Perfil de linhas com amplitude

menor que (Θ.x) sao descartadas.

• Como a regiao da “assinatura”e caracterizada por uma regiao com altas amplitudes

referentes aos pontos de maximos e mınimos e de forma condensada, conforme

ilustrado na Figura 3.3, e necessario atribuir um desvio em relacao a media para

cima e para baixo, que seja suficiente para encontrar os pontos de maximo e mınimos

da “assinatura”e que tambem seja suficiente para descartar regioes que nao possuem

amplitudes como as observadas na “assinatura”. Esse desvio deve ser definido de

forma dinamica, atraves do calculo da media, mediana e desvio padrao do perfil de

linha.

As duas caracterısticas presentes na “assinatura”e a desvio atribuıdo em relacao

ao valor da media do perfil de linha podem ser visualizados na Figura 3.3.

Figura 3.3: Identificacao dos pontos de maximos e mınimos, a partir da analise estatıstica doperfil de linha

Para que um ponto seja considerado como ponto de maximo, ele deve possuir um

tom de cinza maior que a media somada com a metade do desvio padrao correspondente.

Para o ponto de mınimo, o raciocınio e o mesmo, modificando apenas que o pixel deve

ser menor que a media subtraıda da metade do desvio padrao correspondente. Alem


dessa regra para a escolha dos pontos de maximo e mınimo, uma vez que um ponto

foi considerado como ponto de maximo, o proximo ponto so podera ser um ponto de

mınimo, sequenciamente, o proximo ponto so podera ser um ponto de maximo, e assim

sucessivamente intercalando pontos de maximo e mınimo, ate atingir o final do perfil de

linha. Como pode ser notado na Figura 3.3, os pontos de maximo nao sao necessariamente

os picos do perfil de linha. Nesse caso, o ponto de maximo passa a ser o primeiro ponto

que respeita a logica descrita acima, o mesmo acontecendo com os pontos de mınimo.

Apos definido o conceito de PMax e PMin e entendido o processo de discernir o que

e ponto de maximo e o que e ponto de mınimo, e necessario a compreensao de mais dois

conceitos: LPMax, que representa uma lista contendo as ocorrencias dos pontos de maximo

de cada perfil de linha PLx′ da imagem f ′. E, LPMin, que tem o mesmo sentido de LPMax

,

no entanto, contendo as ocorrencias dos pontos de mınimo.

flagMax[xi] =

{1, se PLx′ [y] = PMax

0, se PLx′ [y] 6= PMax

(3.7)

flagMin[xi] =

{1, se PLx′ [y] = PMin

0, se PLx′ [y] 6= PMin

(3.8)

onde y ∈ [0, N − 1] e xi ∈ [0, N − 1] .

LPMax[x′] =

{N−1∑xi=0

flagMax[xi] ∈ PLx′ ,∀PLx′ ∈ f ′(x′, y)

}(3.9)

LPMin[x′] =

{N−1∑xi=0

flagMin[xi] ∈ PLx′ ,∀PLx′ ∈ f ′(x′, y)

}(3.10)

Para definir em qual linha esta situada a placa, as listas LPMaxe LPMin

sao anali-

sadas. As duas listas nao precisam ser analisadas em conjunto, sendo assim, este trabalho

referenciara apenas a lista LPMax. No entanto, a analise tambem pode ser feita sobre a

lista LPMin.


Como ja dito, a placa e caracterizada por sucessivos pontos de maximos e mınimos,

intercalados com amplitude e distancia semelhantes. Toda a metodologia de escolha

de pontos de maximo e mınimo ja foi previamente elaborada, para que o Max(LPMax)

contenha a assinatura procurada, onde Max(LPMax) e a posicao da lista LPMin

com o

maior numero de pontos de maximo.

Para verificar a veracidade do metodo, os elementos vizinhos de Max(LPMax), ou

seja, os V (Max(LPMax)), tambem sao analisados, para diminuir a taxa de falsos positivos

se, eventualmente, a linha encontrada em Max(LPMax) possuir ruıdos ou pertubacoes,

que possuam a mesma caracterıstica esperada para a placa. A analise dos vizinhos e

realizada da seguinte forma: a linha de cima e a linha de baixo da linha encontrada em

Max(LPMax) sao verificadas, a fim de saber qual das duas contem o maior numero de

PMax . Apos encontrada qual das duas possui o maior numero de PMax. Essa linha e

analisada com a linha encontrada em Max(LPMax). Se a linha vizinha a Max(LPMax

)

com o maior numero de PMax for pelo menos δ%deMax(LPMax), entao a linha contida em

Max(LPMax) e caracterizada como a linha provavel para a placa. Caso a condicao nao

seja aceita, e feita uma nova busca na lista de LPMax, buscando agora a segunda posicao

que contem o maior numero de PMax. Os passos descritos acima se repetem ate obter um

valor que seja pelo menos δ%deMax(LPMax), ou entao, ate que todas as posicoes da lista

LPMaxsejam analisadas, ate concluir que a imagem nao possui placa .

Apos o processo descrito acima, e esperado em uma imagem que contenha a placa

o seguinte resultado, conforme Figura 3.4

Para localizar a regiao que mais se caracteriza como uma placa ao longo da linha

ilustrada na Figura 3.4, o perfil de linha e submetido novamente a uma inspecao. Neste

ponto, a busca para de ser vertical e passa a ser horizontal, ou seja, apos encontrar a

linha x′ que mais se enquadra ao padrao esperado para a ‘assinatura”, o objetivo agora

e determinar em qual posicao efetivamente comeca e termina a regiao delimitada pela


Figura 3.4: Linha encontrada com base na analise estatıstica do perfil de linha.

placa.

O algoritmo percorre o perfil de linha, criando uma nova lista com o calculo da

distancia entre cada ponto de maximo ou de cada ponto de mınimo, referentes as distancias

de duas posicoes y do perfil de linha PLx′ . Apos percorrer o perfil de linha e preencher a

estrutura de dados ilustrada na Figura 3.6 b), o algoritmo utiliza novamente os conceitos

estatısticos de media(x), variancia(s2) e desvio padrao(s). Os tres valores estatısticos sao

calculados, a partir da lista que foi criada com os calculos das distancias. Esta operacao

pode ser descrita pela definicao a seguir:

Linf ={

x +s

α

}(3.11)

Ldis[xi] > Linf , f lag = 1 (3.12)

Ldis[xi] ≤ Linf , f lag = 0 (3.13)

onde α e um valor inteiro suficiente para separar as distancias maiores das distancias

menores. Linf caracteriza o limite inferior, que servira como um limiar para separar

distancias entre dois pontos maior de distancia entre dois pontos menores. Os valores

de distancia da lista de distancias Ldis[xi] maiores que Linf assumem flag = 1, caso

contrario, assumem flag = 0. E s representa o desvio padrao das distancias de pontos de

maximo.

Observando o perfil de linha da Figura 3.3, e notavel que existe uma regiao onde


os pontos de maximo e de mınimos estao mais condensados. A definicao acima busca

exatamente localizar a referida condensacao, atribuindo 0 para as distancias maiores e 1

para as distancias curtas. A regiao da lista Ldis com a maior condensacao de valores 1

e considerada como a regiao da placa e as coordenadas sao remetidas como ilustrado na

Figura 3.5.

Figura 3.5: Regiao encontrada apos analisar a condensacao dos pontos de maximo

As estruturas de dados usadas para localizar a linha candidata a placa e a estrutura

usada para localizar as coordenadas exatas das linhas candidatas estao ilustradas nas

Figuras 3.6 a) e b), respectivamente.

(a) (b)

Figura 3.6: Estruturas de dados utilizadas para localizacao da placa a) Estrutura de dados paralocalizacao da linha candidata; b) Estrutura de dados usada para localizar as coordenadas exatasda placa na linha candidata identificada pela estrutura da Figura a).


3.2 Preparacao dos Caracteres

Apos a etapa de localizacao da placa, onde as coordenadas referentes a possıvel

localizacao da placa sao identificadas. A etapa de preparacao dos caracteres tem o objetivo

de analisar a area delimitada pelas referidas coordenadas, afim de obter as areas de cada

caracter segmentada e binarizada da imagem original. Contudo, isso em condicoes que

facilite e aumente a precisao de um algoritmo de OCR. Caso nao haja um caracter na

area segmentada, esta etapa tera como saıda coordenadas erroneas de areas que mais se

adequam a logica do algoritmo descrito a seguir.

A etapa de preparacao dos caracteres, por sua vez, tambem utiliza as medidas

estatısticas de media(x), variancia(s2) e desvio padrao(s). Os tres valores estatısticos sao

calculados a partir do perfil de linha PLx′ encontrado na etapa de localizacao da placa,

que mais se assemelha ao padrao de “assinatura”procurado corretamente delimitado pela

regiao encontrada apos analisar a condensacao dos pontos de maximo. A estatıstica

descritiva e novamente utilizada nesta etapa para garantir que o metodo continue sendo

adaptavel com variacao de iluminacao e contraste.

O objetivo desta etapa e separar cada caracter contido na placa e trata-los separa-

damente. Uma versao adaptada do algoritmo flood-fill foi formulada neste trabalho, para

que a segmentacao dos caracteres fosse possıvel. Para entender como o flood-fill se tornou

adaptavel, segue a definicao de como a CorAntiga e atribuıda:

CorAntiga = {x(PLx)} (3.14)

ou seja, CorAntiga recebe a media dos nıveis de cinza de PLx′ , delimitado pela area

encontrada apos analisar a condensacao dos pontos de maximo.

O algoritmo percorre o perfil de linha da esquerda para direita e quando encontrar


um pixel menor que CorAntiga, ou seja, 0 < CorNova < CorAntiga, o algoritmo executa

o flood-fill e a area encontrada e caracterizada como um caractere. Essa busca e realizada

ate encontrar o final de PLx′ .

A Figura 3.7 ilustra as areas dos caracteres encontrados apos a utilizacao do flood-

fill adaptado, onde cada caracter foi separado e binarizado, e esta pronto para ser enviado

para um OCR.

Figura 3.7:Area dos caracteres localizada com a utilizacao doflood-fill adaptado.

3.3 Reconhecimento dos Caracteres

Apos a localizacao da placa e preparacao dos caracteres, ja e possıvel utilizar um

OCR com objetivo de reconhecer os caracteres referentes a placa. Se eventualmente nao

for reconhecido nenhum caracter ou se os caracteres reconhecidos nao caracterizarem uma

placa com os padroes nacionais de transito, esta etapa tem como saıda uma sinalizacao

que indica que o processo devera ser reiniciado a partir da etapa localizacao dos caracteres.

Entretanto, agora o valor de x′ referente nao mais a Max(LPMax) e Max(LPMin

) presentes

na primeira iteracao, mas referente a segunda maior quantidade de pontos de maximo

e mınimo. A lista completa de todos os valores em ordem decrescentes dos pontos de

maximo e mınimo LPMaxe LPMin

ja foi previamente armazenada em memoria na etapa

de localizacao da placa. Se a nova iteracao falhar novamente, todo processo podera ser

realizado novamente ate o numero total de x′ ou ate um limite de iteracoes previamente

estabelecido. Para reconhecer os caracteres, este trabalho utilizou uma ferramenta OCR

de terceiros. Entendendo que o simples fato de utilizar um OCR nao e suficiente para a


sua identificacao e que a referida ferramenta ja e uma tecnologia dominada e consagrada

no mercado e no meio academico, atingido um alto nıvel de acertos.

Capıtulo 4

Experimentos e Resultados

Para realizar este trabalho, foi coletada uma base de dados de imagens, que se en-

contram em situacao de ambiente controlado. Um ambiente controlado necessariamente e

um ambiente que propicia o mesmo angulo de tomada, na mesma distancia e mesmo grau

de luminosidade. Um ambiente dito controlado pode ser encontrado em entradas de shop-

ping ou estacionamento, como e o caso das imagens utilizadas neste trabalho. A escolha

de imagens em um ambiente controlado sao necessarias para diminuir a complexidade dos

algoritmos, agindo pontualmente em uma determinada dificuldade e aumentando assim a

probabilidade de acerto. A Tabela 4.1 demonstra as caracterısticas das imagens utilizadas

neste trabalho. Para realizar os experimentos, foram coletadas imagens com exemplos de

placas de varios paıses do mundo com diferentes dimensoes.

Banco de dados de imagemNumero de Imagens 139Resolucao 96 DPICores 256 Cores (8BitsPorPixel)Tipo de Arquivo JPG

Tabela 4.1: Tabela que demonstra as caracterısticas das imagens utilizadas no trabalho

Foi utilizado para processar as imagens um computador com as configuracoes des-

critas na Tabela 4.2

As etapas de localizacao da placa e preparacao dos caracteres mostrou extrema-

24

CAPITULO 4. EXPERIMENTOS E RESULTADOS 25

Configuracao utilizadaProcessador AMD Athlon(TM)XP 2600+ 1.92GHzMemoria 256MBSistema Operacional Windows XP ProfessionalLinguagem deProgramacao Delphi 7

Tabela 4.2: Tabela que demonstra as caracterısticas de hardware e software utilizados

mente eficiente do ponto de vista de tempo de processamento. Como um dos principais

objetivos desta proposta e localizar a placa e preparar os caracteres para o reconheci-

mento em um OCR, de forma que o algoritmo percorra o mınimo possıvel da imagem.

Esse objetivo foi alcancado na etapa para localizar os pontos de maximo PMax e pontos

de mınimo PMin, onde o algoritmo passa a trabalhar com a imagem f ′(x′, y) e nao mais

com a imagem original f(x, y), alem das pre-condicoes como o perfil de linhas com am-

plitude menor que (Θ . x) serem descartados e perfis de linhas que nao se enquadram

no padrao da “assinatura”tambem serao descartados. Com a utilizacao conjunta desses

metodos, a quantidade de pixels a serem analisados na imagem original f(x, y) diminuem

significamente, o que pode ser observado com os dados demonstrados na Tabela 4.3

Tempos ObtidosEtapa em milesegundos em segundosLocalizacao da Placa 32 ms p/imagem 31,25 imagens p/sPreparacao dos Caracteres 15 ms p/imagem 66,66 imagens p/sOCR 80 ms p/imagem 12,50 imagens p/sTotal 127 ms p/imagem 7,87 imagens p/s

Tabela 4.3: Tabela que demonstra os tempos medios obtidos do algoritmo em cada etapa

Cada conjunto de imagem de cada paıs analisado possui caracterısticas proprias

quanto a iluminacao, distancia e angulo de tomada, alem de possuir padroes de numeracao

especıficos para cada paıs, como pode ser visto na Figura 4.1. Entretanto, para o algo-

ritmo, os referidos fatos sao indiferentes, levando em consideracao que a busca pela placa

e realizada da mesma forma e entendendo que o fator crıtico de sucesso do algoritmo e

que apenas o veıculo esteja contido na imagem. Imagem que alem da presenca do veıculo,

contenha tambem outros objetos que nao pertencem ao automovel aumenta considerav-

elmente a possibilidade de haver outra regiao com as mesmas caracterısticas esperadas


para “assinatura”. Os conjuntos de imagens exemplificados pela Figura 4.1 demonstram

um ambiente ideal para o sucesso do algoritmo. O desempenho da etapa de localizacao

da placa e da etapa de preparacao dos caracteres e apresentado na Tabela 4.4

Desempenho do AlgoritmoPaıs No de Images Localizacao da placa Preparacao dos Caracteres

Brasil 31 27 - 87,0% 16 - 51,6%Holanda 39 39 - 100% 31 - 79,4%

Israel 39 37 - 94,8% 29 - 74,3%Australia 30 27 - 90% 14 - 46,6%

Tabela 4.4: Tabela que demonstra a taxa de acerto da etapa de localizacao da placa e da etapade preparacao dos caracteres, utilizando placas de varios paıses

(a) Brasil (b) Holanda

(c) Israel (d) Australia

Figura 4.1: Resultado do algoritmo de localizacao da placa em diversos nıveis de luminosidade,angulo de distancia de tomada

Neste trabalho, foram criadas duas premissas que presavam a eficiencia e a adap-

tabilidade do algoritmo proposto. As referidas premissas foram elaboradas para efetivar

o desenvolvimento de um metodo que diminuısse a taxa de particularidade de algoritmos

ja desenvolvidos. Tais particularidades podem ser percebidas no trabalho de [SCY00],

que apesar de ser eficiente do ponto de vista de velocidade de processamento, demonstrou

ser segundo o autor, pouco eficaz no que diz respeito a sua exposicao em condicoes de

iluminacao variaveis. Entretanto, outro algoritmo desenvolvido por [CBW98] apresentou

ser eficiente quanto a variacao de iluminacao, mas em contrapartida, tambem segundo o

autor, apresentou ser pouco eficiente no quesito tempo de processamento.


(a) Brasil (b) Holanda

(c) Israel (d) Australia

Figura 4.2: Resultado do algoritmo de preparacao dos caracteres em diversos nıveis de lumi-nosidade,angulo de distancia de tomada

Contudo, o algoritmo apresentado neste trabalho mostrou-se eficiente no quesito

tempo de processamento e adaptavel as varias condicoes de iluminacao diferentes, sem

comprometer o tempo gasto. No entanto, foi possıvel observar que em algumas situacoes

o algoritmo falha. A Figura 4.3 demonstra uma situacao tıpica na qual o algoritmo nao e

capaz de localizar a placa, levando a sinalizacao de um ponto onde o processo nao alcancou

resultado satisfatorio.

Como pode ser notado, as tres linhas que representam a media x, a media mais

metade do desvio padrao x+ s2

e a linha que representa a media menos a metade do desvio

padrao x − s2

passam acima da area que representa a “assinatura”. Este fato se da pela

alta concentracao de pixels com tons de cinza proximos a branco, o que leva a media para

cima, gerando a ineficiencia do algoritmo nestes casos.

(a)

(b)

Figura 4.3: Exemplo de uma situacao em que o metodo proposto falha. 4.3(a) Imagem da placaindicando um perfil de linha. 4.3(b) Exemplo de um perfil de linha em que o metodo propostonaoe capaz de identificar a “assinatura”.

Capıtulo 5

Conclusao

A partir de experimentos realizados neste trabalho em imagens de veıculo em

um ambiente controlado, notou-se que as duas premissas de adaptabilidade e eficiencia

descritas no trabalho foram alcancadas. Este fato pode ser observados na Tabela 4.3

que demonstrou o tempo gasto para processamento das imagens na etapa de localizacao

e preparacao dos caracteres e, na Figura 4.3, que demonstra varios tipos de angulo de

tomada, distancia, iluminacao e contraste.

O processo de reconhecimento dos caracteres contidos em uma placa depende forte-

mente do metodo utilizado para encontra-la e prepara-la. Com a utilizacao de tecnicas de

processamento de imagens aplicada na analise estatıstica dos perfis de linha da imagem,

possibilitou, principalmente, atraves da analise estatıstica, que o algoritmo trabalhasse

com valores obtidos dinamicamente e, por sua vez, adaptavel a situacoes diversas de

iluminacao.

Neste trabalho, a localizacao da placa de veıculo em um cenario controlado ocorreu

de forma satisfatoria do ponto de vista do que era esperado no inıcio do trabalho, com

o ındice de 93% de acerto, sendo que em alguns ambientes, como o caso do grupo de

imagens de automoveis holandesas, obteve 100% de acerto.

28

CAPITULO 5. CONCLUSAO 29

Diferentemente da etapa de localizacao placa, a etapa de preparacao dos caracte-

res apesar de tambem ser embasada sobre valores obtidos atraves de analise estatıstica,

demonstrou um nıvel de acerto abaixo do esperado, com 64% de acerto. No entanto, a

preparacao dos caracteres pode ser descartada se o algoritmo de OCR utilizado sofisticado

o suficiente para realizar esta etapa. Em outras palavras, em um processo de identificacao

automatico dos caracteres contidos em um placa de veıculo, o fator crıtico de sucesso e

a localizacao da placa, ou seja, se esta etapa falhar, todos as outras etapas subsequentes

falharao e foi nessa etapa que este trabalho teve seu foco.

5.1 Sugestao de Estudos

Algumas melhorias podem ser realizadas como trabalhos futuros para aperfeicoar

as tecnicas utilizadas neste trabalho. Uma melhoria que poderia ser realizada e quanto a

etapa de preparacao dos caracteres. Neste trabalho, como pode ser observado na Tabela

4.4, houve um baixo ındice de acerto. No entanto, apos a placa ja ter sido localizada, a

etapa de preparacao dos caracteres deve apenas preparar a referida area, para que um

algoritmo de OCR possa ter um resultado mais efetivo. Algumas abordagens podem ser

utilizadas, como por exemplo, melhorar a forma que o flood-fill segmenta os caracteres ou

realizar binarizacoes adaptativas, como as conhecidas Otsu, Niblack; ou utilizar tecnicas

de realce de borda, como Cany ; ou ate mesmo utilizar morfologia matematica, para

tentar resolver o problema. Em outras palavras, a etapa de preparacao dos caracteres

deve separar os caracteres dos outros objetos conexos existentes na regiao resultante da

etapa de localizacao da placa.

Outra melhoria que pode ser realizada e quanto a inclinacao da placa. Neste tra-

balho, a tolerancia quanto a inclinacao e pequena, visto que para o sucesso da localizacao,

a inclinacao da placa deve ser de tal forma que o perfil de linha deve pegar o primeiro e

o ultimo caracter da placa.

CAPITULO 5. CONCLUSAO 30

Quanto a falha apresentada e ilustrada na Figura 4.3, uma alternativa para pesquisas

futuras seria talves, nos casos especıficos nas quais o algoritmo falha, executar um pre-

processamento de forma que uma eventual alta concentracao de pixels proximos de brancos

ou pixels proximos de pretos seja contornada, com metodos como white-top hat e black

top-hat concebidos por [SER88].

Referencias Bibliograficas

[BDRBC97] J. BARROSO, E.L. DAGLESS, A. RAFAEL, and J. BULAS-CRUZ. Number

plate reading using computer vision. IEEE - International Sympositum on

Industrial Eletronics ISIE’97 Universidade do Minho, Guimaraes, Jul 1997.

[CBW98] C. COETZEE, C. BOTHA, and D. WEBER. Pc based number plate recog-

nition system. Proceedings of IEEE International Conference on Industrial

Electronics, 1998.

[CPR04] B. G. CUNHA, J. F. PEREIRA, and W. S. M. RIBEIRO. Localizacao

de placas de veıculos utilizando tecnicas de variancia. PRAXIS - Revista do

Instituto Luterano de Ensino Superior de Itumbiara, (5):23–25, jul/dez 2004.

[FER03] A. P. P. FERREIRA. Sistema de Identificacao Automatica de Matrıculas

em Veıculos Automoveis. PhD thesis, Instituto Superior de Engenharia de

Lisboa, 2003.

[FSC98] A. A. FARIAS, J. F. SOARES, and C. C. CESAR. Introducao a Estatıstica.

Rio de Janeiro :LTC 2. ed., 1998.

[GRT02] C.B. GUINGO, R. J. RODRIGUES, and A. C. G. THOME. Reconhecimento

automatico de placas de veıculos automotores atraves de redes neurais arti-

ficiais. 2o. Congresso Brasileiro de Computacao, 2002.

[GW02] R. C. GONZALEZ and R. E. WOODS. Digital Image Processing. Prentice

Hall, 2002.

31

REFERENCIAS BIBLIOGRAFICAS 32

[Hou62] P. V. C. Hough. A method and means for recognizing complex patterns.

U.S. Patent No. 3,069,654, 1962.

[KTK+03] V. KOVAL, V. TURCHENKO, V. KOCHAN, A. SACHENKO, and

G. MARKOWSKY. Smart. license plate recognition system based on image

processing using neural network. IEEE Internatioanl Workshop on Intel-

ligent Data Acquisition and Advanced Comuting Systems: Technology and

Appticationi. Proceedings of the Second IEEE International Workshop, pages

123 – 127, 2003.

[MG04] J. C. MELO and S. J. F. G. GUIMARAES. Definicao de assinatura de placas

de veıculos com base em regiao de contraste. junho 2004.

[NIB86] W. A. NIBLACK. Introduction to Digital Image Processing. Prentice Hall,

1986.

[SCY00] Y. S. SOH, B. T. CHUN, and H. S. YOON. Design of real time vehicle

identification system. roceedings of the 1994 IEEE International Conference

on Systems, Man and Cybernetics, San Antonio,TX,USA, Part 3:2147–2152,

2000.

[SER88] J. SERRA. Image Analysis and Mathematical Morphology. Theoretical Ad-

vances, volume 2. Academic Press, 1988.

[SS00] F. P. C. SOUZA and A. SUSIN. Siav - um sistema de identificacao au-

tomatica de veıculos. Anais do XIII Congresso Brasileiro de Automatica -

CBA 2000, 2000.

[TK99] S. THANONGSAK and C. KOSIN. The recognition of car license plate

for automatic parking system. Fifth International Symposium on Signal

Processing and its Applications - Organised by the Signal Processing Research

Centre, QUT, Brisbane, Australia, 1999.

REFERENCIAS BIBLIOGRAFICAS 33

[YGN+03] Y. YANAMURA, M. GOTO, D. NISHIYAMA, M. SOGA, H. NAKATANI,

and H. SAJI. Extraction and tracking of the license plate using hough trans-

form and voted block matching. IEEE, pages 243– 246, 2003.

[YM05] FENG YANG and ZHENG MA. Vehicle license plate location based on

histogramming and mathematical morphology. pages 89– 94, 2005.

[YS05] A. S. YUSUF and M. SARFRAZ. Color edge enhancement based fuzzy

segmentation of license plates. IEEE - Proceedings of the Ninth International

Conference on Information Visualisation (IV 05), 2005.