localização de placas de veículos baseada em métodos estatísticos
DESCRIPTION
Este trabalho tem como objetivo desenvolver um método capaz de localizar a placa do veículo e preparar os caracteres de tal forma que um algoritmo de OCR possa reconhecer e identificá-las, com a mínima intervenção humana. O método proposto utiliza técnicas de processamento de imagens aplicada na análise estatística dos perfis de linha da imagemTRANSCRIPT
PONTIFICIA UNIVERSIDADE CATOLICA DE MINAS GERAIS
Instituto de Informatica
LOCALIZACAO DE PLACAS DE VEICULOS BASEADA EM
METODOS ESTATISTICOS
Edgard Davidson Costa Cardoso
Belo Horizonte
2006
Edgard Davidson Costa Cardoso
LOCALIZACAO DE PLACAS DE VEICULOS BASEADA EM
METODOS ESTATISTICOS
Trabalho de Diplomacao apresentado ao Curso
de Graduacao em Sistemas de Informacao
da Pontifıcia Universidade Catolica de Minas
Gerais, como requisito parcial para obtencao do
Grau de Bacharel em Sistemas de Informacao.
Orientador: Prof. Silvio J. F. Guimaraes, D.Sc..
Belo Horizonte
2006
ii
Edgard Davidson Costa Cardoso
LOCALIZACAO DE PLACAS DE VEICULOS BASEADA EM
METODOS ESTATISTICOS
Trabalho de Diplomacao apresentado ao Curso de
Graduacao em Sistemas de Informacao da Pontifıcia
Universidade Catolica de Minas Gerais, como requisito
parcial para obtencao do Grau de Bacharel em Sistemas
de Informacao.
Aprovada em de 2006
BANCA EXAMINADORA:
Prof: Silvo Jamil F. Guimaraes, D.Sc.
Pontifıcia Universidade Catolica de Minas Gerais
Professor
Pontifıcia Universidade Catolica de Minas Gerais
Professor
Pontifıcia Universidade Catolica de Minas Gerais
Belo Horizonte
2006
iii
Resumo
No meio academico, varias pesquisas vem sendo apresentadas sobre o reconhe-
cimento de placas de veıculos, utilizando o processamento de imagens. A utilizacao de
tecnicas de OCR (Optical Character Recognition) e extremamente importante para a
identificacao de placas de veıculos, em um ambiente controlado ou nao. Entretanto,
o simples fato de utiliza-las, nao garante, suficientemente, a sua perfeita identificacao.
Nesse caso, procedimentos que auxıliem a localizacao e a identificacao da referida placa
devem prover, de forma satisfatoria, a condicao ideal para que o uso do OCR seja eficiente e
eficaz. De fato, o fator crıtico de sucesso para o reconhecimento automatico dos caracteres
contidos na placa e uma etapa anterior de localizacao. Nesse contexto, este trabalho tem
como objetivo desenvolver um metodo capaz de localizar a placa do veıculo e preparar os
caracteres de tal forma que um algoritmo de OCR possa reconhecer e identifica-las, com
a mınima intervencao humana. O metodo proposto utiliza tecnicas de processamento de
imagens aplicada na analise estatıstica dos perfis de linha da imagem.
iv
Lista de Tabelas
4.1 Tabela que demonstra as caracterısticas das imagens utilizadas no trabalho 24
4.2 Tabela que demonstra as caracterısticas de hardware e software utilizados . 25
4.3 Tabela que demonstra os tempos medios obtidos do algoritmo em cada etapa 25
4.4 Tabela que demonstra a taxa de acerto da etapa de localizacao da placa e
da etapa de preparacao dos caracteres, utilizando placas de varios paıses . 26
v
Lista de Figuras
2.1 a) flood-fill com 4 direcoes; b) flood-fill com 8 direcoes . . . . . . . . . . . . 7
2.2 Ilustracao que demonstra o comportamento do perfil de linha em tres linhas
distintas da imagem. a) Imagem Original; b) Perfil de Linha 1 (linha
superior); c) Perfil de Linha 2 (linha central); d) Pefil de linha 3 (linha
inferior) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.1 Visao macro da sequencia logica das etapas . . . . . . . . . . . . . . . . . . 12
3.2 Demonstracao do perfil de linha. a) Imagem original com duas analises
de “assinatura”ortogonais a placa. b) Perfil de linha superior, cortando os
farois. c) Perfil de linha inferior cortando a placa. . . . . . . . . . . . . . . 13
3.3 Identificacao dos pontos de maximos e mınimos, a partir da analise es-
tatıstica do perfil de linha . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4 Linha encontrada com base na analise estatıstica do perfil de linha. . . . . 19
3.5 Regiao encontrada apos analisar a condensacao dos pontos de maximo . . . 20
3.6 Estruturas de dados utilizadas para localizacao da placa a) Estrutura de
dados para localizacao da linha candidata; b) Estrutura de dados usada
para localizar as coordenadas exatas da placa na linha candidata identifi-
cada pela estrutura da Figura a). . . . . . . . . . . . . . . . . . . . . . . . 20
3.7 Area dos caracteres localizada com a utilizacao do flood-fill adaptado. . . . 22
4.1 Resultado do algoritmo de localizacao da placa em diversos nıveis de lumi-
nosidade, angulo de distancia de tomada . . . . . . . . . . . . . . . . . . . 26
4.2 Resultado do algoritmo de preparacao dos caracteres em diversos nıveis de
luminosidade, angulo de distancia de tomada . . . . . . . . . . . . . . . . . 27
4.3 Exemplo de uma situacao em que o metodo proposto falha. 4.3(a) Imagem
da placa indicando um perfil de linha. 4.3(b) Exemplo de um perfil de linha
em que o metodo proposto nao e capaz de identificar a “assinatura”. . . . . 27
vi
Sumario
1 Introducao 1
2 Revisao Bibliografica 5
2.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Flood Fill . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Perfil de Linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3 Metodo Proposto 11
3.1 Localizacao da Placa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2 Preparacao dos Caracteres . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Reconhecimento dos Caracteres . . . . . . . . . . . . . . . . . . . . . . . . 22
4 Experimentos e Resultados 24
5 Conclusao 28
5.1 Sugestao de Estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Bibliografia 30
Capıtulo 1
Introduc ao
O uso de sistemas de informacao baseados em recuperacao de informacoes vem, a
cada dia, se consolidando como uma importante area de estudo, recebendo, consequen-
temente, uma consideravel atencao no meio academico, devido a sua capacidade de criar
mecanismos, que viabilizam o desenvolvimento de tecnicas e metodos, a fim de otimizar
ou automatizar processos de reconhecimento, extracao, indexacao e recuperacao de in-
formacoes de interesse em uma imagem digital.
Apesar de todo o desenvolvimento tecnologico ja alcancado na area da computacao,
a recuperacao de informacoes baseadas na analise de imagens mostra-se muito difıcil e
complexa.
No entanto, mesmo com otimizacoes ou automatizacoes sendo realizadas nos referi-
dos processos, seja no reconhecimento ou extracao de dados, seja na indexacao ou na recu-
peracao desses dados utilizando algoritmos de buscas, ainda existem varios desafios cau-
sados pelo rapido crescimento do volume de informacoes definidas como “interessantes”,
para um determinado grupo de pessoas ou organizacoes, em detrimento da falta de ca-
pacidade em como administra-las.
Contudo, cresce cada vez mais a necessidade de desenvolver sistemas de recu-
1
CAPITULO 1. INTRODUCAO 2
peracao de informacao automaticos, para serem aplicados as varias atividades cotidianas,
a fim de gerar procedimentos eficientes e eficazes, reduzindo, ou ate mesmo eliminando,
processos que ate entao seriam caros, demorados e propensos a erros.
Sobre esse contexto, especificamente na area de processamento de imagens, e
possıvel citar varios exemplos de aplicacao que estao baseadas nessas necessidades, tais
como sensoriameto remoto, robotica, medicina, biometria, reconhecimento otico de carac-
teres, assinaturas, codigos de barras, placa de veıculos, entre outros.
Por sua vez, e possıvel perceber que mesmo essas aplicacoes estando inseridas na
area de processamento de imagens, cada uma necessita de tecnicas ou metodos diferentes,
definindo com isso, uma grande variedade de sub-areas de conhecimento, elevando natu-
ralmente uma grande variacao de pesquisas, muitas vezes utilizadas em conjunto, a fim
de solucionar um determinado tipo de problema.
Um exemplo disso pode ser visto na pesquisa que aborda o reconhecimento da
placa de veıculos. Sobre esse assunto, e possıvel estudar uma variedade de tecnicas, seja
na compreensao de determinadas informacoes contidas na imagem utilizando tecnicas de
OCR (“Optical Recognition Characters”), seja na implementacao de filtros que possi-
bilitem a segmentacao de elementos especıficos em determinadas areas ou na identificacao
de padroes que podem definir um grupo ou varios grupos de dados.
Apesar de, inicialmente, o trabalho de reconhecimento da placa de veıculos parecer
uma aplicacao de solucao trivial, pois o objeto do reconhecimento, a placa, e constituıda
de caracteres impressos com formas bem definidas, induzindo ao pensamento que a simples
utilizacao de um sistema de reconhecimento otico de caractere OCR convencional pode,
sem grande dificuldade, resolver o problema. Entretanto, a realidade mostra o contrario.
Os algoritmos de OCR existentes no mercado nao sao suficientes para reconhecer em uma
imagem, os caracteres contidos na placa de um veıculo. Esse fato poder ser entendido por
meio de varios fatores, entre eles o fato de que:
CAPITULO 1. INTRODUCAO 3
• os algoritmos de OCR trabalham com imagens binarias, ja as imagens de veıculos
sao coloridas ou em nıveis de cinza;
• os referidos algoritmos nao foram concebidos com o proposito de identificar carac-
teres em um ambiente especıfico com o de placa de veıculos;
• a simples segmentacao por meio de uma binarizacao1 da imagem da placa nao e sufi-
ciente para o bom funcionamento do OCR, pois eventualmente essa tecnica sozinha
nao e capaz de segmentar os caracteres.
Alem desses fatores, o reconhecimento da placa do veıculo apresenta caracterısticas
proprias advindas, por exemplo, de diversos efeitos introduzidos por fatores, como a ve-
locidade de deslocamento do veıculo, o angulo de tomada da imagem, a distancia e a
qualidade tecnica do equipamento de captura, a luminosidade natural ou falta da mesma,
sombra, reflexo, diferencas de padrao, estado da placa, entre outras adversidades, que
tornam o problema muito mais complexo de ser tratado.
Apesar da identificacao manual da placa ser uma atividade simples, ela e restrin-
gida com a intrınseca limitacao humana, quando se tem um grande fluxo de veıculos,
caracterizando-se em um processo lento, ou ate mesmo inviavel. Essa limitacao se da pela
falta de uma ferramenta especıfica capaz de fazer a identificacao dos caracteres contidos
nas placas de automoveis. Com um sistema automatizado, o ganho nao se restringe
tao somente ao tempo de resposta, mas principalmente na imediata disponibilidade da
informacao para uso em inumeras aplicacoes.
Um sistema de informacao automatico de reconhecimento da placa de um veıculo
pode auxiliar e aumentar o desempenho de diversos setores, que necessitam desta in-
formacao para desenvolverem seu trabalho e mesmo ampliar para outros usuarios em
potencial. Um sistema de reconhecimento automatico de placas seria um excelente aliado
1Onde a imageme convertida de nıvel de cinza para preto e branco, a partir de um limiar determinado. Valoresabaixo do limiar assumem preto. Valores acima do limiar assumem branco.
CAPITULO 1. INTRODUCAO 4
aos orgaos de fiscalizacao, aos estacionamentos de grande rotatividade, as concessionarias
das rodovias privatizadas e a outros setores que possam fazer uso da informacao colocada
rapidamente a disposicao de forma facilitada e com um custo mais baixo.
O grande problema de identificacao de placa de veıculos e que como ja mencionado,
o simples fato de utilizar um OCR e necessario, entretanto, nao e suficiente para a sua
identificacao. Assumindo este fato como verdade, e necessario, a priori, o desenvolvimento
de um algoritmo que seja capaz de “entender”o que e placa e apos esse “entendimento”,
ser capaz de preparar os caracteres de forma satisfatoria a ponto de que um algoritmo de
OCR possa reconhece-los.
Este trabalho tem como objetivo desenvolver um metodo capaz de localizar a placa
do veıculo e preparar os caracteres, de tal forma que um algoritmo de OCR possa reconhe-
cer e identifica-los, com a mınima intervencao humana. Esse metodo utiliza tecnicas de
processamento de imagens aplicada na analise estatıstica dos perfis de linha da imagem.
O trabalho esta organizado da seguinte forma: No Capıtulo 2, sao apresentadas as
revisoes bibliograficas e as definicoes utilizadas ao longo do trabalho, alem de uma breve
abordagem sobre o estado da arte dos trabalhos relacionados publicados na literatura. O
Capıtulo 3 descreve o metodologia utilizada no trabalho, abordando o metodo de local-
izacao e preparacao dos caracteres da placa, para serem reconhecidos por um algoritmo
de OCR. A analise dos experimentos e os resultados do trabalho sao descritos no Capıtulo
4, onde e possıvel analisar o desempenho do metodo desenvolvido. O Capıtulo 5 descreve
as conclusoes obtidas com o desenvolvimento deste trabalho e as sugestoes de estudos
futuros.
Capıtulo 2
Revisao Bibliografica
2.1 Definicoes
Definicao 2.1.1 Imagem Digital ⇒ Segundo [GW02], uma imagem digital pode ser des-
crita por uma funcao f(x,y), que assume M linhas e N Colunas.
f(x, y) =
f(0, 0) f(0, 1) · · · f(0, N − 1)
f(1, 0) f(1, 1) · · · f(1, N − 1)...
... · · · ...
f(M − 1, 0) f(M − 1, 1) · · · f(M − 1, N − 1)
Definicao 2.1.2 Media Aritmetica ⇒ A media aritmetica pode ser descrita como um
conjunto de n observacoes x1, x2, ..., xn, onde a soma dos valores dessas observacoes e
o quociente da divisao por estas n observacoes. A media e largamente empregada, para
indicar a tendencia central de um conjunto de observacoes[FSC98]. A media aritmetica
e denominada por x:
x =x1 + x2 + ... + xn
n=
∑xi
n(2.1)
5
CAPITULO 2. REVISAO BIBLIOGRAFICA 6
em que xi e o sımbolo que indica a observacao de ordem i, onde i = 1,2,...,n.
Definicao 2.1.3 Variancia ⇒ A variancia e uma medida que indica o grau de dispersao,
ou variabilidade, em relacao ao valor central de um determinado conjunto de observacoes
[FSC98]. Considerando entao a soma dos quadrados dos desvios em relacao a media, e
sendo denotada por s2 e e definida como:
s2 =
∑(xi − x)2
n(2.2)
Definicao 2.1.4 Desvio Padrao ⇒ Ao contrario da variancia que envolve a soma dos
quadrados de um conjunto de observacoes e que nao exprime a mesma unidade do conjunto
de dados original, o desvio padrao atraves do calculo da raız quadrada da variancia e capaz
de obter a mesma unidade de medida dos dados originais [FSC98]. Entao, o desvio padrao
e denotado por s e e definido como:
s =
√∑(xi − x)2
n(2.3)
2.2 Flood Fill
O flood-fill e um algoritmo que tem como proposito preencher areas definidas por
componentes conexos da mesma cor, ou na sua forma estendida, componentes conexos den-
tro de um intervalo de cor. Na sua forma classica o flood-fill necessita de tres parametros:
1- Ponto inicial P (x, y); 2- Nova cor de preenchimento; 3- Cor anterior do componente
conexo. Na sua forma estendida, a cor anterior do componente conexo nao precisa ser
uma cor especıfica, mas um intervalo de cores pre-determinadas.
Existem algumas formas nas quais o algoritmo pode ser estruturado, entretanto ele
sempre usa uma estrutura explıcita ou implıcita de pilha, que e a sua forma recursiva. O
caminhamento do algoritmo pode ser implementado de duas formas: com quatro direcoes,
CAPITULO 2. REVISAO BIBLIOGRAFICA 7
ou com oito direcoes como ilustrado na Figura 2.1. A diferenca e que com oito direcoes,
o algoritmo e capaz preencher areas que o de quatro direcoes nao tem acesso, devido a
vizinhanca que cada um consegue alcancar.
(a) (b)
Figura 2.1: a)flood-fill com 4 direcoes; b)flood-fill com 8 direcoes
2.3 Perfil de Linha
O perfil de linha de uma imagem com 256 tons de cinza e uma projecao da dis-
tribuicao do nıvel de cinza de cada pixel contido em cada posicao ao longo de uma deter-
minada linha. O perfil de linha PLx de uma imagem f poder ser definido por:
PLx = {f(x, y),∀y ∈ [0, N − 1]} (2.4)
onde x e a linha que esta sendo analisada, y e a coluna e N e a largura da imagem f
analisada. [MG04]
(a) (b) (c) (d)
Figura 2.2: Ilustracao que demonstra o comportamento do perfil de linha em tres linhas distintasda imagem. a) Imagem Original; b) Perfil de Linha 1 (linha superior); c) Perfil de Linha 2 (linhacentral); d) Pefil de linha 3 (linha inferior)
CAPITULO 2. REVISAO BIBLIOGRAFICA 8
2.4 Trabalhos Relacionados
No trabalho desenvolvido por [BDRBC97], foi proposto um metodo de localizacao
de placas, baseado no fato de que a area da placa possui um padrao de variacao tonal
diferente do restante da imagem. A essa caracterıstica deu-se o nome de “assinatura”,
que em outras palavras, e a area provavel da localizacao da placa, a partir de um padrao
previamente observado. A referida “assinatura”e caracterizada por sucessivos pontos de
maximos e mınimos, caracterizados pela intercalacao de caracteres e fundo presentes no
perfil de linha, que corta horizontalmente a regiao da placa. Por fim, no referido tra-
balho, apos a localizacao de uma linha que possui as caracterısticas de uma “assinatura”,
a localizacao da placa dar-se-a pela comparacao de caracterısticas pre-definidas empiri-
camente com medidas calculadas dinamicamente, como distancia e amplitude dos pontos
de maximos e mınimos da linha candidata.
A tecnica descrita em [BDRBC97] apresenta um bom desempenho, entretanto, os
autores nao explicitaram como a “assinatura”tratou da dificuldade de identificar quais
pontos maximos e mınimos sao relevantes para a identificacao da assinatura, que muitas
vezes retorna um falso positivo, devido a presenca de outros elementos na imagem com a
mesma caracterıstica.
Para tratar essa dificuldade, [MG04] aperfeicoou o metodo de localizacao de placas
desenvolvido por [BDRBC97], utilizando para isso operadores morfologicos de white-top
hat e black top-hat concebido por [SER88], para filtrar o perfil de linha com o proposito
de diminuir a ocorrencia de falsos positivos na analise da assinatura.
Ja [CPR04] apresentou uma tecnica baseada na variancia do perfil de linha, para
localizar a placa. O algoritmo proposto pelo autor identifica a linha de maior variancia
na imagem, e apos encontrada, e determinada uma faixa otima que segundo o autor,
e a faixa provavel onde esta localizada a placa. Apos encontrada essa faixa otima, o
CAPITULO 2. REVISAO BIBLIOGRAFICA 9
algoritmo percorre novamente a imagem em busca da localizacao da area candidata. Nesta
nova iteracao, o algoritmo encontra o valor do limiar calculado a partir dos valores do
maior e menores picos da linha amostrada. Para analisar os picos encontrados na analise
anterior, o algoritmo trabalha com valores pre-definidos, que caracterizam a largura da
placa. Segundo o autor, a abordagem utilizada no metodo proposto mostrouse eficiente
na localizacao e extracao de placas de veıculos. Entretanto, a referida abordagem, esta
condicionada ao conjunto de imagens testadas. Este fato fica transparente se for observado
que o autor utilizou valores pre-definidos para determinar a faixa otima e para determinar
a largura da placa, alem de nao levar em consideracao a presenca de outros elementos na
imagem com a mesma caracterıstica da “assinatura”.
O trabalho de [SS00] tambem aborda a tecnica de “assinatura”para localizar o
padrao de variacao tonal, efetuando uma busca em toda a imagem a procura de linhas
horizontais que possuam um padrao diferente do restante da imagem. Apos encontrar a
area que mais se enquadra ao padrao da “assinatura”, o algoritmo passa para uma segunda
fase onde a regiao encontrada e binarizada, utilizando o algoritmo Niblack1 proposto por
[NIB86], para ser analisada posteriormente por um algoritmo de procura e verificacao de
dıgitos.
[SCY00] propos um metodo que tambem se enquadra na categoria analise da “assi-
natura”por variacao tonal. O referido trabalho, no entanto, realiza um pre-processamento
aplicando o operador unidimensional Sobel2, que pode ser visto com mais detalhes em
[GW02]. Em cada linha da imagem, utiliza-se uma mascara M = [−1, 0, 1] sobre a ima-
gem para realca-la, afim de explicitar mais o contraste existente entre os caracteres e o
fundo da imagem. O operador Sobel tem o objetivo de pre-processar a imagem, com o
proposito de facilitar a identificacao do perfil que caracteriza a placa. O referido metodo
pode ser visto tambem no trabalho desenvolvido por [FER03]. Os picos encontrados no
1Algoritmo que calcula para cada pixel da imagem a media e o desvio padrao da vizinhanca em torno dele, e aseguir, compara o valor do pixel analisado com o limiarf(x, y). Se o valor do pixel for maior quef(x, y), eleeconsiderado pertencente ao fundo, caso contrario, e considerado pertencente a algum objeto.
2Operador utilizado para realizar a deteccao de borda em uma imagem.
CAPITULO 2. REVISAO BIBLIOGRAFICA 10
perfil de linha menores que um valor Θ e os picos negativos sao descartados. Uma codi-
ficacao em funcao da largura dos picos e feita, resultando em intervalos que representam
as distancias entre os elementos encontrados. A fase subsequente analisa os elementos en-
contrados quanto a suas dimensoes horizontais. Aqueles intervalos que estiverem dentro
das dimensoes esperadas sao agrupados ate formarem grupos com dimensoes proximas as
das placas. Devido a possibilidade de existirem diversas areas candidatas, e necessario
um modo de verificar qual delas e realmente valida. Este procedimento e feito atraves de
uma procura bidirecional nas linhas adjacentes a linha amostrada. Quando um grupo de
linhas e aproximadamente igual a dimensao vertical dos caracteres, este e considerado o
local da placa.
Outro trabalho que tambem apresenta a utilizacao da “assinatura”e o desenvolvido
por [YM05], que como o trabalho de [SCY00] e [FER03], utiliza o operador unidimen-
sional Sobel para determinar areas candidatas a placa e usa a morfologia matematica para
efetivamente localizar a placa.
Dentre os inumeros trabalhos relacionados na literatura que tratam do assunto
desta monografia, foi conveniente destacar aqueles que possuem alguma influencia sobre o
modelo proposto neste trabalho. Entretanto, existe outro grande numero de trabalhos que
utilizaram outros tipos de tecnicas para localizar a placa que valem a pena ser brevemente
citados, como por exemplo o trabalho de [YS05], que utiliza de tecnicas de logica Fuzzy ;
o desenvolvido por [GRT02], [KTK+03], [TK99], que utiliza de redes neurais artificiais,
o proposto por [YGN+03] que localiza a placa utilizando uma combinacao da tecnica de
Hough concebida inicialmente por [Hou62] para localizar linhas em uma imagens e uma
tecnica denominada pelo autor de Voted Block Matching, para localizar a regiao da placa.
Capıtulo 3
Metodo Proposto
Para realizar este trabalho, foram assumidas duas premissas basicas, que condi-
cionaram a forma do desenvolvimento de uma sequencia logica de etapas e, consequen-
temente, dos algoritmos necessarios para o desenvolvimento deste trabalho. As referidas
premissas sao descritas como:
• Eficiente - que o algoritmo proposto percorra o mınimo possıvel na imagem;
• Adaptavel - que o algoritmo se adapte as situacoes de variacao de luminosidade,
contraste e resolucao de cada imagem de forma dinamica.
Tendo em vista que o principal fator crıtico de sucesso para um sistema de iden-
tificacao automatico de placas de veıculos e a fase de localizacao da placa, o metodo
proposto foca principalmente no referido fator crıtico, acreditando que o sucesso de um
OCR depende totalmente do sucesso da etapa de localizacao. Ademais, atrelando aos ob-
jetivos apresentados pelas premissas, condicionou-se ao desenvolvimento de uma sequencia
logica de etapas, que fizesse uso das vantagens apresentadas por cada um dos algoritmos
dos outros trabalhos estudados, evitando suas deficiencias. Sendo assim, as etapas pro-
postas neste trabalho foram escolhidas de forma semelhante aos varios outros trabalhos
publicados na literatura sobre este mesmo assunto, que em outra palavras, sao etapas in-
11
CAPITULO 3. METODO PROPOSTO 12
tuitivas e necessarias para o desenvolvimento de tal trabalho. Como ilustrado da Figura
3.1, as etapas foram divididas em aquisicao da imagem, localizacao da placa, preparacao
dos caracteres e reconhecimento dos caracteres.
Figura 3.1: Visao macro da sequencia logica das etapas
3.1 Localizacao da Placa
A regiao onde a placa esta localizada e caracterizada necessariamente por uma
variacao entre pontos de maximo e de mınimo, intercalados com amplitude e distancia
semelhantes. A referida caracterıstica, deu-se o nome de “assinatura”, inicialmente pro-
posta por [BDRBC97] e tambem utilizada nos trabalhos de [MG04], [CPR04], [SS00],
[SCY00], [FER03]. A “assinatura”pode ser facilmente observada no perfil de linha da
Figura 3.2.
A etapa de localizacao da placa possui como entrada uma imagem digital em nıvel
de cinza, que foi previamente adquirida por algum tipo de equipamento de aquisicao de
imagem, camera digital, filmadora, entre outros. Eventualmente, a imagem adquirida
pode ou nao conter uma placa. Caso nao haja placa na imagem, o algoritmo retorna
as coordenadas da regiao que mais se assemelha as caracterısticas pre-definidas de uma
CAPITULO 3. METODO PROPOSTO 13
Figura 3.2: Demonstracao do perfil de linha. a) Imagem original com duas analises de “assi-natura”ortogonaisa placa. b) Perfil de linha superior, cortando os farois. c) Perfil de linhainferior cortando a placa.
placa. Caso contrario, a etapa de localizacao da placa tem como saıda as coordenadas
referentes a placa. Quem vai dizer se a regiao selecionada e placa ou nao e a etapa de
reconhecimento dos caracteres e sera explicada com detalhes posteriormente.
O metodo utilizado neste trabalho para localizar a placa esta fortemente embasado
na estatıstica descritiva que se justifica para atender a segunda premissa enunciada na
metodologia. A escolha da estatıstica, representada aqui neste trabalho por tres dos seus
varios conceitos: media(x), variancia(s2) e desvio padrao(s), adequa-se muito bem a um
ambiente com situacoes de variacao de luminosidade, contraste e resolucao, como e uma
situacao real de um sistema de localizacao automatica de placa de veıculos. Esses tres
conceitos, na etapa de localizacao da placa, sao utilizados sobre o perfil de linha PLx.
A adocao da estatıstica neste trabalho e necessaria, para que a analise de PLx seja feita
de forma dinamica, afim de encontrar alguns padroes que caracterizam uma placa. Nesta
etapa, os tres conceitos sao utilizados da seguinte forma:
CAPITULO 3. METODO PROPOSTO 14
x(PLx) =
n−1∑y=0
PLx[y]
n(3.1)
s2(PLx) =
n−1∑y=0
(PLx[y]− x(PLx))2
n(3.2)
s(PLx) =√
s2(PLx) (3.3)
A etapa de localizacao da placa inicia-se com uma varredura na imagem em busca
de linhas horizontais, que possuam um padrao de variacao tonal esperado, caracterizando
a “assinatura”. Para reduzir o tempo gasto na procura da placa, as linhas sao amostradas
em intervalos regulares τ . A escolha do valor de τ depende do tamanho dos caracteres
procurados, devendo, entretanto, ser necessariamente menor que a sua dimensao vertical.
Embora quanto maior o valor de τ , mais a premissa de eficiencia citada anteriormente
sera atendida. Uma imagem f de M linhas pode ter o seu processamento reduzido, se as
linhas a serem analisadas na varredura respeitarem a seguinte definicao:
f ′(x′, y) = {f(x, y),∀x ∈ [0, M − 1] ⇔ x mod τ = 0} (3.4)
onde f ′(x′, y) representa as linhas x da imagem f(x, y), se e somente se, a linha x for
multipla de τ . As linhas, sao representadas por x, e y sao as colunas.
Para a compreensao do metodo desenvolvido para localizar a placa, foram criados
dois conceitos: PMax, que representa um ponto de maximo do perfil de linha PLx′ da
imagem f ′ e PMin, que representa um ponto de mınimo do perfil de linha PLx′ da imagem
f ′. Os dois conceitos sao definidos como:
PMax =
{PLx′ [y] ≥
(x(PLx′) +
s(PLx′)
λ
)∀y ∈ [0, N − 1]
}(3.5)
PMin =
{PLx′ [y] ≤
(x(PLx′)− s(PLx′)
λ
)∀y ∈ [0, N − 1]
}(3.6)
CAPITULO 3. METODO PROPOSTO 15
onde PLx′ [y] corresponde ao valor do pixel em cada posicao do perfil de linha PLx′
Como ja citado, a regiao onde a placa se encontra e fortemente caracterizada por
um padrao denominado “assinatura”. No trabalho proposto por [MG04], a placa e lo-
calizada atraves da analise das distancias dos pontos de maximo e mınimo presentes no
padrao da “assinatura”. Nao obstante, outro trabalho com o mesmo proposito desen-
volvido por [CPR04] determina, a partir da variancia do perfil de linha, os pontos de
maximo e mınimo.
Neste trabalho, os pontos de maximo e mınimo sao determinados de forma seme-
lhante aos trabalhos de [MG04] e [CPR04]. Entretanto, a estatıstica e usada de forma
mais efetiva em relacao ao trabalho de [CPR04] e sem a necessidade de pre-processamento
como e o caso do trabalho de [MG04]
Os pontos de maximos PMax e mınimos PMin sao escolhidos, a partir de uma
varredura da esquerda para a direita no perfil de linha PLx′ de cada linha x′ da ima-
gem f ′. A partir de observacoes empıricas do comportamento das caracterısticas da
“assinatura”, nota-se que apenas a utilizacao da media dos valores dos pixels do perfil de
linha e necessaria, entretanto, nao e suficiente para discernir o que e ponto de maximo e
o que e ponto de mınimo de forma coesa.
Observando a diferenca abrupta de tons de cinza referentes ao fundo da placa
em relacao aos seus caracteres, e possıvel notar duas caracterısticas marcantes da “assi-
natura”:
• Uma aplitude dos nıveis de cinza entre o fundo da placa e seus respectivos caracteres.
• Uma condensacao entre os pontos de maximos e mınimos da amplitude.
A partir dessas duas caracterısticas, e entao necessario atribuir duas pre-condicoes,
para diminuir a taxa de falsos positivos:
CAPITULO 3. METODO PROPOSTO 16
• s2(PLx′) < (Θ.x), onde Θ e um multiplicador definido empiricamente, s2(PLx′)
refere-se ao valor da variancia do perfil de linha. Perfil de linhas com amplitude
menor que (Θ.x) sao descartadas.
• Como a regiao da “assinatura”e caracterizada por uma regiao com altas amplitudes
referentes aos pontos de maximos e mınimos e de forma condensada, conforme
ilustrado na Figura 3.3, e necessario atribuir um desvio em relacao a media para
cima e para baixo, que seja suficiente para encontrar os pontos de maximo e mınimos
da “assinatura”e que tambem seja suficiente para descartar regioes que nao possuem
amplitudes como as observadas na “assinatura”. Esse desvio deve ser definido de
forma dinamica, atraves do calculo da media, mediana e desvio padrao do perfil de
linha.
As duas caracterısticas presentes na “assinatura”e a desvio atribuıdo em relacao
ao valor da media do perfil de linha podem ser visualizados na Figura 3.3.
Figura 3.3: Identificacao dos pontos de maximos e mınimos, a partir da analise estatıstica doperfil de linha
Para que um ponto seja considerado como ponto de maximo, ele deve possuir um
tom de cinza maior que a media somada com a metade do desvio padrao correspondente.
Para o ponto de mınimo, o raciocınio e o mesmo, modificando apenas que o pixel deve
ser menor que a media subtraıda da metade do desvio padrao correspondente. Alem
CAPITULO 3. METODO PROPOSTO 17
dessa regra para a escolha dos pontos de maximo e mınimo, uma vez que um ponto
foi considerado como ponto de maximo, o proximo ponto so podera ser um ponto de
mınimo, sequenciamente, o proximo ponto so podera ser um ponto de maximo, e assim
sucessivamente intercalando pontos de maximo e mınimo, ate atingir o final do perfil de
linha. Como pode ser notado na Figura 3.3, os pontos de maximo nao sao necessariamente
os picos do perfil de linha. Nesse caso, o ponto de maximo passa a ser o primeiro ponto
que respeita a logica descrita acima, o mesmo acontecendo com os pontos de mınimo.
Apos definido o conceito de PMax e PMin e entendido o processo de discernir o que
e ponto de maximo e o que e ponto de mınimo, e necessario a compreensao de mais dois
conceitos: LPMax, que representa uma lista contendo as ocorrencias dos pontos de maximo
de cada perfil de linha PLx′ da imagem f ′. E, LPMin, que tem o mesmo sentido de LPMax
,
no entanto, contendo as ocorrencias dos pontos de mınimo.
flagMax[xi] =
{1, se PLx′ [y] = PMax
0, se PLx′ [y] 6= PMax
(3.7)
flagMin[xi] =
{1, se PLx′ [y] = PMin
0, se PLx′ [y] 6= PMin
(3.8)
onde y ∈ [0, N − 1] e xi ∈ [0, N − 1] .
LPMax[x′] =
{N−1∑xi=0
flagMax[xi] ∈ PLx′ ,∀PLx′ ∈ f ′(x′, y)
}(3.9)
LPMin[x′] =
{N−1∑xi=0
flagMin[xi] ∈ PLx′ ,∀PLx′ ∈ f ′(x′, y)
}(3.10)
Para definir em qual linha esta situada a placa, as listas LPMaxe LPMin
sao anali-
sadas. As duas listas nao precisam ser analisadas em conjunto, sendo assim, este trabalho
referenciara apenas a lista LPMax. No entanto, a analise tambem pode ser feita sobre a
lista LPMin.
CAPITULO 3. METODO PROPOSTO 18
Como ja dito, a placa e caracterizada por sucessivos pontos de maximos e mınimos,
intercalados com amplitude e distancia semelhantes. Toda a metodologia de escolha
de pontos de maximo e mınimo ja foi previamente elaborada, para que o Max(LPMax)
contenha a assinatura procurada, onde Max(LPMax) e a posicao da lista LPMin
com o
maior numero de pontos de maximo.
Para verificar a veracidade do metodo, os elementos vizinhos de Max(LPMax), ou
seja, os V (Max(LPMax)), tambem sao analisados, para diminuir a taxa de falsos positivos
se, eventualmente, a linha encontrada em Max(LPMax) possuir ruıdos ou pertubacoes,
que possuam a mesma caracterıstica esperada para a placa. A analise dos vizinhos e
realizada da seguinte forma: a linha de cima e a linha de baixo da linha encontrada em
Max(LPMax) sao verificadas, a fim de saber qual das duas contem o maior numero de
PMax . Apos encontrada qual das duas possui o maior numero de PMax. Essa linha e
analisada com a linha encontrada em Max(LPMax). Se a linha vizinha a Max(LPMax
)
com o maior numero de PMax for pelo menos δ%deMax(LPMax), entao a linha contida em
Max(LPMax) e caracterizada como a linha provavel para a placa. Caso a condicao nao
seja aceita, e feita uma nova busca na lista de LPMax, buscando agora a segunda posicao
que contem o maior numero de PMax. Os passos descritos acima se repetem ate obter um
valor que seja pelo menos δ%deMax(LPMax), ou entao, ate que todas as posicoes da lista
LPMaxsejam analisadas, ate concluir que a imagem nao possui placa .
Apos o processo descrito acima, e esperado em uma imagem que contenha a placa
o seguinte resultado, conforme Figura 3.4
Para localizar a regiao que mais se caracteriza como uma placa ao longo da linha
ilustrada na Figura 3.4, o perfil de linha e submetido novamente a uma inspecao. Neste
ponto, a busca para de ser vertical e passa a ser horizontal, ou seja, apos encontrar a
linha x′ que mais se enquadra ao padrao esperado para a ‘assinatura”, o objetivo agora
e determinar em qual posicao efetivamente comeca e termina a regiao delimitada pela
CAPITULO 3. METODO PROPOSTO 19
Figura 3.4: Linha encontrada com base na analise estatıstica do perfil de linha.
placa.
O algoritmo percorre o perfil de linha, criando uma nova lista com o calculo da
distancia entre cada ponto de maximo ou de cada ponto de mınimo, referentes as distancias
de duas posicoes y do perfil de linha PLx′ . Apos percorrer o perfil de linha e preencher a
estrutura de dados ilustrada na Figura 3.6 b), o algoritmo utiliza novamente os conceitos
estatısticos de media(x), variancia(s2) e desvio padrao(s). Os tres valores estatısticos sao
calculados, a partir da lista que foi criada com os calculos das distancias. Esta operacao
pode ser descrita pela definicao a seguir:
Linf ={
x +s
α
}(3.11)
Ldis[xi] > Linf , f lag = 1 (3.12)
Ldis[xi] ≤ Linf , f lag = 0 (3.13)
onde α e um valor inteiro suficiente para separar as distancias maiores das distancias
menores. Linf caracteriza o limite inferior, que servira como um limiar para separar
distancias entre dois pontos maior de distancia entre dois pontos menores. Os valores
de distancia da lista de distancias Ldis[xi] maiores que Linf assumem flag = 1, caso
contrario, assumem flag = 0. E s representa o desvio padrao das distancias de pontos de
maximo.
Observando o perfil de linha da Figura 3.3, e notavel que existe uma regiao onde
CAPITULO 3. METODO PROPOSTO 20
os pontos de maximo e de mınimos estao mais condensados. A definicao acima busca
exatamente localizar a referida condensacao, atribuindo 0 para as distancias maiores e 1
para as distancias curtas. A regiao da lista Ldis com a maior condensacao de valores 1
e considerada como a regiao da placa e as coordenadas sao remetidas como ilustrado na
Figura 3.5.
Figura 3.5: Regiao encontrada apos analisar a condensacao dos pontos de maximo
As estruturas de dados usadas para localizar a linha candidata a placa e a estrutura
usada para localizar as coordenadas exatas das linhas candidatas estao ilustradas nas
Figuras 3.6 a) e b), respectivamente.
(a) (b)
Figura 3.6: Estruturas de dados utilizadas para localizacao da placa a) Estrutura de dados paralocalizacao da linha candidata; b) Estrutura de dados usada para localizar as coordenadas exatasda placa na linha candidata identificada pela estrutura da Figura a).
CAPITULO 3. METODO PROPOSTO 21
3.2 Preparacao dos Caracteres
Apos a etapa de localizacao da placa, onde as coordenadas referentes a possıvel
localizacao da placa sao identificadas. A etapa de preparacao dos caracteres tem o objetivo
de analisar a area delimitada pelas referidas coordenadas, afim de obter as areas de cada
caracter segmentada e binarizada da imagem original. Contudo, isso em condicoes que
facilite e aumente a precisao de um algoritmo de OCR. Caso nao haja um caracter na
area segmentada, esta etapa tera como saıda coordenadas erroneas de areas que mais se
adequam a logica do algoritmo descrito a seguir.
A etapa de preparacao dos caracteres, por sua vez, tambem utiliza as medidas
estatısticas de media(x), variancia(s2) e desvio padrao(s). Os tres valores estatısticos sao
calculados a partir do perfil de linha PLx′ encontrado na etapa de localizacao da placa,
que mais se assemelha ao padrao de “assinatura”procurado corretamente delimitado pela
regiao encontrada apos analisar a condensacao dos pontos de maximo. A estatıstica
descritiva e novamente utilizada nesta etapa para garantir que o metodo continue sendo
adaptavel com variacao de iluminacao e contraste.
O objetivo desta etapa e separar cada caracter contido na placa e trata-los separa-
damente. Uma versao adaptada do algoritmo flood-fill foi formulada neste trabalho, para
que a segmentacao dos caracteres fosse possıvel. Para entender como o flood-fill se tornou
adaptavel, segue a definicao de como a CorAntiga e atribuıda:
CorAntiga = {x(PLx)} (3.14)
ou seja, CorAntiga recebe a media dos nıveis de cinza de PLx′ , delimitado pela area
encontrada apos analisar a condensacao dos pontos de maximo.
O algoritmo percorre o perfil de linha da esquerda para direita e quando encontrar
CAPITULO 3. METODO PROPOSTO 22
um pixel menor que CorAntiga, ou seja, 0 < CorNova < CorAntiga, o algoritmo executa
o flood-fill e a area encontrada e caracterizada como um caractere. Essa busca e realizada
ate encontrar o final de PLx′ .
A Figura 3.7 ilustra as areas dos caracteres encontrados apos a utilizacao do flood-
fill adaptado, onde cada caracter foi separado e binarizado, e esta pronto para ser enviado
para um OCR.
Figura 3.7:Area dos caracteres localizada com a utilizacao doflood-fill adaptado.
3.3 Reconhecimento dos Caracteres
Apos a localizacao da placa e preparacao dos caracteres, ja e possıvel utilizar um
OCR com objetivo de reconhecer os caracteres referentes a placa. Se eventualmente nao
for reconhecido nenhum caracter ou se os caracteres reconhecidos nao caracterizarem uma
placa com os padroes nacionais de transito, esta etapa tem como saıda uma sinalizacao
que indica que o processo devera ser reiniciado a partir da etapa localizacao dos caracteres.
Entretanto, agora o valor de x′ referente nao mais a Max(LPMax) e Max(LPMin
) presentes
na primeira iteracao, mas referente a segunda maior quantidade de pontos de maximo
e mınimo. A lista completa de todos os valores em ordem decrescentes dos pontos de
maximo e mınimo LPMaxe LPMin
ja foi previamente armazenada em memoria na etapa
de localizacao da placa. Se a nova iteracao falhar novamente, todo processo podera ser
realizado novamente ate o numero total de x′ ou ate um limite de iteracoes previamente
estabelecido. Para reconhecer os caracteres, este trabalho utilizou uma ferramenta OCR
de terceiros. Entendendo que o simples fato de utilizar um OCR nao e suficiente para a
CAPITULO 3. METODO PROPOSTO 23
sua identificacao e que a referida ferramenta ja e uma tecnologia dominada e consagrada
no mercado e no meio academico, atingido um alto nıvel de acertos.
Capıtulo 4
Experimentos e Resultados
Para realizar este trabalho, foi coletada uma base de dados de imagens, que se en-
contram em situacao de ambiente controlado. Um ambiente controlado necessariamente e
um ambiente que propicia o mesmo angulo de tomada, na mesma distancia e mesmo grau
de luminosidade. Um ambiente dito controlado pode ser encontrado em entradas de shop-
ping ou estacionamento, como e o caso das imagens utilizadas neste trabalho. A escolha
de imagens em um ambiente controlado sao necessarias para diminuir a complexidade dos
algoritmos, agindo pontualmente em uma determinada dificuldade e aumentando assim a
probabilidade de acerto. A Tabela 4.1 demonstra as caracterısticas das imagens utilizadas
neste trabalho. Para realizar os experimentos, foram coletadas imagens com exemplos de
placas de varios paıses do mundo com diferentes dimensoes.
Banco de dados de imagemNumero de Imagens 139Resolucao 96 DPICores 256 Cores (8BitsPorPixel)Tipo de Arquivo JPG
Tabela 4.1: Tabela que demonstra as caracterısticas das imagens utilizadas no trabalho
Foi utilizado para processar as imagens um computador com as configuracoes des-
critas na Tabela 4.2
As etapas de localizacao da placa e preparacao dos caracteres mostrou extrema-
24
CAPITULO 4. EXPERIMENTOS E RESULTADOS 25
Configuracao utilizadaProcessador AMD Athlon(TM)XP 2600+ 1.92GHzMemoria 256MBSistema Operacional Windows XP ProfessionalLinguagem deProgramacao Delphi 7
Tabela 4.2: Tabela que demonstra as caracterısticas de hardware e software utilizados
mente eficiente do ponto de vista de tempo de processamento. Como um dos principais
objetivos desta proposta e localizar a placa e preparar os caracteres para o reconheci-
mento em um OCR, de forma que o algoritmo percorra o mınimo possıvel da imagem.
Esse objetivo foi alcancado na etapa para localizar os pontos de maximo PMax e pontos
de mınimo PMin, onde o algoritmo passa a trabalhar com a imagem f ′(x′, y) e nao mais
com a imagem original f(x, y), alem das pre-condicoes como o perfil de linhas com am-
plitude menor que (Θ . x) serem descartados e perfis de linhas que nao se enquadram
no padrao da “assinatura”tambem serao descartados. Com a utilizacao conjunta desses
metodos, a quantidade de pixels a serem analisados na imagem original f(x, y) diminuem
significamente, o que pode ser observado com os dados demonstrados na Tabela 4.3
Tempos ObtidosEtapa em milesegundos em segundosLocalizacao da Placa 32 ms p/imagem 31,25 imagens p/sPreparacao dos Caracteres 15 ms p/imagem 66,66 imagens p/sOCR 80 ms p/imagem 12,50 imagens p/sTotal 127 ms p/imagem 7,87 imagens p/s
Tabela 4.3: Tabela que demonstra os tempos medios obtidos do algoritmo em cada etapa
Cada conjunto de imagem de cada paıs analisado possui caracterısticas proprias
quanto a iluminacao, distancia e angulo de tomada, alem de possuir padroes de numeracao
especıficos para cada paıs, como pode ser visto na Figura 4.1. Entretanto, para o algo-
ritmo, os referidos fatos sao indiferentes, levando em consideracao que a busca pela placa
e realizada da mesma forma e entendendo que o fator crıtico de sucesso do algoritmo e
que apenas o veıculo esteja contido na imagem. Imagem que alem da presenca do veıculo,
contenha tambem outros objetos que nao pertencem ao automovel aumenta considerav-
elmente a possibilidade de haver outra regiao com as mesmas caracterısticas esperadas
CAPITULO 4. EXPERIMENTOS E RESULTADOS 26
para “assinatura”. Os conjuntos de imagens exemplificados pela Figura 4.1 demonstram
um ambiente ideal para o sucesso do algoritmo. O desempenho da etapa de localizacao
da placa e da etapa de preparacao dos caracteres e apresentado na Tabela 4.4
Desempenho do AlgoritmoPaıs No de Images Localizacao da placa Preparacao dos Caracteres
Brasil 31 27 - 87,0% 16 - 51,6%Holanda 39 39 - 100% 31 - 79,4%
Israel 39 37 - 94,8% 29 - 74,3%Australia 30 27 - 90% 14 - 46,6%
Tabela 4.4: Tabela que demonstra a taxa de acerto da etapa de localizacao da placa e da etapade preparacao dos caracteres, utilizando placas de varios paıses
(a) Brasil (b) Holanda
(c) Israel (d) Australia
Figura 4.1: Resultado do algoritmo de localizacao da placa em diversos nıveis de luminosidade,angulo de distancia de tomada
Neste trabalho, foram criadas duas premissas que presavam a eficiencia e a adap-
tabilidade do algoritmo proposto. As referidas premissas foram elaboradas para efetivar
o desenvolvimento de um metodo que diminuısse a taxa de particularidade de algoritmos
ja desenvolvidos. Tais particularidades podem ser percebidas no trabalho de [SCY00],
que apesar de ser eficiente do ponto de vista de velocidade de processamento, demonstrou
ser segundo o autor, pouco eficaz no que diz respeito a sua exposicao em condicoes de
iluminacao variaveis. Entretanto, outro algoritmo desenvolvido por [CBW98] apresentou
ser eficiente quanto a variacao de iluminacao, mas em contrapartida, tambem segundo o
autor, apresentou ser pouco eficiente no quesito tempo de processamento.
CAPITULO 4. EXPERIMENTOS E RESULTADOS 27
(a) Brasil (b) Holanda
(c) Israel (d) Australia
Figura 4.2: Resultado do algoritmo de preparacao dos caracteres em diversos nıveis de lumi-nosidade,angulo de distancia de tomada
Contudo, o algoritmo apresentado neste trabalho mostrou-se eficiente no quesito
tempo de processamento e adaptavel as varias condicoes de iluminacao diferentes, sem
comprometer o tempo gasto. No entanto, foi possıvel observar que em algumas situacoes
o algoritmo falha. A Figura 4.3 demonstra uma situacao tıpica na qual o algoritmo nao e
capaz de localizar a placa, levando a sinalizacao de um ponto onde o processo nao alcancou
resultado satisfatorio.
Como pode ser notado, as tres linhas que representam a media x, a media mais
metade do desvio padrao x+ s2
e a linha que representa a media menos a metade do desvio
padrao x − s2
passam acima da area que representa a “assinatura”. Este fato se da pela
alta concentracao de pixels com tons de cinza proximos a branco, o que leva a media para
cima, gerando a ineficiencia do algoritmo nestes casos.
(a)
(b)
Figura 4.3: Exemplo de uma situacao em que o metodo proposto falha. 4.3(a) Imagem da placaindicando um perfil de linha. 4.3(b) Exemplo de um perfil de linha em que o metodo propostonaoe capaz de identificar a “assinatura”.
Capıtulo 5
Conclusao
A partir de experimentos realizados neste trabalho em imagens de veıculo em
um ambiente controlado, notou-se que as duas premissas de adaptabilidade e eficiencia
descritas no trabalho foram alcancadas. Este fato pode ser observados na Tabela 4.3
que demonstrou o tempo gasto para processamento das imagens na etapa de localizacao
e preparacao dos caracteres e, na Figura 4.3, que demonstra varios tipos de angulo de
tomada, distancia, iluminacao e contraste.
O processo de reconhecimento dos caracteres contidos em uma placa depende forte-
mente do metodo utilizado para encontra-la e prepara-la. Com a utilizacao de tecnicas de
processamento de imagens aplicada na analise estatıstica dos perfis de linha da imagem,
possibilitou, principalmente, atraves da analise estatıstica, que o algoritmo trabalhasse
com valores obtidos dinamicamente e, por sua vez, adaptavel a situacoes diversas de
iluminacao.
Neste trabalho, a localizacao da placa de veıculo em um cenario controlado ocorreu
de forma satisfatoria do ponto de vista do que era esperado no inıcio do trabalho, com
o ındice de 93% de acerto, sendo que em alguns ambientes, como o caso do grupo de
imagens de automoveis holandesas, obteve 100% de acerto.
28
CAPITULO 5. CONCLUSAO 29
Diferentemente da etapa de localizacao placa, a etapa de preparacao dos caracte-
res apesar de tambem ser embasada sobre valores obtidos atraves de analise estatıstica,
demonstrou um nıvel de acerto abaixo do esperado, com 64% de acerto. No entanto, a
preparacao dos caracteres pode ser descartada se o algoritmo de OCR utilizado sofisticado
o suficiente para realizar esta etapa. Em outras palavras, em um processo de identificacao
automatico dos caracteres contidos em um placa de veıculo, o fator crıtico de sucesso e
a localizacao da placa, ou seja, se esta etapa falhar, todos as outras etapas subsequentes
falharao e foi nessa etapa que este trabalho teve seu foco.
5.1 Sugestao de Estudos
Algumas melhorias podem ser realizadas como trabalhos futuros para aperfeicoar
as tecnicas utilizadas neste trabalho. Uma melhoria que poderia ser realizada e quanto a
etapa de preparacao dos caracteres. Neste trabalho, como pode ser observado na Tabela
4.4, houve um baixo ındice de acerto. No entanto, apos a placa ja ter sido localizada, a
etapa de preparacao dos caracteres deve apenas preparar a referida area, para que um
algoritmo de OCR possa ter um resultado mais efetivo. Algumas abordagens podem ser
utilizadas, como por exemplo, melhorar a forma que o flood-fill segmenta os caracteres ou
realizar binarizacoes adaptativas, como as conhecidas Otsu, Niblack; ou utilizar tecnicas
de realce de borda, como Cany ; ou ate mesmo utilizar morfologia matematica, para
tentar resolver o problema. Em outras palavras, a etapa de preparacao dos caracteres
deve separar os caracteres dos outros objetos conexos existentes na regiao resultante da
etapa de localizacao da placa.
Outra melhoria que pode ser realizada e quanto a inclinacao da placa. Neste tra-
balho, a tolerancia quanto a inclinacao e pequena, visto que para o sucesso da localizacao,
a inclinacao da placa deve ser de tal forma que o perfil de linha deve pegar o primeiro e
o ultimo caracter da placa.
CAPITULO 5. CONCLUSAO 30
Quanto a falha apresentada e ilustrada na Figura 4.3, uma alternativa para pesquisas
futuras seria talves, nos casos especıficos nas quais o algoritmo falha, executar um pre-
processamento de forma que uma eventual alta concentracao de pixels proximos de brancos
ou pixels proximos de pretos seja contornada, com metodos como white-top hat e black
top-hat concebidos por [SER88].
Referencias Bibliograficas
[BDRBC97] J. BARROSO, E.L. DAGLESS, A. RAFAEL, and J. BULAS-CRUZ. Number
plate reading using computer vision. IEEE - International Sympositum on
Industrial Eletronics ISIE’97 Universidade do Minho, Guimaraes, Jul 1997.
[CBW98] C. COETZEE, C. BOTHA, and D. WEBER. Pc based number plate recog-
nition system. Proceedings of IEEE International Conference on Industrial
Electronics, 1998.
[CPR04] B. G. CUNHA, J. F. PEREIRA, and W. S. M. RIBEIRO. Localizacao
de placas de veıculos utilizando tecnicas de variancia. PRAXIS - Revista do
Instituto Luterano de Ensino Superior de Itumbiara, (5):23–25, jul/dez 2004.
[FER03] A. P. P. FERREIRA. Sistema de Identificacao Automatica de Matrıculas
em Veıculos Automoveis. PhD thesis, Instituto Superior de Engenharia de
Lisboa, 2003.
[FSC98] A. A. FARIAS, J. F. SOARES, and C. C. CESAR. Introducao a Estatıstica.
Rio de Janeiro :LTC 2. ed., 1998.
[GRT02] C.B. GUINGO, R. J. RODRIGUES, and A. C. G. THOME. Reconhecimento
automatico de placas de veıculos automotores atraves de redes neurais arti-
ficiais. 2o. Congresso Brasileiro de Computacao, 2002.
[GW02] R. C. GONZALEZ and R. E. WOODS. Digital Image Processing. Prentice
Hall, 2002.
31
REFERENCIAS BIBLIOGRAFICAS 32
[Hou62] P. V. C. Hough. A method and means for recognizing complex patterns.
U.S. Patent No. 3,069,654, 1962.
[KTK+03] V. KOVAL, V. TURCHENKO, V. KOCHAN, A. SACHENKO, and
G. MARKOWSKY. Smart. license plate recognition system based on image
processing using neural network. IEEE Internatioanl Workshop on Intel-
ligent Data Acquisition and Advanced Comuting Systems: Technology and
Appticationi. Proceedings of the Second IEEE International Workshop, pages
123 – 127, 2003.
[MG04] J. C. MELO and S. J. F. G. GUIMARAES. Definicao de assinatura de placas
de veıculos com base em regiao de contraste. junho 2004.
[NIB86] W. A. NIBLACK. Introduction to Digital Image Processing. Prentice Hall,
1986.
[SCY00] Y. S. SOH, B. T. CHUN, and H. S. YOON. Design of real time vehicle
identification system. roceedings of the 1994 IEEE International Conference
on Systems, Man and Cybernetics, San Antonio,TX,USA, Part 3:2147–2152,
2000.
[SER88] J. SERRA. Image Analysis and Mathematical Morphology. Theoretical Ad-
vances, volume 2. Academic Press, 1988.
[SS00] F. P. C. SOUZA and A. SUSIN. Siav - um sistema de identificacao au-
tomatica de veıculos. Anais do XIII Congresso Brasileiro de Automatica -
CBA 2000, 2000.
[TK99] S. THANONGSAK and C. KOSIN. The recognition of car license plate
for automatic parking system. Fifth International Symposium on Signal
Processing and its Applications - Organised by the Signal Processing Research
Centre, QUT, Brisbane, Australia, 1999.
REFERENCIAS BIBLIOGRAFICAS 33
[YGN+03] Y. YANAMURA, M. GOTO, D. NISHIYAMA, M. SOGA, H. NAKATANI,
and H. SAJI. Extraction and tracking of the license plate using hough trans-
form and voted block matching. IEEE, pages 243– 246, 2003.
[YM05] FENG YANG and ZHENG MA. Vehicle license plate location based on
histogramming and mathematical morphology. pages 89– 94, 2005.
[YS05] A. S. YUSUF and M. SARFRAZ. Color edge enhancement based fuzzy
segmentation of license plates. IEEE - Proceedings of the Ninth International
Conference on Information Visualisation (IV 05), 2005.