04-juarez chambi, ronald m

6
1 Verificación e identificación de firmas offline mediante el análisis de imágenes con redes complejas Autor: Ronald M. Juarez Chambi Asesor: Dr. César A. Beltrán Castañón [email protected] [email protected] Facultad de Ciencias e Ingeniería Sección Ingeniería Informática Pontificia Universidad Católica del Perú Lima, Perú ResumenLa firma manuscrita es el medio más común para identificar la validez de un documento. Los procesos de verificación e identificación de estas son realizados de forma manual por peritos caligráficos que utilizan criterios generalmente subjetivos. Varias técnicas se han propuesto para apoyar en la solución de este problema mediante el uso de algoritmos computacionales, pero el problema sigue abierto. El presente trabajo desarrolla de manera inédita la aplicación de redes complejas para la caracterización, y posterior verificación e identificación de una firma offline. Las redes complejas pueden ser consideradas entre las áreas de teoría de grafos y la mecánica estadística, y se caracterizan por poseer propiedades adecuadas para el reconocimiento de formas, las cuales presentan invariancia a la rotación, escala, trazado y ruido de la imagen. Previamente, las imágenes de las firmas offline fueron pre-procesadas para obtener una versión esqueletizada de la misma, para tener una imagen más adecuada para la extracción de características. Para los experimentos se trabajó con una base de datos de imágenes de firmas offline de 960 personas, y se alcanzó una tasa de acierto de 85.12% en la identificación y de 76.11% para la verificación. Esto demuestra que la metodología utilizada con redes complejas otorga un auspicioso camino para los procesos de identificación y verificación de firmas de personas y usarlas en diferentes aplicaciones prácticas como trámites documentarios y validaciones de padrones electorales. Finalmente, esta nueva metodología de autenticación de firmas basada en redes complejas, incrementa el estado del arte del área. Palabras claveRedes complejas, reconocimiento de patrones, verificación de firmas, procesamiento de imágenes digitales, análisis de formas. I. INTRODUCCIÓN El proceso de verificación e identificación de firmas ológrafas es utilizado en muchas entidades públicas y privadas en cualquier tipo de documento, para cualquier tipo de trámite, del mismo modo una aplicación muy común es la identificación de firmas en los padrones electorales. Entiéndase verificar o reconocer como la situación en que la persona dice ser el dueño de la firma y se necesita comparar su firma con la que se encuentra en una base de datos fidedigna y entiéndase por identificar cuándo se desconoce la identidad de la persona y se necesita comparar su firma en una base de datos hasta encontrar la que más se parezca. Este trabajo es realizado por personas especializadas con pericia caligráfica; lo cual, como cualquier proceso manual, es lento y con una alta dependencia del criterio subjetivo del especialista. Aunque existen algunos aplicativos en el mercado de software, estos no garantizan una tasa alta de identificación y menos de verificación. El presente trabajo propone una alternativa para suplir la necesidad de verificación de firmas automatizada mediante un algoritmo que compare dos firmas para encontrar un nivel de similitud aceptable entre estas y así autenticar su validez. Para ello se trabajó sobre una base de datos de imágenes de 960 grupos de firmas offline, cada grupo conformado por 54 firmas, de las cuales 24 son genuinas y 30 falsas. Cada grupo de firmas pertenece a una persona. Para comparar las firmas mediante el análisis de las imágenes, se estableció tres pasos: pre-procesamiento, extracción de características y clasificación. El pre-procesamiento consistió en la identificación de los píxeles que conforman la imagen, considerando que las firmas pueden tener diferente grosor se aplicó el algoritmo de adelgazamiento iterativo de Pavlidis [1], con el fin de obtener una representación esqueletizada de la firma. Ello permite llevar a una representación de red compleja más adecuada. Para la extracción de características se aplicaron las propiedades de conectividad de redes complejas, consiguiendo conformar un vector de características de dimensión 26. Estos vectores de características se constituyen en la entrada para el proceso de comparación mediante una red neuronal perceptron multicapa, para lo cual se define un umbral mínimo que sirve como indicador de similitud. El método propuesto, basado en redes complejas, realiza un eficiente trabajo de caracterización de las formas por mostrar un buen grado de robustez a la falta de información, tolerante al ruido e invariante en escala y rotación. A continuación se desarrolla el artículo, en la sección II se muestra el estado del arte, Sección III describe la teoría de redes complejas y sus propiedades, la Sección IV describe la propuesta de caracterización de las firmas offline mediante redes complejas; finalmente se presentan los resultados, Sección V, y conclusiones, Sección VI.

Upload: horacio-marmoto

Post on 31-Jan-2016

5 views

Category:

Documents


0 download

DESCRIPTION

04-Juarez Chambi, Ronald M

TRANSCRIPT

Page 1: 04-Juarez Chambi, Ronald M

1

Verificación e identificación de firmas offline

mediante el análisis de imágenes con redes complejas

Autor: Ronald M. Juarez Chambi Asesor: Dr. César A. Beltrán Castañón

[email protected] [email protected] Facultad de Ciencias e Ingeniería – Sección Ingeniería Informática

Pontificia Universidad Católica del Perú

Lima, Perú

Resumen— La firma manuscrita es el medio más común para identificar la validez de un documento. Los procesos de

verificación e identificación de estas son realizados de forma manual por peritos caligráficos que utilizan criterios

generalmente subjetivos. Varias técnicas se han propuesto para apoyar en la solución de este problema mediante el uso de

algoritmos computacionales, pero el problema sigue abierto. El presente trabajo desarrolla de manera inédita la

aplicación de redes complejas para la caracterización, y posterior verificación e identificación de una firma offline. Las

redes complejas pueden ser consideradas entre las áreas de teoría de grafos y la mecánica estadística, y se caracterizan

por poseer propiedades adecuadas para el reconocimiento de formas, las cuales presentan invariancia a la rotación,

escala, trazado y ruido de la imagen. Previamente, las imágenes de las firmas offline fueron pre-procesadas para obtener

una versión esqueletizada de la misma, para tener una imagen más adecuada para la extracción de características. Para

los experimentos se trabajó con una base de datos de imágenes de firmas offline de 960 personas, y se alcanzó una tasa de

acierto de 85.12% en la identificación y de 76.11% para la verificación. Esto demuestra que la metodología utilizada con

redes complejas otorga un auspicioso camino para los procesos de identificación y verificación de firmas de personas y

usarlas en diferentes aplicaciones prácticas como trámites documentarios y validaciones de padrones electorales.

Finalmente, esta nueva metodología de autenticación de firmas basada en redes complejas, incrementa el estado del arte

del área.

Palabras clave—Redes complejas, reconocimiento de

patrones, verificación de firmas, procesamiento de

imágenes digitales, análisis de formas.

I. INTRODUCCIÓN

El proceso de verificación e identificación de firmas

ológrafas es utilizado en muchas entidades públicas y

privadas en cualquier tipo de documento, para cualquier

tipo de trámite, del mismo modo una aplicación muy

común es la identificación de firmas en los padrones

electorales. Entiéndase verificar o reconocer como la

situación en que la persona dice ser el dueño de la firma y

se necesita comparar su firma con la que se encuentra en

una base de datos fidedigna y entiéndase por identificar

cuándo se desconoce la identidad de la persona y se

necesita comparar su firma en una base de datos hasta encontrar la que más se parezca.

Este trabajo es realizado por personas especializadas

con pericia caligráfica; lo cual, como cualquier proceso

manual, es lento y con una alta dependencia del criterio

subjetivo del especialista. Aunque existen algunos

aplicativos en el mercado de software, estos no

garantizan una tasa alta de identificación y menos de

verificación. El presente trabajo propone una alternativa

para suplir la necesidad de verificación de firmas

automatizada mediante un algoritmo que compare dos

firmas para encontrar un nivel de similitud aceptable

entre estas y así autenticar su validez. Para ello se trabajó

sobre una base de datos de imágenes de 960 grupos de

firmas offline, cada grupo conformado por 54 firmas, de

las cuales 24 son genuinas y 30 falsas. Cada grupo de

firmas pertenece a una persona. Para comparar las firmas

mediante el análisis de las imágenes, se estableció tres

pasos: pre-procesamiento, extracción de características y

clasificación. El pre-procesamiento consistió en la

identificación de los píxeles que conforman la imagen,

considerando que las firmas pueden tener diferente

grosor se aplicó el algoritmo de adelgazamiento iterativo

de Pavlidis [1], con el fin de obtener una representación

esqueletizada de la firma. Ello permite llevar a una

representación de red compleja más adecuada. Para la

extracción de características se aplicaron las propiedades

de conectividad de redes complejas, consiguiendo

conformar un vector de características de dimensión 26.

Estos vectores de características se constituyen en la

entrada para el proceso de comparación mediante una red

neuronal perceptron multicapa, para lo cual se define un

umbral mínimo que sirve como indicador de similitud. El

método propuesto, basado en redes complejas, realiza un

eficiente trabajo de caracterización de las formas por

mostrar un buen grado de robustez a la falta de

información, tolerante al ruido e invariante en escala y

rotación. A continuación se desarrolla el artículo, en la

sección II se muestra el estado del arte, Sección III

describe la teoría de redes complejas y sus propiedades,

la Sección IV describe la propuesta de caracterización de

las firmas offline mediante redes complejas; finalmente

se presentan los resultados, Sección V, y conclusiones, Sección VI.

Page 2: 04-Juarez Chambi, Ronald M

2

II. ESTADO DEL ARTE

En la actualidad, existen dos grupos de características

que pueden ser usadas para la verificación e

identificación de firmas: funcionales y paramétricas.

Cuando una característica funcional es utilizada, la firma

se representa como una función en el tiempo cuyos

valores constituyen el conjunto de características, como

posición, velocidad, aceleración, presión, fuerza,

dirección del lapicero en movimiento y la inclinación del

lápiz, como características online [2] [3] [4]. Por otra

parte, para las características paramétricas u offline, la

firma es representada como un vector de elementos

donde cada valor del vector es una característica de la

firma tales como tiempo de duración de la firma, número

de veces que se levanta o coloca el lapicero,

transformada de Fourier, intensidad de grises, matrices de formas [5] [6].

Los métodos actuales de verificación de firmas

utilizan decenas de técnicas de verificación las cuales se

pueden agrupar en cinco cuatro categorías: Comparación

de Plantillas [7]; Redes Neuronales [8]; Modelos Ocultos

de Márkov [9]; Técnicas estructurales [10]. Esto

demuestra que se tiene un gran número de técnicas de

caracterización de firmas ya sea como modelos

matemáticos o como vectores de características; además,

en la parte de clasificación también hay decenas o cientos

de técnicas que hacen más variada la posibilidad de hacer

combinaciones de caracterización de la firma y técnicas

de clasificación [11].

Más allá de las diferentes técnicas de caracterización

y clasificación de firmas, no se tiene un antecedente en la

literatura de la aplicación de redes complejas para la

caracterización de firmas, siendo que por las

características de estas, se constituye en un método

adecuado para este problema, como lo demostramos en

este trabajo. Sin embargo, a pesar de ser reciente la

técnica, se encontraron aplicaciones en reconocimiento

de patrones, estudios de redes sociales, internet, genética molecular, entre otros [12].

III. REDES COMPLEJAS

En términos generales, una red o grafo es un

conjunto de elementos llamados vértices o nodos con

conexiones entre ellos, llamados enlaces. No obstante,

este término tiene distintos significados en distintas

disciplinas. Un ejemplo de red puede visualizarse en la

Figura 1.

En este contexto, una red compleja se refiere a una

red que posee ciertas características topológicas no

triviales que no ocurren en redes simples, además de tener una gran cantidad de nodos y enlaces.

H

I

F

D

BC

GE

A

ENLACE

NODO

Figura 1 – Una red con 9 nodos y 10 enlaces

Existen diferentes modelos teóricos de redes

complejas tales como el modelo de Erdös-Rényi,

modelos de libre escala, completamente aleatorios, entre

otros [12]. En este trabajo es utilizado el modelo de red

propuesto por Watts-Strogatz [12], este modelo de red

presenta la propiedad de pequeño-mundo, esto quiere

decir que todos los vértices pueden ser accedidos desde

cualquier otro vértice a través de un pequeño número de

enlaces y contienen un alto número de bucles de

longitud tres, estos es, si un vértice 𝑖 tiene conexión con

un vértice 𝑗 y este tiene conexión con un vértice 𝑘

entonces hay una alta probabilidad que 𝑖 y 𝑘 estén conectados (alto coeficiente de agrupamiento) [12].

El modelo dinámico de la red de Watts-Strogatz es

obtenido artificialmente mediante la utilización de

umbrales que sirven para seleccionar las conexiones de la

red. El formato de la firma offline está correlacionado con

la estructura de la red en las diferentes etapas de su

crecimiento. El estudio de sus propiedades dinámicas

(medidas que fueron obtenidas a partir del crecimiento

dinámico de la red, basado en el número de conexiones

de sus componentes) producirá un descriptor o vector de

características de la firma, la cual será utilizada para su análisis y el respectivo proceso de clasificación.

3.1. Medida de conectividad en redes complejas

El grado o degree de un nodo es el número de enlaces

que tiene dicho nodo. En caso de que la red sea dirigida

hablamos de in-degree —número de enlaces incidentes

en el nodo— y de out-degree —número de enlaces

salientes del nodo. Si la red es no-dirigida hablaremos

simplemente de grado. Tabla 1. Grado de cada uno de los nodos de la red no-dirigida

de la Figura 1. Grado medio de la red.

Red de la Figura 1

Nodo Grado

A 1

B 3

C 1

D 4

E 2

F 2

G 3

H 2

I 2

Grado medio: 20/9 = 2.222

El grado medio de una red no es más que el

promedio del grado de todos los nodos de la red. A

Page 3: 04-Juarez Chambi, Ronald M

3

modo de ejemplo, la Tabla 1 indica el grado de cada uno

de los nodos de la Figura 1, y se indica también el grado

medio de la red.

En términos de matriz de adyacencia 𝐴 el grado 𝑘𝐼 de

un nodo 𝑖 viene dado por.

𝑘𝐼 = ∑ 𝐴𝑖𝑗

𝑁

𝑗=1

Donde N es el número de vértices en la red. Además, el

grado máximo 𝑘𝜅 y promedio 𝑘𝜇 de la red vienen

definidos como.

𝑘𝜅 = max 𝑘𝐼 𝑘𝜇 = 1

𝑁∑ 𝐴𝑖𝑗

𝑁

𝑗=1

3.2. Evolución dinámica de la red

Otra característica importante en redes complejas es

su evolución dinámica, la cual afecta directamente en las

propiedades de la red. Como una consecuencia

inmediata, las medidas de las redes complejas son una

función del tiempo, esto es, dos redes obtenidas en

distintos instantes de tiempo partiendo de una misma red

base son representadas con diferentes características.

Aunque la mayoría de veces solo se tiene acceso a la

evolución dinámica de una red compleja que se da en la

naturaleza, se puede obtener un patrón a partir de esta

evidencia y simular matemáticamente la evolución de

una red. Esto permite una caracterización más idónea para el análisis y la clasificación de redes.

IV. CARACTERIZACIÓN DE FIRMAS OFFLINE CON REDES

COMPLEJAS

4.1. Base de datos de imágenes de firmas offline

El conjunto de imágenes de firmas ha sido solicitado

a la comisión organizadora del concurso de firmas offline

4NSigComp2010 organizado por el Grupo de Procesado

Digital de Señal (GPDS) de la Universidad de Las

Palmas de Gran Canaria [13]. Esta base de datos,

denominada como GPDS960Signature, cuenta con un

grupo de 960 firmas, cada grupo de firmas pertenece a

una persona. Dentro de cada uno de estos grupos se

cuenta con 24 firmas genuinas y 30 firmas falsificadas para cada persona.

Las 24 firmas genuinas fueron recolectadas el

mismo día para cada firmante. Las firmas falsificadas

fueron reproducidas a partir de una imagen estática de

una firma verdadera. A cada falsificador se le permitió

practicar la firma genuina tantas veces como lo desee.

Cada falsificador imitó 3 firmas de 5 personas, a partir de

las una imagen elegida aleatoriamente de las veinticuatro

firmas genuinas para cada persona. Por lo tanto hay 30

firmas falsas realizadas por 10 personas para cada una de

las personas. Cada falsificador utilizó su propio lápiz o

lapicero. En la Figura 2 se muestra un ejemplo de firmas

verdaderas y falsas para una persona en particular, de la

base de datos.

Figura 2 – Muestra de firmas genuinas (a) y falsificadas (b) para una

misma persona de la base dedatos.

4.2. Esqueletización de las firmas

Como primera etapa, es necesario tener una firma

pre-procesada de tal manera que sea más adecuada para

la aplicación específica del algoritmo mejorando ciertas

características de la misma del modo que posibilite

efectuar operaciones del procesado sobre ella, ver Figura

3. Para el caso de las firmas, debido a que se obtienen a

partir del escaneo de una imagen, nos interesa el trazo

principal de la firma, es decir, su esqueleto; ya que, a

pesar de que visualmente el trazo de la firma esté

definida, cada pixel es información única para la

computadora. Una línea está compuesta de muchos

píxeles de los cuales la mayoría es información

redundante y solo uno basta para definir el esqueleto de

la firma. Para ello se ha utilizado el algoritmo de

adelgazamientos iterativos de Pavlidis, debido a que los

trazos de una firma son delgados este algoritmo será aún

más eficiente [1] [14],

Figura 3 – Esqueletización de una firma digigitalizada

4.3. Descriptores de grado de la firma como red

compleja

En esta sección se describe la caracterización de la

firma con un enfoque en redes complejas [15]. Sea 𝑆 el

trazo de la firma, donde 𝑆 = [𝑠1, 𝑠2, … , 𝑠𝑁] y 𝑠𝑖 un

vector de la forma 𝑠𝑖 = [𝑥𝑖 , 𝑦𝑖], cuyos componentes son

valores numéricos enteros que representan las

coordenadas en el punto 𝑖 del contorno. Ahora bien, para

poder aplicar la teoría de redes complejas para el

problema, 𝑆 se representa como una red o grafo 𝐺 = ⟨𝑉, 𝐸⟩. Cada pixel del trazo es representado como un

vértice de la red, es decir 𝑆 = 𝑉. Un conjunto de aristas

o enlaces 𝐸 conectan cada par de vértices estableciendo,

Page 4: 04-Juarez Chambi, Ronald M

4

de esta manera, la red. Este conjunto 𝐸 es calculado

utilizando la distancia Euclidiana entre dos puntos.

𝑑(𝑠𝑖 , 𝑠𝑗) = √(𝑥𝑖 + 𝑦𝑖)2 + (𝑥𝑖 − 𝑦𝑖)2

Por lo tanto, la matriz es representada por una

matriz de adyacencia con pesos 𝑊 de dimensiones 𝑁 ×𝑁 donde:

𝑤𝑖𝑗 = 𝑊([𝑤, 𝑤𝑗]) = 𝑑(𝑠𝑖 , 𝑠𝑗)

Una de las características de este método es que es

invariante al tamaño y rotación de la imagen del afirma.

En la Figura 4 se realiza la normalización de una

imagen, donde se muestra la propiedad de invariancia a

escala y rotación. Para ello se normaliza la matriz 𝑊 en

el intervalo [0,1].

Figura 4 – Propiedad de invariancia a escala y rotación

Inicialmente, el conjunto de aristas 𝐸 conecta todos

vértices de la red. Esto quiere decir que toda la red tiene

un comportamiento regular, una vez que todos los nodos

tengan el mismo número de conexiones. Sin embargo,

una red regular no es considerada una red compleja

debido a que no presenta alguna propiedad relevante

para el desarrollo de aplicaciones. Por lo tanto, es

necesario transformar esta red regular que se tiene

inicialmente en una red compleja que posea propiedades

relevantes para su posterior aplicación.

4.4. Evolución dinámica de una red compleja

El uso de conceptos y herramientas subyacentes a la

investigación en redes complejas proveen información

relevante para la caracterización de firmas. En este

sentido, se plantea: dada una representación

transformada específica presentada previamente, la

caracterización de 𝑆 se puede representar como un

vector de características obtenido de diferentes valores

de 𝑇𝑖 de una operación de transformación 𝛿, que redefine

la cantidad de conexiones del grafo. Esta operación, de

ahora en adelante representado como 𝐴 = 𝛿𝑇𝑖(𝑊𝑖), es

aplicada para cada elemento de la matriz 𝑊 una matriz

sin peso:

𝐴𝑇𝑖= 𝛿𝑇𝑖

(𝑊𝑖) = ∀w ∈ W {𝑎𝑖𝑗 = 1 𝑠𝑖 𝑤𝑖𝑗 ≥ 𝑇𝑖

𝑎𝑖𝑗 = 0 𝑠𝑖 𝑤𝑖𝑗 < 𝑇𝑖

En otras palabras, la caracterización es realizada

usando varias transformaciones 𝛿 donde el umbral 𝑇𝑖 es

incrementado regularmente a razón de 𝑇𝑖𝑛𝑐. Por lo tanto,

dado un conjunto 𝑇, un elemento 𝑇𝑖 ∈ 𝑇 es definido por

una función 𝑓: 𝑇 → 𝑇 donde

𝑇0 = 𝑇𝑖𝑛𝑖 | 0 < 𝑇𝑖𝑛𝑖 < 1

𝑇𝑙+1 = 𝑓(𝑇𝑙) 𝑠𝑖 𝑇𝑙 < 𝑇𝑄 < 1

𝑓(𝑥) = 𝑥 + 𝑇𝑖𝑛𝑐

Donde 𝑇𝑖𝑛𝑖 y 𝑇𝑄 son los umbrales iniciales y finales,

respectivamente. Este enfoque permite una

caracterización que describe una lista de características

transitorias de la evolución dinámica de la red, tal como

se muestra en la Figura 5.

(a) (b) (c)

Figura 5 – Evolución dinámica de una firma representada en una red

para el umbral 𝑇𝑙: (a) 𝑇𝑙 = 0.1; (b) 𝑇𝑙 = 0.15 y (c) 𝑇𝑙 = 0.2

Por lo tanto, una vez obtenidas las redes debido a la

evolución dinámica, el vector de características

propuesto se basa en la concatenación de los descriptores

de grado. Dichos descriptores se obtienen a partir de una

matriz 𝐴 transformada por la operación de

transformación 𝛿 para un instante 𝑇𝑙 usando las medidas

grado medio (𝑘𝜇) y grado máximo (𝑘𝜅), presentados en

el marco teórico. Sin embargo, una normalización de los

grados de los vértices por el número de vértices es

necesario antes de calcular estas medidas.

∀𝑘𝑖 = 𝑘𝑖

𝑁

Esta normalización es realizada para reducir la

influencia de la cantidad de nodos de la red en el cálculo

de los descriptores mencionados. Por lo tanto,

considerando la transformación de la red para cada

instante 𝑇𝑙, el vector de características denotado por 𝜑 es

calculado como la concatenación del grado medio (𝑘𝜇) y

grado máximo (𝑘𝜅) obtenidos en cada etapa de la

evolución de la red y de este modo se obtiene la

caracterización propuesta de una firma a través de una

red compleja:

𝜑 = [ 𝑘𝜇(𝑇0), 𝑘𝜅(𝑇0), 𝑘𝜇(𝑇1), 𝑘𝜅(𝑇1), … , 𝑘𝜇(𝑇𝑄), 𝑘𝜅(𝑇𝑄)]

El procedimiento de caracterización de las firmas

offline explicado en esta sección, se resume en el

Algoritmo 1:

Page 5: 04-Juarez Chambi, Ronald M

5

Notación: S es la imagen inicial de la firma.

V es el conjunto de nodos o vértices, cada

nodo es un pixel representado por sus

coordenadas.

W es la matriz de adyacencia con pesos de

la red regular generada a partir del

esqueleto de la

𝜑 es el vector de características que se

obtiene de aplicar el algoritmo a 𝑆

𝛿 es la operación de transformación de la

red compleja (ver sección 4.2)

CARACTERIZACION (S, 𝜑)

1. Esqueletizar la firma en 𝑆

2. Obtener el conjunto de vértices 𝑉 a partir del

esqueleto de 𝑆

3. Obtener la matriz de adyacencia con pesos 𝑊 a

partir del conjunto de 𝑉

4. Normalizar el peso de la matriz 𝑊 al intervalo

de [0 1] 5. Para cada valor de umbral 𝑇𝑙 desde 𝑇0 a 𝑇𝑄 con

un incremento 𝑇𝑖𝑛𝑐 repetir los pasos del 6 al 9

Inicio

6 Aplicar la operación de transformación

𝛿𝑇𝑖(𝑊) para obtener una matriz de

adyacencia sin peso 𝐴𝑇𝑖

7 Obtener el grado medio 𝑘𝜇(𝑇𝑙) y el grado

máximo 𝑘𝜅(𝑇𝑙)

8 Añadir los elementos 𝑘𝜇(𝑇𝑙) y 𝑘𝜅(𝑇𝑙) al

vector 𝜑

9 Normalizar el vector 𝜑 de acuerdo al

número de nodos 𝑁 de la red

Fin

Fin

10 Fin del algoritmo

Algoritmo 1. Algoritmo de caracterización

V. RESULTADOS

5.1. Experimentación

Para evaluar el rendimiento del vector de

características propuesto, se ha implementado un modelo

de clasificación que permite medir la similitud de las

características sobre la base de datos de firmas

GPDS960Signature. Los resultados se han obtenido

usando firmas con variación en escala, rotación, grosor y

ruido. Para ello se utilizó una red neuronal Perceptrón

Multicapa como máquina de aprendizaje, y se utilizó la

técnica de validación cruzada mostrando los resultados

en una matriz de confusión. Para ello se utilizó la API de

la herramienta Weka.

Los experimentos fueron desarrollados con un

procesador Core i5 2.4 Ghz. Las pruebas de verificación

tuvo una duración de 1.49 horas y 1.12 horas para

identificación utilizando toda la base de datos de firmas.

Por lo que tuvo un tiempo de procesamiento promedio

0.1 segundos por firma, el cual demuestra tiempos

computacionales razonables para el algoritmo. Se

realizaron dos experimentos: uno para ver la efectividad

en verificación y otro en identificación. Para la primera

se utilizaron dos clases por cada persona, la primera

clase contiene las firmas genuinas y la segunda clase las

firmas falsas. Para el caso de la identificación se

definieron 960 clases —una clase por persona— cada

clase contiene únicamente las firmas genuinas de cada

persona.

5.2. Resultados de verificación

Para la verificación, la Tabla 2 presenta la tasa de

acierto promedio que el algoritmo obtuvo al aplicarlo

sobre los 960 grupos de firmas, habiendo utilizado la

estrategia de validación cruzada leave-one-out. Los

resultados obtenidos muestran un alto rendimiento del

vector de características. El histograma por efectividad se

muestra en la Figura 6, la cual tiene una alta capacidad de

discriminación entre las dos clases para cada persona. Se

han obtenido discriminaciones de hasta 98% y en

promedio 76% para la verificación.

Figura 6 – Histograma de efectividad para verificación

Tabla 2. Resumen de la tasa de acierto de verificación para las 960

personas

Tasa de acierto Porcentajes

Promedio 76.11%

Máximo 98.15%

Mínimo 44.45%

5.3. Resultados de identificación

Para la identificación se utilizó el total de firmas

genuinas de la base de datos, donde cada grupo se

constituyó en una clase, lo que hizo complejo el

problema en vista que se tenían 960 clases y 23040

instancias. La Tabla 3 muestra el resumen de efectividad de identificación para las 960 personas

Tabla 3. Tasa de acierto de identificación para las 960 personas

Métricas Porcentajes

Clasificaciones correctas 85.12%

Clasificaciones incorrectas 14.88%

Total de instancias 480

14

71

211

390

223

51

0

50

100

150

200

250

300

350

400

450

[40% - 50%> [50% - 60%> [60% - 70%> [70% - 80%> [80% - 90%> [90% - 100%>

Efectividad de verificación de firmas en las 960 personas

Page 6: 04-Juarez Chambi, Ronald M

6

Como se puede observar, se ha obtenido el 85.12%

de identificación correcta y un error general de 14.88 %.

Esta tasa nos muestra una alta efectividad del algoritmo

para identificar firmas.

Como se comprenderá, mostrar el resultado general

implicaría una tabla de 960x960, lo cual es imposible de

representar en este espacio del artículo. Por ello, a modo

de ejemplo en la Tabla 5 se muestra una parte de la

matriz de clasificación para un conjunto de 20 grupos de

firmas escogidas aleatoriamente, siendo que en la

diagonal se puede verificar la cantidad de firmas clasificadas correctamente.

Tabla 5. Matriz de confusión para una muestra de 20 personas para el

proceso de identificación de firmas

VI. CONCLUSIONES

En este trabajo se ha presentado un método efectivo

de caracterización de firmas offline para la verificación e

identificación, para lo cual se ha aplicado la novedosa

técnica de redes complejas. Esta técnica se muestra ad-

hoc para la representación de la firma offline por

presentar características que consiguen sobrellevar las

dificultades típicas que presentan las firmas de una

persona en el momento de la adquisición de la imagen

mediante algún lector óptico, como cámara o escáner;

entre estas dificultades tenemos la presencia de ruido,

variabilidad intra-clase de la forma de la firma, tamaño, posición, trazo, entre otros.

Los resultados obtenidos son altamente alentadores,

siendo que comparando con los de la competición

4NSigComp2010 Competition, se obtiene la segunda

menor tasa de error lo que demuestra la competitividad y practicidad del algoritmo [13].

Algunas aplicaciones prácticas de nuestra propuesta

están referidas a la preselección de firmas en escenarios

prácticos como la verificación de autenticidad de

documentos, el proceso de recolección de firmas, como

en padrones electorales, trámites bancarios, entre otros.

Por lo tanto, nuestro algoritmo puede presentarse útil

como un paso previo para agilizar el conteo de firmas

válidas y descartar las firmas que son evidentemente falsas o repetidas.

VII. BIBLIOGRAFÍA

[1] T. Pavlidis, «A thinning algorithms for discrete binary

images,» Computer Graphics and Image Processing, pp.

142-157, 1980.

[2] G. Dimauro, S. Impedovo y G. Pirlo, «A stroke-oriented

approach to signature verification,» From Pixels to

Features III—Frontiers in Handwriting Recognition, pp.

371-384, 1992.

[3] G. Dimauro, S. Impedovo y G. Pirlo, «Component-

oriented algorithms for signature verification,» Patter

Recognition, vol. 8, nº 3, pp. 771-794, 1994.

[4] N. M. Herbst y C. N. Liu, «Automatic signature

verification based on accelerometry,» IBM J. Res. Dev.,

vol. 21, pp. 245-253, 1977.

[5] J. J. Brault y R. Plamondon, «Segmenting handwritten

signatures at their perceptually important points,» IEEE

Trans. Pattern Anal., vol. 15, nº 9, pp. 953-957, 1993.

[6] M. M. Shafiei y H. R. Rabiee, «new on-line signature

verification algorithm using variable length segmentation

and hiddenMarkovmodels,» Proc. 7th Int. Conf. Doc.

Anal. Recognit, vol. 1, p. 443–446, 2003.

[7] R. Sabourin y J. P. Drouhard, «Shape matrices as a mixed

shape factor for offline signature verification,» Proc. 4th

Int. Conf. Doc. Anal. Recognit, vol. 2, pp. 661-665, 1997.

[8] A. I. Al-Shoshan, «Handwritten signature verification

using image invariant and dynamic features,» Proc. Int.

Conf. Comput. Graphics, pp. 173-176, 2008.

[9] J. Fierrez-Aguilar, J. Ortega-Garcia, D. D. Ramos y J.

Gonzalez-Rodriguez, «HMM-based on-line signature

verification: Feature extraction and signature modelling,»

Pattern Recognition, vol. 28, nº 16, pp. 2325-2334, 2007.

[10] K. Huang y H. Yan, «Offline signature verification using

structural feature correspondence,» Patter Recognition,

vol. 35, nº 11, pp. 2467-2477, 2002.

[11] D. Impedovo y P. Giussepe, «Automatic Signature

Verification: The State of Art,» IEEE Transactions on

system, man and cybernetics, vol. 38, nº 5, pp. 609 - 635,

2008.

[12] A.-L. Barabási, Linked: The New Science of Networks,

USA: Perseus Books Group, 2002.

[13] M. Blumenstein, M. A. Ferrer, J.F. Vargas, «The

4NSigComp2010 off-line signature verification

competitin» in Proceedings of 12th International

Conference on Frontiers Handwriting Recognition, pp.

721-726, Kolkata, India, 16-18 Noviembre 2010.

[14] T. Pavlidis, Algorithms for Graphics and Image

Processing, Germany: Springer Verlag, 1982.

[15] A. R. Backes, D. Casanova y O. Martinez Bruno, «A

complex network-based approach for boundary shape

analysis,» Pattern Recognition, vol. 42, pp. 54 - 67, 2009.