presentation rvp imagesimilarity

Post on 04-Jul-2015

278 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

La comparación elástica de imágenes es un problema abierto en la computación. Primero por su complejidad inherente y segundo por la enorme cantidad de imágenes existentes. En el presente artículo, se introduce un método elástico de comparación de imágenes, el cual ofrece una forma no-supervisada de búsqueda de similitud.

TRANSCRIPT

Búsqueda de Similitud no-supervisada en Imágenes a

través de Comparación Elástica.

H. Cuesta-Arvizu¹ & J. Figueroa-Nazuno²

¹ Universidad Autónoma del Estado de México² Centro de Investigación en Computación. Instituto Politécnico

Nacional

09/07/2012 1

Contenido

• Motivación.

• Definición del Procedimiento.a) Caltech256 Dataset

b) Generación de la Representación.

c) Mapeo lineal de la Representación.

d) Comparación Elástica N-Dimensional.

• Fast Dynamic Time Warping (FDTW).

• Pseudocódigo para el FDTW.

• Resultados Experimentales.

• Conclusiones.

09/07/2012 2

Motivación

• El ser humano cuenta con mecanismos para detecciónde similitud que aun son desconocidos y el problema decomparar imágenes a nivel semántico o estructural hademostrado ser un problema complejo desde el puntode vista computacional.

• Típicamente este problema es tratado por las técnicasclásicas como, comparación de Ondeletas, Histogramade color, Frecuencias (Análisis de Fourier) oReconocimiento de patrones con redes neuronalesartificiales. Sin embargo cada uno de estos métodospierde información acerca de la imagen o requiereentrenamiento exhaustivo.

09/07/2012 3

Definición del Procedimiento

• El procedimiento consta de tres faces (Generaciónde la Representación, Mapeo lineal de laRepresentación, Aplicación de la ComparaciónElástica N-Dimensional).

• Siendo la comparación elástica una comparaciónde series de tiempo, a través de una medida dedistancia. A continuación se describen las facesdel procedimiento.

09/07/2012 4

Caltech256 Dataset

• Las consultas de imágenes se realizaron sobre unset acotado de la base de datos de imágenesCaltech la cual cuenta con 30607 imágenes quefueron obtenidas de Google y de PicSearch.com.

• Las imágenes están catalogadas en 257 clasesevaluadas por el ojo humano para asegurarcalidad y relevancia.

• De las cuales para el presente trabajo fueronusadas 684 imágenes pertenecientes a 8categorías.

09/07/2012 5

Generación de la Representación

• Se considera a cualquier imagen como una matriz de la cual se obtiene un vector de 768 elementos (256 x cada sub-matriz de color).

• Definiendo el vector (Representación de la Imagen) como sigue:

{ }n

nmm

n

vv

dd

dd

....1

,1,

,11,1

=∨⇒

=∧L

MOM

L

09/07/2012 6

Mapeo lineal de la Representación

Figura. 1. Representación Original y Normalizada.

• Representación debe contener valores escalarespositivos. En la parte inferior de la Figura 1, seaprecia la misma firma normalizada conservandola morfología básica de la serie de tiempo peroconteniendo solo valores positivos.

09/07/2012 7

Comparación Elástica N-Dimensional.

• Como se observa en la Figura 2. Se comparauna representación de Referencia contra lasrepresentaciones a consultar obteniendo unamatriz de distancias y una alineación parcialde las series de tiempo, obteniendo un valorescalar de distancia entre lasrepresentaciones.

09/07/2012 8

Comparación Elástica N-Dimensional.

Figura. 2. Alineación parcial por medio del FDTW.09/07/2012 9

Fast Dynamic Time Warping

Figura 3. Ejemplo de Alineación de series de tiempo con FDTW.

• FDTW es un algoritmo para medir similitudentre dos secuencias que varían ya sea en sutiempo o su velocidad. FDTW busca la optimaalineación de “warps” de puntos en los datosde dos series de tiempo (Ver Figura 3.).

09/07/2012 10

Pseudocódigo para el FDTW.

09/07/2012 11

Resultados Experimentales• Aunque no es posible definir un criterio

universalmente aceptado para categorizarsimilitud de imágenes. En este artículo se utiliza uncriterio de apreciación directa, vía interpretaciónhumana

Figura 3. Casos de éxito para la Comparación Elástica para las clases dinosaurios, africanos y camiones.

09/07/2012 12

Resultados Experimentales

Figura 4. Casos de éxito para la Comparación Elástica para las clases caballos, rosas y elefantes.09/07/2012 13

Resultados Experimentales

Figura 5. Caso de error para la Comparación Elástica para la clase Edificios y paisajes.

09/07/2012 14

Resultados Experimentales

Nombre de la Clase

No. Imágenes

% Primer Resultado Correcto

% Segundo Resultado Correcto

Dinosaurio 102 99 99Africanos 85 98 95Camiones 56 98 90Caballos 122 92 88Rosas 95 96 92Elefantes 36 98 87Paisajes 116 60 52Edificios 72 50 45

Tabla I.- Resultado de la Comparación elástica.

09/07/2012 15

Conclusiones• Como muestran los resultados el procedimiento es muy

preciso para la clasificación de imágenes de diferentesclases.

• Adicionalmente, el hecho de que en esteprocedimiento no requiera de ningún tipo deentrenamiento previo, ofrece ventajas para labúsqueda en grandes sets de imágenes que no seencuentren anotados ni clasificados de ninguna forma(semántica o contextual).

• Una de las principales aportaciones del modelopropuesto es su simplicidad.

• Una búsqueda de similitud sin contexto y no supervisadaque ofrece buenos resultados para la mayoría de loscasos estudiados.

09/07/2012 16

Gracias.

Hector Cuesta-Arvizu

hm_cuesta@yahoo.com.mx

@hmcuesta

09/07/2012 17

top related