Transcript
Page 1: Presentation rvp imagesimilarity

Búsqueda de Similitud no-supervisada en Imágenes a

través de Comparación Elástica.

H. Cuesta-Arvizu¹ & J. Figueroa-Nazuno²

¹ Universidad Autónoma del Estado de México² Centro de Investigación en Computación. Instituto Politécnico

Nacional

09/07/2012 1

Page 2: Presentation rvp imagesimilarity

Contenido

• Motivación.

• Definición del Procedimiento.a) Caltech256 Dataset

b) Generación de la Representación.

c) Mapeo lineal de la Representación.

d) Comparación Elástica N-Dimensional.

• Fast Dynamic Time Warping (FDTW).

• Pseudocódigo para el FDTW.

• Resultados Experimentales.

• Conclusiones.

09/07/2012 2

Page 3: Presentation rvp imagesimilarity

Motivación

• El ser humano cuenta con mecanismos para detecciónde similitud que aun son desconocidos y el problema decomparar imágenes a nivel semántico o estructural hademostrado ser un problema complejo desde el puntode vista computacional.

• Típicamente este problema es tratado por las técnicasclásicas como, comparación de Ondeletas, Histogramade color, Frecuencias (Análisis de Fourier) oReconocimiento de patrones con redes neuronalesartificiales. Sin embargo cada uno de estos métodospierde información acerca de la imagen o requiereentrenamiento exhaustivo.

09/07/2012 3

Page 4: Presentation rvp imagesimilarity

Definición del Procedimiento

• El procedimiento consta de tres faces (Generaciónde la Representación, Mapeo lineal de laRepresentación, Aplicación de la ComparaciónElástica N-Dimensional).

• Siendo la comparación elástica una comparaciónde series de tiempo, a través de una medida dedistancia. A continuación se describen las facesdel procedimiento.

09/07/2012 4

Page 5: Presentation rvp imagesimilarity

Caltech256 Dataset

• Las consultas de imágenes se realizaron sobre unset acotado de la base de datos de imágenesCaltech la cual cuenta con 30607 imágenes quefueron obtenidas de Google y de PicSearch.com.

• Las imágenes están catalogadas en 257 clasesevaluadas por el ojo humano para asegurarcalidad y relevancia.

• De las cuales para el presente trabajo fueronusadas 684 imágenes pertenecientes a 8categorías.

09/07/2012 5

Page 6: Presentation rvp imagesimilarity

Generación de la Representación

• Se considera a cualquier imagen como una matriz de la cual se obtiene un vector de 768 elementos (256 x cada sub-matriz de color).

• Definiendo el vector (Representación de la Imagen) como sigue:

{ }n

nmm

n

vv

dd

dd

....1

,1,

,11,1

=∨⇒

=∧L

MOM

L

09/07/2012 6

Page 7: Presentation rvp imagesimilarity

Mapeo lineal de la Representación

Figura. 1. Representación Original y Normalizada.

• Representación debe contener valores escalarespositivos. En la parte inferior de la Figura 1, seaprecia la misma firma normalizada conservandola morfología básica de la serie de tiempo peroconteniendo solo valores positivos.

09/07/2012 7

Page 8: Presentation rvp imagesimilarity

Comparación Elástica N-Dimensional.

• Como se observa en la Figura 2. Se comparauna representación de Referencia contra lasrepresentaciones a consultar obteniendo unamatriz de distancias y una alineación parcialde las series de tiempo, obteniendo un valorescalar de distancia entre lasrepresentaciones.

09/07/2012 8

Page 9: Presentation rvp imagesimilarity

Comparación Elástica N-Dimensional.

Figura. 2. Alineación parcial por medio del FDTW.09/07/2012 9

Page 10: Presentation rvp imagesimilarity

Fast Dynamic Time Warping

Figura 3. Ejemplo de Alineación de series de tiempo con FDTW.

• FDTW es un algoritmo para medir similitudentre dos secuencias que varían ya sea en sutiempo o su velocidad. FDTW busca la optimaalineación de “warps” de puntos en los datosde dos series de tiempo (Ver Figura 3.).

09/07/2012 10

Page 11: Presentation rvp imagesimilarity

Pseudocódigo para el FDTW.

09/07/2012 11

Page 12: Presentation rvp imagesimilarity

Resultados Experimentales• Aunque no es posible definir un criterio

universalmente aceptado para categorizarsimilitud de imágenes. En este artículo se utiliza uncriterio de apreciación directa, vía interpretaciónhumana

Figura 3. Casos de éxito para la Comparación Elástica para las clases dinosaurios, africanos y camiones.

09/07/2012 12

Page 13: Presentation rvp imagesimilarity

Resultados Experimentales

Figura 4. Casos de éxito para la Comparación Elástica para las clases caballos, rosas y elefantes.09/07/2012 13

Page 14: Presentation rvp imagesimilarity

Resultados Experimentales

Figura 5. Caso de error para la Comparación Elástica para la clase Edificios y paisajes.

09/07/2012 14

Page 15: Presentation rvp imagesimilarity

Resultados Experimentales

Nombre de la Clase

No. Imágenes

% Primer Resultado Correcto

% Segundo Resultado Correcto

Dinosaurio 102 99 99Africanos 85 98 95Camiones 56 98 90Caballos 122 92 88Rosas 95 96 92Elefantes 36 98 87Paisajes 116 60 52Edificios 72 50 45

Tabla I.- Resultado de la Comparación elástica.

09/07/2012 15

Page 16: Presentation rvp imagesimilarity

Conclusiones• Como muestran los resultados el procedimiento es muy

preciso para la clasificación de imágenes de diferentesclases.

• Adicionalmente, el hecho de que en esteprocedimiento no requiera de ningún tipo deentrenamiento previo, ofrece ventajas para labúsqueda en grandes sets de imágenes que no seencuentren anotados ni clasificados de ninguna forma(semántica o contextual).

• Una de las principales aportaciones del modelopropuesto es su simplicidad.

• Una búsqueda de similitud sin contexto y no supervisadaque ofrece buenos resultados para la mayoría de loscasos estudiados.

09/07/2012 16

Page 17: Presentation rvp imagesimilarity

Gracias.

Hector Cuesta-Arvizu

[email protected]

@hmcuesta

09/07/2012 17


Top Related