incorporating commonsense knowledge to vqa

20
Incorporating commonsense knowledge to VQA MIGUEL FADIĆ PROFESOR SUPERVISOR: ÁLVARO SOTO

Upload: miguel-fadic-gutierrez

Post on 14-Apr-2017

101 views

Category:

Science


4 download

TRANSCRIPT

Page 1: Incorporating commonsense knowledge to vqa

Incorporating commonsense knowledge to VQAMIGUEL FADIĆPROFESOR SUPERVISOR: ÁLVARO SOTO

Page 2: Incorporating commonsense knowledge to vqa

02-05-2023 2

Agenda◦ Marco teórico

◦ Pregunta de investigación

◦ Solución propuesta

◦ Limitaciones

◦ Estado de la investigación

Page 3: Incorporating commonsense knowledge to vqa

02-05-2023 3

Visual Question Answering (VQA)

Page 4: Incorporating commonsense knowledge to vqa

02-05-2023 4

Marco teórico The Summer Vision Project (MIT, 1966)

◦ Figure-Ground

◦ Region Description

◦ Object Identification

Page 5: Incorporating commonsense knowledge to vqa

02-05-2023 5

Visión por computador, un problema difícil

(Efstratios Gavves, 2014)

Page 6: Incorporating commonsense knowledge to vqa

02-05-2023 6

Perceptrón

(Frank Rosenblatt, 1958)

Page 7: Incorporating commonsense knowledge to vqa

02-05-2023 7

Clasificador lineal

Page 8: Incorporating commonsense knowledge to vqa

02-05-2023 8

Imagenet (2010)◦ 1.2 millones de imágenes◦ 1000 categorías distintas

Page 9: Incorporating commonsense knowledge to vqa

02-05-2023 9

Alexenet Evolución del perceptrón

(Krizhevsky et al., 2012)

Page 10: Incorporating commonsense knowledge to vqa

02-05-2023 10

Word to vec (W2V) Transformando palabras en vectores

(Mikolov et al., 2013)

Page 11: Incorporating commonsense knowledge to vqa

02-05-2023 11

Concepnet

(Robert Speer, Catherine Havasi, 2013)

Base de datos de conocimiento de sentido común

Page 12: Incorporating commonsense knowledge to vqa

02-05-2023 12

TransE Llevando bases de datos de conocimiento a un espacio vectorial

Page 13: Incorporating commonsense knowledge to vqa

02-05-2023 13

Volviendo a VQA

Page 14: Incorporating commonsense knowledge to vqa

02-05-2023 14

Algunos ejemplos

Page 15: Incorporating commonsense knowledge to vqa

02-05-2023 15

Page 16: Incorporating commonsense knowledge to vqa

02-05-2023 16

Page 17: Incorporating commonsense knowledge to vqa

02-05-2023 17

Pregunta de investigación

¿Cómo incorporar conocimiento de sentido común a las técnicas para resolver VQA?

Page 18: Incorporating commonsense knowledge to vqa

02-05-2023 18

Solución propuesta◦ Utilizar TransE para llevar Conceptnet a un

espacio vectorial donde se puede interactuar con la imagen, pero tomando como punto de partida los vectores de W2V.

Page 19: Incorporating commonsense knowledge to vqa

02-05-2023 19

Limitaciones◦ Concepnet 5 está incompleto y posee errores

◦ Pueden existir relaciones que no sean representables como un único vector

◦ No todas las palabras de Concepnet tienen un vector asociado en los modelos de W2V disponibles públicamente

Page 20: Incorporating commonsense knowledge to vqa

02-05-2023 20

Estado de la investigación

2015-2• Revisión

bibliográfica

11-18/12• ICCV

Abril • Combinar texto

y concepnet

2016-1• Incluir

imágenes

2016-2• Realizar

experimentos

2017-1• Escribir y

defender tesis