presentazione progetto e realizzazione di un sistema per l’annotazione automatica di immagini con...

25
PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING Laureando: ANDREA DE LORENZO Relatore: CHIAR.MO PROF. ALBERTO BARTOLI Correlatore: CHIAR.MO PROF. ERIC MEDVET

Upload: guestfe85ba

Post on 13-Jun-2015

607 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

PROGETTO E REALIZZAZIONE DI UN SISTEMAPER L’ANNOTAZIONE AUTOMATICA DIIMMAGINI CON TECNICHE DI WEB MINING

Laureando:ANDREA DE LORENZO

Relatore:CHIAR.MO PROF. ALBERTO BARTOLICorrelatore:CHIAR.MO PROF.ERIC MEDVET

Page 2: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Problema

Abbiamo una coppia <immagine,testo>

Vogliamo annotare automaticamente le persone presenti nell’immagine

Vogliamo che la verifica non richieda l’intervento umano

Page 3: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Motivazioni

Questo sistema può servire per: Annotazione foto Indicizzazione motori di ricerca

Annotazione foto: Molto usata su social network Facebook 2° Traffic Rank Alexa

Indicizzazione: Oggi Internet si basa su ricerca di contenuti Migliorare indicizzazione dei contenuti è molto

importante

Page 4: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Descrizione del sistema

< Immagine I, Testo T > Trova i nomi presenti in T Per ogni nome N cerca immagini su

Internet Confronta l’immagine di partenza I

con quelle scaricate per ogni nome N

Page 5: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Stato dell’arte

Esistono diversi studi per l’annotazione di immagini con testo

Tutti si basano su dataset già acquisiti prima di effettuare l'annotazione

Vogliamo annotare l’immagine senza nessun dataset: estrando da Internet sul momento

Page 6: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Annotazione dell’immagine

Silvio Berlusconi

Nicolas Sarkozy

Carla Bruni

Troviamo i nomi nel testoTroviamo le facce nell’immagineCalcoliamo un “punteggio” per ogni coppiaTeniamo le coppie i cui “punteggi” superano una “soglia S”

Page 7: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Descrizione sistema

< Immagine I, Testo T > Componenti del sistema

Estrattore nomi propri di persona da T Estrattore facce Associatore nome-faccia in I basato su

Internet

Page 8: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Componenti del sistema

Page 9: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Estrazione dei nomi

Tre differenti metodi:1. Ricerca sequenze di parole maiuscole2. Natural Language Processing3. API per “term extraction”

Page 10: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

1 - Parole maiuscole

Nomi propri di persona iniziano con maiuscole

Cerchiamo ripetizioni di parole maiuscole Ricerca tramite espressione regolare Scartiamo quelle che non contengono

nomi presenti in una lista

«Dal divano di casa è facile guidare una squadra, ma potrei prendere in considerazione l'ipotesi di allenare in futuro. È una sfida e a me le sfide piacciono». Roberto Baggio esce dall'esilio mediatico in cui ha vissuto negli ultimi anni e torna a parlare in occasione di un'iniziativa editoriale della Gazzetta dello Sport con Raitrade dedicata alla carriera del “Divin Codino” con 10 dvd dal titolo «Io che sarò Roberto Baggio»

Page 11: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

2 - Natural Language Processing

Individua i nomi analizzando le singole frasi

Si basa su metodi statistici Implementato nella libreria

OpenNLP Funziona solo per l’Inglese Non occorre filtrare con una lista di

nomi

Page 12: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

3 - Term Extraction

Utilizza servizi online per estrazione di parole chiave

Questi restituiscono una lista di parole chiave che caratterizza il testo

I risultati vengono filtrati tramite una lista di nomi propri.

API usate: Yahoo! Term Extractor Zemanta

Page 13: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Aggregazione risultati

Per migliorare i risultati 2 metodi: output di almeno un metodo output di almeno due algoritmi

Page 14: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Valutazione sperimentale

Preso un dataset di 20 articoli italiani e 20 inglesi

Misurati valori di precision e recall Per noi più importante recall Se manca un nome la foto non può

essere annotata Precision indica efficienza del sistema

Page 15: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Valutazione sperimentale

Useremo questa

Page 16: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Estrattore facce

Usiamo libreria OpenCV di Intel Usa classificatori pre-addestrati Restituisce le coordinate di una zona

“interessante” Facciamo anche elaborazioni grafiche per

migliorare questa estrazione

Page 17: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Associatore nome-faccia

Troviamo facce su Internet per la persona Google Immagini Bing Immagini Yahoo! Immagini

Otteniamo un “punteggio” per l’immagine Se “punteggio” maggiore di una “soglia”,

la persona è nell’immagine

Page 18: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Punteggio

Dimensionality reduction tramite PCA (da 10000 dimensioni a 80)

Il punteggio viene calcolato come Local Density Score (LDS)

Prendiamo da Internet K facce più vicine alla faccia ignota

Punteggio = distanza media faccia incognita dalle K facce più vicine

Due distanze possibili: Shared neighbors (una distanza basata sul numero

di vicini in comune) Euclidea

k

ffdfLDS

fRf jkj

),'()'(

)'(

Page 19: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

LDS

Faccia da annotare Estratte da Internet

Page 20: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Valutazione sperimentale

Usiamo un dataset di 40 nomi e immagini di persone famose

Ogni foto è stata valutata con il nome corretto e 3 nomi sbagliati

Otteniamo delle curve ROC, una per ogni K (numero facce più vicine da cui calcolo la distanza media)

Page 21: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

ROC - Distanza Euclidea

Page 22: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

ROC - Distanza Shared Neighbors

Page 23: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Valutazione sistema completo

Sistema provato con 30 coppie < T, I > 54% delle facce è stato annotato correttamente 28% delle facce non è stata annotata

correttamente 18% delle facce non è stata annotata

Nicolas Sarkozy

Silvio Berlusconi

Nicolas Sarkozy

Carla Bruni

Nicolas Sarkozy

Page 24: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Esempi

Immagine Annotazione

1-Sara Tommasi

1-Nicolas Sarkozy 2-Silvio Berlusconi

2-Al Presidente Berlusconi

1-Giorgio Napolitano 2-Nicola Mancino

Page 25: Presentazione PROGETTO E REALIZZAZIONE DI UN SISTEMA PER L’ANNOTAZIONE AUTOMATICA DI IMMAGINI CON TECNICHE DI WEB MINING

Conclusioni

Uso di Internet come dataset è possibile per il annotazione automatica immagini

Sviluppi futuri: SURF