classificazione non supervisionata di immagini digitali per applicazioni di image forensics

21
Classificazione non supervisionata di immagini digitali per applicazioni di image forensics Matteo Innocenti Firenze, 07/10/2010 Relatori: Prof. Vito Cappellini Dott. Roberto Caldelli Ing. Francesco Picchioni Ing. Irene Amerini

Upload: icl-image-communication-laboratory

Post on 28-Jan-2015

113 views

Category:

Technology


2 download

DESCRIPTION

Classificazione non supervisionata di immagini digitali per applicazioni di image forensics - Matteo Innocenti - AA 2009-2010 Relatori: Prof. Vito Cappellini, Dr. Roberto Caldelli, Ing. Francesco Picchioni, Ing. Irene Amerini

TRANSCRIPT

Page 1: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Classificazione non supervisionata di

immagini digitali per applicazioni di image

forensicsMatteo Innocenti

Firenze, 07/10/2010

Relatori: Prof. Vito Cappellini Dott. Roberto

Caldelli Ing. Francesco

PicchioniIng. Irene Amerini

Page 2: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Obiettivo

Digital Forensics

Digital Camera Identification

Classificazione

Test e risultati

Conclusioni

Sommario

Page 3: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

ObiettivoDate N immagini digitali provenienti da K (ignoto) fotocamere,raggruppare le immagini in gruppi corrispondenti alle fotocamere.

N=5 K=2

Page 4: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Digital ForensicsDagli anni ‘80: forte espansione dei dispositivi di acquisizione e manipolazione digitali, primi interessi circa la risoluzione dei casi giudiziari mediante l’utilizzo di prove digitali.

Digital Forensics Workshop, New York (2001): “Digital Forensics è la scienza che permette attraverso l'uso di specifiche metodologie, la raccolta, l'identificazione e l'analisi di prove digitali, allo scopo di ricostruire eventi collegati ad azioni illegali”. 

Prova digitale: qualsiasi informazione, con valore probatorio, memorizzata in formato digitale.

Page 5: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Digital Forensics

Computer Forensics

Multimedia Forensics

Analisi del traffico di rete e dei log di sessione dei dispositivi di rete.Estrazione ed analisi dei dati memorizzati nei calcolatori.

Si occupa dei media digitali.Tampering detection e source identification.

Network Forensics

Page 6: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Multimedia ForensicsTampering detectionHa il compito di rilevare tentativi di contraffazione che compromettono l’integrità del media digitale.

Originale Contraffatta

Page 7: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Multimedia ForensicsSource identificationIdentificazione del particolare dispositivo che ha acquisito un media digitale.

Nel caso di fotografie digitali prende il nome di Digital Camera Identification

Esempi applicativiAcquisizione di materiale pedo-pornografico, copia di opere protette da copyright.

Page 8: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Digital Camera Identification

Componente principale del Pattern Noise

Differente sensibilità alla luce dei pixel del sensore

Caratteristica esclusiva del sensore

PRNU (Photo Response Non-Uniformity)

ObiettivoRisalire alla fotocamera digitale che ha acquisito una certa foto.Funzionamento

Si utilizza una caratteristica impronta (fingerprint) della fotocamera: il PRNU.

Si controlla all’interno dell’immagine sotto esame la presenza della fingerprint attraverso il calcolo della correlazione (J. Fridrich ).

J. Lukas, J. Fridrich, M. Goljan, “Digital camera identification from sensor pattern noise”, TIFS 2006.

Page 9: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Denoising

Filtro di Mihçak

M.K. Mihçak, I. Kozintsev, K. Ramchandran, “Spatially adaptive statistical model of wavelet image coefficients and its application to denoising”, ICASSP 1999.

Filtro di denoising Filtro di

denoising

Lavora nel dominio Wavelet.

-

Page 10: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Lavori precedentiChang-Tsun Li (University of Warwick, Coventry)*

Algoritmo di classificazione basato sui campi randomici di Markov (MRF)

Utilizzo di una funzione di enhancement del rumore

Esalta il rumore estratto, eliminando i dettagli della scena ritratta.

Molto utile per immagini di dimensione piccola.

E’ applicato nel dominio della trasformata Wavelet dopo l’estrazione del PRNU.

C.-T. Li, “Unsupervised classification of digital images using sensor pattern noise”, ISCAS 2010.

Page 11: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Enhancer

Originale No enhancer Con enhancer

Esempio su di un blocco di 512*512 pixels Enhancer proposto

Page 12: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

ClassificazioneProcedura iterativa (N-1) di clustering.Si inizia con tanti cluster quante sono (N) le immagini nel training-set.Ad ogni iterazione vengono uniti i due cluster più correlati tra di loro.Gerarchia rappresentabile con un dendogramma.

Clustering gerarchico agglomerativo

Condizione di stopOccorre valutare a quale altezza deve essere tagliato l’albero

per ottenere la miglior partizione delle immagini in gruppi.

Valutazione dei cluster con coefficienti di silhouetteAd ogni iterazione si calcola la qualità della partizione corrente.Al termine della procedura si recupera la partizione migliore.

Page 13: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Coefficienti di silhouette

Combinano gli aspetti di coesione e separazione tra clusters.Si calcola si per ciascun rumore i-esimo, poi si effettua la media.

Coefficienti di silhouette

ai è la correlazione media tra i e gli altri rumori appartenenti allo stesso cluster.

bi è la correlazione media tra i e gli altri rumori non appartenenti allo stesso cluster, prendendo la media tra tutti i cluster considerati.

Page 14: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Coefficienti di silhouetteCondizione di stopL’iterazione che verifica:

294294

Esempio su dataset di 300 immagini provenienti da 6 fotocamere

Page 15: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Test e Risultati

Dimensione dei rumori: da 128x128 a 1536x2048 pixelsUtilizzo o meno dell’enhancerComposizione del dataset di addestramento

Variabili

1200 immagini, 200 per ciascuna delle 6 fotocamere utilizzate.Training-set: 50*6, Test-set: 150*6

Dataset

Procedura sviluppata da Chang-Tsun Li in un lavoro precedente.

Confronto

Intel Quad Core Q6600, 4GB RAM, Linux os, Matlab R2009a-b.

HW-SW

Page 16: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Test enhancerTest enhancer

Page 17: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Test su dataset uniformeDistribuzione uniforme: 50 immagini per fotocamera.

Training-set

Page 18: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Test su dataset non uniformeDistribuzione non uniforme: 300 immagini in totale.Risoluzione fissa 512*512 pixels.

Training-set

Page 19: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Test su dataset non uniformeDistribuzione uniforme: 150 immagini per fotocamera.Risoluzione fissa 512*512 pixels.

Test-set

Centroide dei clusters trovatiCostituiscono la conoscenza del classificatore

Fingerprints

Page 20: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Conclusioni

Algoritmo di clustering

Efficienza migliorata notevolmente

Efficacia nettamente migliorata per dataset non uniformi, scenario realistico (fino al +26%)

A parità di tempo di esecuzione, efficacia migliorata anche per dataset uniformi

Enhancer

Efficacia lievemente migliorata

Page 21: Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Articolo WIFS 20102010 IEEE International Workshop on Information

Forensics and Security (WIFS’2010)

“Fast image clustering of unknown source images”di R. Caldelli, I. Amerini, F. Picchioni, M. Innocenti

Tasso di accettazione: 28%