classificazione e data mining di immagini satellitari · classificazione e data mining di immagini...
TRANSCRIPT
Classificazione e Data Mining
di immagini satellitari
EnginSoft SpA
Manolo Venturin, Filippo Furlan
Bologna, 12 aprile 2017
Mesagne
Trento
Padova
Bergamo
Torino
Firenze
Competence Center
Fatigue and durability
Crash and fast
dynamics
Fluid Dynamics
Mechanics
Tolerance Analysis
Enviromental and
Vibroacustics
High Perfomance Computing
Multibody
Optimitation
Applied mathematics
EnginSoft
CONSULENZA
4.000
TECNOLOGIE
1.500+
FORMAZIONE
130+
RICERCA
60+
Esempi di attività di Data Mining svolte
Ottimizzazione delle prestazioni di un bruciatore in funzione dei
parametri di input. Analisi di sensitività. Determinazione valori ottimali.
Azienda: Worgas Bruciatori S.r.l
Analisi dati sperimentali di una colata con l’obiettivo di ridurre il numero
di pezzi affetti da difettosità eccessiva.
Azienda: Verona Steel
Strumenti utilizzati:
SOM, Neural network, RSM, …
Data Mining su immagini satellitari
Immagini da: http://www.worgas.it/Products/Premix-Burners.html e
Landsat 8
Lancio: 11 Febbraio 2013
Fornisce immagini a moderata
risoluzione della superficie terrestre e
delle regioni polari (dai 15 metri fino
a 100 metri)
Opera nel visibile, vicino infrarosso, infrarosso a onda breve e spettri
infrarossi termici
Cattura più di 700 scene al giorno (con un ciclo di ripetizioni di 16
giorni e dimensione 170 km x 183 km)
Ha dei sensori OLI (Operational Land Imager) e TIRS (Thermal
Infrared Sensor) per una migliore caratterizzazione del suolo
Immagini da: https://landsat.gsfc.nasa.gov/landsat-data-continuity-mission/ e https://lta.cr.usgs.gov/L8
Landsat 8
La banda è la misura della
riflessione/emissione di radiazione
in un determinato di lunghezza
d’onda (λ)
Maggiori il numero di bande
disponibili
Maggiori possibilità di riconoscere
differenze nella riflettanza
Possibilità di distinguere
maggiori aree diverse
Bands Wavelength
(micrometers)
Resolution
(meters)
Band 1 - Coastal aerosol 0.43 - 0.45 30
Band 2 - Blue 0.45 - 0.51 30
Band 3 - Green 0.53 - 0.59 30
Band 4 - Red 0.64 - 0.67 30
Band 5 - Near Infrared
(NIR) 0.85 - 0.88 30
Band 6 - SWIR 1 1.57 - 1.65 30
Band 7 - SWIR 2 2.11 - 2.29 30
Band 8 - Panchromatic 0.50 - 0.68 15
Band 9 - Cirrus 1.36 - 1.38 30
Band 10 - Thermal
Infrared (TIRS) 1 10.60 - 11.19 100 * (30)
Band 11 - Thermal
Infrared (TIRS) 2 11.50 - 12.51 100 * (30)
Ba
nd
e u
tiliz
za
te
Combinazioni rilevanti delle bande a seconda degli obiettivi
Bande
Obiettivi 1 2 3 4 5 6 7 Combinazioni delle bande e Condizioni
Acqua
x x OLI3/OLI6 > 1
x x OLI3/OLI5 > 1
x x x x x x Indice = (OLI2+OLI3+OLI4) /
(OLI5+OLI6+OLI7)
x x x L’acqua appare scura
Area costiera x x x
Vegetazione
x x (OLI5-OLI4) / (OLI5-OLI4) > 0
x x x Colore falsato nell’infrarosso
x x x Condizioni della vegetazione
Neve e ghiaccio
x x Indice = OLI5/OLI6
x x Indice = OLI4/OLI6
x x x
Suolo x x x
x x x
Terreno con sali e sodio x x x
x x x (OLI4-OLI5) / (OLI3-OLI5)
Composti ferrosi x x x come l’ilmenite
Differenze di umidità del terreno x x x Combinazione migliore
x x x
Rilevamento dei cambiamenti, terreni
disturbati, stress della vegetazione
x x x
x x x
Combinazioni rilevanti delle bande a seconda degli obiettivi
Bande
Obiettivi 1 2 3 4 5 6 7 Combinazioni delle bande e Condizioni
Acqua
x x OLI3/OLI6 > 1
x x OLI3/OLI5 > 1
x x x x x x Indice = (OLI2+OLI3+OLI4) /
(OLI5+OLI6+OLI7)
x x x L’acqua appare scura
Area costiera x x x
Vegetazione
x x (OLI5-OLI4) / (OLI5-OLI4) > 0
x x x Colore falsato nell’infrarosso
x x x Condizioni della vegetazione
Neve e ghiaccio
x x Indice = OLI5/OLI6
x x Indice = OLI4/OLI6
x x x
Suolo x x x
x x x
Terreno con sali e sodio x x x
x x x (OLI4-OLI5) / (OLI3-OLI5)
Composti ferrosi x x x come l’ilmenite
Differenze di umidità del terreno x x x Combinazione migliore
x x x
Rilevamento dei cambiamenti, terreni
disturbati, stress della vegetazione
x x x
x x x
Segmentazione supervisionata
Obiettivo: separare le zone urbane dalla vegetazione
Aree di training
• Aree verdi
• Aree urbane
Feature extraction
• Sistema colore (HSV)
• Media
• Varianza
• …
Strategia di classificazione
• Random Forest
• …
Un approccio non supervisionato
Classificazione delle aree senza l’intervento dell’utente (3 classi)
Un approccio non supervisionato
Classificazione delle aree senza l’intervento dell’utente (4 classi)
Analisi delle serie storiche
L’analisi delle serie storiche riveste un ruolo di primaria importanza
nell’ambito dello studio dei rischi naturali e ambientali in quanto
attraverso le tecniche di analisi che mette a disposizione è possibile
ricavare informazioni utili sullo stato ambientale e sulla sua evoluzione
NDVI è direttamente legato alla capacità di fotosintesi e rappresenta un
indice dello stato di vegetazione
NDVI - Normalized Difference Vegetation Index
NIR = riflettanza spettrale nel vicino
infrarosso
VIS = riflettanza spettrale nel rosso
visibile
−1 ≤ NDVI ≤ 1
𝑁𝐷𝑉𝐼 = 𝑁𝐼𝑅 − 𝑉𝐼𝑆
𝑁𝐼𝑅 + 𝑉𝐼𝑆
Immagine da: https://earthobservatory.nasa.gov/Features/MeasuringVegetation/measuring_vegetation_2.php
Esempio di una serie NDVI
a = Tempo di inizio della
stagione
b =Tempo di fine della
stagione
c = Lunghezza della stagione
…
Next step
Keyword: definizione delle feature
L’algoritmo presentato finora ha performance ottime perché è il risultato
di uno studio preliminare approfondito sulle feature da estrarre
In ottica futura stiamo lavorando per rendere meno dispendiosa la fase
preliminare, sostituendo lo studio delle feature con il training di un
modello CNN (Convolutional Neural Network) su una mole
considerevole di dati
Immagine da: https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html
Conclusioni
La segmentazione delle immagini
con l’algoritmo utilizzato è
fortemente dipendente dalla scelta
delle feature
Il Deep Learning può essere
una alternativa quando le studio
delle feature non è una scelta
percorribile e invece si dispone di
una grossa quantità di dati
Queste tecniche sono ormai
consolidate e applicate a vari settori
industriali
Data
Mining
Ingegneria
SW
custom Deep
Learning
Per ulteriori informazioni
Manolo Venturin [email protected]
Filippo Furlan [email protected]
Tel. +39 049 7705311
Cercateci
nell’area
Networking !