1 laura de sandro in collaborazione con stefania fegatelli il trattamento delle mancate risposte:...
Post on 01-May-2015
216 Views
Preview:
TRANSCRIPT
1
Laura De Sandro in collaborazione con Stefania Fegatelli
“Il trattamento delle mancate risposte:utilizzo dei dati delle Capitanerie di porto”
Roma, 06 dicembre 2011
Innovazione nelle Indagini statistiche sui trasporti
1. Esplicitazione del problema2. Trattamento Mancate Risposte3. Record Linkage4. L’ integrazione con dati delle capitanerie di porto5. Utilizzo dei mirror data
2
SOMMARIOInnovazione nelle
indagini statistiche sui trasporti
Roma, 6 dicembre 2011
LA CAUSA:• Complessità organizzativa dell’indagine• Difficoltà di individuare l’universo dei rispondentiL’EFFETTO:• dichiarazioni mancanti (non pervenute o non
effettuate) di Arrivo/Partenza MANCATE RISPOSTE TOTALI
• dichiarazioni non complete di Arrivo/PartenzaL’evento nave A/P viene rilevato, ma senza dettagli
sul carico
MANCATE RISPOSTE PARZIALI
3
Esplicitazione del problema
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
TRATTAMENTO MANCATE RISPOSTE
1. Utilizzo modelli delle capitanerie di porto
2. Utilizzo mirror data
4Roma, 6 dicembre 2011
Esplicitazione del problemaInnovazione nelle
indagini statistiche sui trasporti
5Roma, 6 dicembre 2011
• Il metodo di IMPUTAZIONE scelto:
Record Linkage (RL) tra la base dati Istat e una fonte amministrativa
• La FONTE amministrativa UFFICIALE scelta:
il modello 61 delle CAPITANERIE DI PORTO, trasmesso all’Istat dal Ministero delle
Infrastrutture e Trasporti
Esplicitazione del problemaInnovazione nelle
indagini statistiche sui trasporti
Perché un Record Linkage?
Perché la nave, dichiarata in ‘arrivo (partenza)’ dall’agente marittimo, viene registrata anche in capitaneria di porto con il suo carico,
cioè con la sua merce e i suoi passeggeri
6Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
Punti di forza dei modelli 61 stesso campo d’osservazione dell’indaginefornisce l’universo delle navi
arrivate/partitepermette di integrare eventuali MR, totali
e parziali, rispetto ai viaggi (navi arrivate/partite), alla merce o ai passeggeri
7
RECORD LINKAGE
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
Punti di debolezza dei modelli 61 non sono generati da una procedura automatizzata,
quindi non sono immediatamente trattabili da Istat
contengono informazioni aggregate con riferimento al numero di navi arrivate/partite e alle tonnellate di merce e al numero di passeggeri sbarcati/imbarcati
8Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
Ipotesi di base• le unità statistiche devono essere definite allo
stesso modo nelle diverse fonti o provenire dalla stessa fonte
• le unità devono fare riferimento allo stesso collettivo statistico
• il contenuto informativo delle variabili della fonte “donatrice” deve essere identico a quello delle variabili “oggetto” di indagine
• IPOTESI SODDISFATTE!!
9Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
Il match e la match key
• Tecnica di exact matching con una chiave di abbinamento che identifichi univocamente l’evento ‘nave arrivata/partita’
• Ad ogni evento (nel nostro caso l’evento nave arrivata/partita) da integrare corrisponde un solo record ‘donatore’
10Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
Il match e la match key La chiave di abbinamento:
• Numero IMO (International Maritime Organization)
• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione
11Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
LA FORMALIZZAZIONEDall’insieme di tutte le coppie formate da
unità appartenenti alle fonti A e B,
A × B ={(a, b) : a є A, b є B},
si determinano due sottoinsiemi
disgiunti ed esaustivi M e u, per cui
M∩u =ø e MUu = A × B
12Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
LA FORMALIZZAZIONE• M = unità rilevate in entrambe le fonti
“match”
• u= unità rilevate in A e non presenti in B, e viceversa
“non-match”
13Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
LA FORMALIZZAZIONE• A = la base dati Istat• B = la base dati delle capitanerie di
porto;• IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE
2 FONTI, selezionati in base alla variabile ‘TIPO DI NAVE’, per individuare correttamente il tipo di carico da integrare
• Gli insiemi finali M ed u sono pertanto l’unione di tanti sottoinsiemi, le cui coppie contengono, in entrambe le fonti, la merce e i passeggeri da integrare
14Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
TIPI DI CARICO INTEGRATI:TIPI DI CARICO INTEGRATI:• merce in Rinfusa liquida attraverso il tipo nave
Portarinfuse liquide• merce in Rinfusa solida attraverso il tipo nave
Portarinfuse solide• merce in container attraverso tipo nave
Portacontainer• merce in traghetto attraverso il tipo nave
Traghetto• merce in Trasportatore non specializzato
attraverso l’omonimo tipo nave
15
L’integrazione della MERCEInnovazione nelle
indagini statistiche sui trasporti
segue ALTRE INTEGRAZIONIsegue ALTRE INTEGRAZIONI:
Numero di passeggeri attraverso il tipo nave Traghetto-Aliscafo
Movimenti di TUTTE le NAVI Arrivate/Partite
16
L’integrazione di PASSEGGERI e NAVI
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
17
L’ INTEGRAZIONE
Roma, 6 dicembre 2011
RISULTATI DEL linkage
• l’evento Nave Arrivata/Partita si rileva nei modelli 61 e non nella fonte Istat
INTEGRAZIONE MR TOTALI
Innovazione nelle indagini statistiche sui
trasporti
18Roma, 6 dicembre 2011
l’evento Nave Arrivata/Partita si rileva in entrambe le fonti, ma merce, passeggeri e/o il numero di navi A/P non coincidono,
si tiene conto di quanto dichiarato nei modelli 61
INTEGRAZIONE MR PARZIALI
L’ INTEGRAZIONEInnovazione nelle
indagini statistiche sui trasporti
19
ESEMPIO di integrazione delle tonn. merce
Roma, 6 dicembre 2011
RINFUSA LIQUIDAISTAT
RINFUSA LIQUIDAFonte AMM.
RINFUSA SOLIDAISTAT
RINFUSA SOLIDAFonte AMM.
TRAGHETTIISTAT
TRAGHETTIFonte AMM.
PORTACONTAINERISTAT PORTACONTAINER
Fonte AMM.
Innovazione nelle indagini statistiche sui
trasporti
20
L’utilizzo dei MIRROR DATA
Roma, 6 dicembre 2011
Il Trattamento delle MR totali e parziali prevede anche una integrazione utilizzando i mirror data.
Attualmente sono utilizzate entrambe le tecniche:
- RL per l’Integrazione con i mirror data
- RL per l’Integrazione con dati amministrativi delle capitanerie di porto
Innovazione nelle indagini statistiche sui
trasporti
Ogni porto può avere al massimo 2 eventi (Nave Arrivata/Partita) verificabili
per una coppia di porti AB il n. max = 4
21Roma, 6 dicembre 2011
Partenza da A per B
Arrivo in B da A
A B
L’utilizzo dei MIRROR DATAInnovazione nelle
indagini statistiche sui trasporti
La chiave differisce da quella utilizzata per integrare con dati delle capit. di porto nella variabile Direzione (Arrivo/Partenza):
• Numero IMO (International Maritime Organization)
• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione
22
RL e mirror data: la match key
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
23
ESEMPI DI MIRROR
Roma, 6 dicembre 2011
Olbia
Civitavecchia
Innovazione nelle indagini statistiche sui
trasporti
24
ESEMPI DI MIRROR
Roma, 6 dicembre 2011
Lampedusa
Linosa
P.Empedocle
Innovazione nelle indagini statistiche sui
trasporti
25Roma, 6 dicembre 2011
a) INFORMATIZZAZIONE dei modelli 61, ad opera del Ministero delle Infrastrutture e Trasporti
b) Procedure automatiche per l’individuazione e il recupero dei ‘non rispondenti’, utilizzando anche i risultati del RL
Sviluppi futuri
Innovazione nelle indagini statistiche sui
trasporti
top related