andrea mancini - open census
TRANSCRIPT
Open Census
Andrea Mancini Direttore dipartimento per i censimentie gli archivi amministrativi e statistici- Istat
Bologna, Smart Cities Exhibition, 16 ottobre 2013
LE INNOVAZIONI DEI CENSIMENTI 2011
Utilizzo di fonti amministrativeRealizzazione di liste pre-censuarieOrganizzazione di reti territoriali basate su criteri di flessibilità e diversificazione di ruoli e funzioniTecniche di acquisizione multi-canale
Governo dei processi guidato da sistemi informativi per la collaborazione tra i soggetti coinvolti
Andrea Mancini, Open Census, Bologna 16 ottobre 2013
Sito istituzionale
CIS: SISTEMI WEB IMPRESE E NON PROFIT
Portale della rete
Questionario SGR
I CENSIMENTI 2011: ORGANIZZAZIONE DEI SISTEMI INFORMATIVI PER LA FASE DI ACQUISIZIONE DATI
Questionario elettronico
Portale di comunicazione istituzionale
Un censimento completamente in rete
Questionario elettronico
Portale di comunicazione istituzionaleUn censimento completamente in rete
Sito informativo e repository dei materiali di lavoro per la rete di rilevazione (RETE)
I CENSIMENTI 2011: ORGANIZZAZIONE DEI SISTEMI INFORMATIVI PER LA FASE DI ACQUISIZIONE DATI
Questionario elettronico
Portale di comunicazione istituzionaleUn censimento completamente in rete
Sito informativo e repository dei materiali di lavoro per la rete di rilevazione (RETE)
Sistema di gestione della rilevazione (SGR)
I CENSIMENTI 2011: ORGANIZZAZIONE DEI SISTEMI INFORMATIVI PER LA FASE DI ACQUISIZIONE DATI
Quasi 25 milioni di potenziali rispondenti
8.783.824questionari compilati on line
Circa 80.000 operatori
Tre tipi di questionario(Long, short, convivenze
istituzionali)
85 funzioni disponibili in SGR
UTILIZZO DEI SISTEMI: POPOLAZIONE
UTILIZZO DEI SISTEMI: INDUSTRIA E SERVIZI
3417 Operatori
65 funzioni disponibili
Cinque tipi di questionario(2 imprese, 1 istituzioni no-
profit, 2 PA)
Più di 700.000 questionari acquisiti via web
Punte di 25.000 questionari al giorno
CARATTERISTICHE DEI QUESTIONARI ELETTRONICI
Strumento web per la compilazione autonoma del questionario
Facilità d’uso
Insieme minimale di controlli in fase di compilazione
Accesso riservato e sicuro
CARATTERISTICHE GENERALI DEL SISTEMA DI GESTIONE DELLA RILEVAZIONE (SGR)
Creazione e gestione autonoma delle rete di rilevazione
Sistema web di workflow distribuito
Gestione e monitoraggio della multi-canalità in
tempo reale
Interazione sul Controllo e sulla correzione del dato: dal dato grezzo alla validazione
PRINCIPALI FUNZIONI DI SGR
Creazione rete di rilevazione
Gestione del ciclo di vita dei questionari
Monitoraggio della rilevazione
Check dei questionari (solo industria e servizi)
Confronto censimento/anagrafe (solo popolazione)
Dati di sintesi per area di circolazioneArea di Circolazione – Via Cadibona
Lista/input Variazione Rilevato Attributi
Numeri Civici 20 +16 36 21 abitativi15 non abitativi
Edifici 18 +1 19 16 residenziali 2 servizi 1 non utilizzato
Famiglie 37 -3 3433 da lac 0 da lifa 1 da rnc
Individui 81 +1 82 35 maschi47 femmine
DIFFUSIONE DATI TERRITORIALI: IL FUTURO
CENSIMENTO POPOLAZIONE: DIFFUSIONE POPOLAZIONE LEGALE
Dati di popolazione legale e struttura demografica: pubblicati il 18 dicembre 2012 su I.Stat
App smartphone
Dati disponibili su Web in qualunque formato sotto una licenza aperta
Dati disponibili su Web in formato strutturato (leggibile e riusabile)
Uso di formati non proprietari per esporre dati su Web
Uso di Identificatori unici per denotare le informazioni su Web (le “cose”) in modo che possano essere “puntati” dagli utenti
I dati puntano-a / sono-puntati-da altri dati su Web
LE 5 DEGLI OPEN DATA (TIM BERNERS-LEE)
LE DEI DATI ISTAT
2 3113
3->4 Stiamo lavorandoper arrivare a 5
SIREA: SISTEMA A SUPPORTO DELLA REVISIONE DELLE ANAGRAFI COMUNALI
LISTE DEFINITIVE:
L1: Presenti in LAC censiti al medesimo indirizzoL2: Presenti in LAC non censitiL3: Censiti non presenti in LAC con flag di deduplicazioneL4: Presenti in LAC censiti ad un altro indirizzo Deduplicati intercomunali L1-L4
SGR SIREA
Con la funzione «Confronto censimento/anagrafe» di SGR ciascun Comune ha controllato la corrispondenza individuale tra iscrizione in anagrafe e presenza al censimento. SGR ha prodotto automaticamente il bilancio ad hoc del confronto per ciascun comune.
SIREA: SISTEMA A SUPPORTO DELLA REVISIONE DELLE ANAGRAFI COMUNALI
Stato della revisione al 10/10/2013:
COMUNI
COMUNI CHE STANNO ESEGUENDO LA REVISIONE
COMUNI CHE HANNO FINITO LA REVISIONE DELLA L2
COMUNI CHE HANNO FINITO LA REVISIONE DI L3
COMUNI CHE NON HANNO INIZIATO LA REVISIONE
8094 7664 2488 2488 430
TOT POPOLAZ
LISTA2 TOT
LISTA2 REV EFFETTUATE
LISTA2 DA REV TOTALE
LISTA2 DA REV PERC
LISTA3 TOTALE
LISTA3 REV EFFETTUATE
LISTA3 DA REV TOTALE
LISTA3 DA REV PERC
59.433.744 2.383.071 1.373.342 1.009.729 42,37 713.349 433.193 280.156 39,27
SUPERARE IL CENSIMENTO DECENNALE
• Costi elevati e concentrati nel tempo• Impegno organizzativo estremo• Crescente esigenza di privacy espressa
dall’opinione pubblica• Disponibilità di dati amministrativi non
pienamente sfruttati• Tempestività/Obsolescenza
dell’informazione
OBIETTIVI DEL CENSIMENTO PERMANENTE
Sistema integrato di dati amministrativi e indagine statistiche per la produzione
frequente di dati territoriali
Massimo uso di fonti amministrative non solo anagrafiche
+Indagini campionarie a rotazione per:• correggere gli errori di copertura
• integrare con nuovi dati le fonti amministrative
=
Dati censuari territoriali disponibili ogni anno
UN SISTEMA INTEGRATO DI ARCHIVI E CENSIMENTI
22
Altre fonti amministrative
Altre fonti amministrative
SistemaIntegratodi MicrodatidiFamiglie,Individui eUnità
InformazionisullaStruttura edEvoluzione delleUnità
Indaginieconomiche
Indaginieconomiche
SistemaInformativo della Popolazione (famiglie e individui)
ANAGRAFICOMUNALI
ANAGRAFICOMUNALI
CensimentoContinuodelle FamiglieIndividui e Convivenze
Indagini Demosociali
Indagini Demosociali
SistemaInformativodelle Unità Economiche
ServizioInformativo
ARCHIMEDE
D-sampleC-sample
D-sampleC-sample D-sample
C-sample
D-sampleC-sample
Archivio di indirizzi eSistema di Georeferenziazione
Dati statistici da fontiamministrative organizzate
Dati statistici da fontiamministrative organizzate
L’INDAGINE C-SAMPLE:
• Stimare e correggere l’errore di sovra e sotto-copertura delle anagrafi comunali
• Utilizza il metodo cattura-ricattura – I cattura: LAC– II cattura: campione areale di sezioni/n.ri civici
• Ritorno sul campo dopo il linkage tra le due fonti per la stima della sovra-copertura della LAC
• Circa 650.000 famiglie campione ogni anno
• Paperless Survey: tecnica CAPI
D-SAMPLE: UN'IPOTESI ALLO STUDIO
• Domini minimi:• Agglomerati di comuni (stessi di C-sample) con < 5000
ab.• Comuni tra 5000 e 20000 abitanti• Aree di censimento in comuni con > 20000 abitanti
• Produzione di stime dirette in tutti i domini di interesse
• Famiglie campione estratte dalle LAC ogni anno con riferimento a ciascun dominio
• Rotazione dei campioni di famiglie nel quinquennio
• Coordinamento negativo del campione di famiglie con la C-sample
• Paperless Survey: tecnica CAWI e CAPI per non ancora rispondenti
CENSIMENTO PERMANENTE: DIFFUSIONE DEI RISULTATI