estudio longitudinal de supervivencia de la cohorte censal ...integra la información nominal de...
TRANSCRIPT
Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001
F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2
1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas
http://epidemos.es/Sevilla2016 1/3
Antecedentes
La reutilización de la información de los ficheros estadísticos y administrativos paragenerar nuevas estadísticas es una simple cuestión de coste-eficacia: generar nuevainformación estadística a partir del enlace de registros preexistentes no solo disminuyeel coste y la sobrecarga del informante, sino que en muchos casos es la única manerafactible de obtener determinada información estadística.En esta linea, el Instituto de Estadística y Cartográfica de Andalucía (IECA) es-tá desarrollando una nueva fuente: la Base de Datos Longitudinal de Población(BDLP), en la que se está integrando la información, que hasta ahora se encontrabaen sistemas independientes, relativa a los individuos que en los últimos años han resi-dido en Andalucía. Con esta nueva fuente se pretende aportar novedosas estadísticasadecuadas para investigar el efecto de los determinantes económicos y sociales sobrelos comportamientos demográficos o la salud de las poblaciones.El producto de difusión del IECA: Estadísticas Longitudinales de Supervivencia yLongevidad en Andalucía, que se describe en esta comunicación, muestra algunas de laspotencialidades que esta nueva fuente representa para la investigación epidemiológica.
Reconstrucción de biografías registrales
Objetivos
• Reconstruir las biografías vitales y residenciales de los individuos incluidos en elcenso de 2001 durante 2002-2013, con objeto de reproducir un estudiolongitudinal de cohortes usando como categorías de exposición la informacióncontenida en los cuadernillos censales.
• Con la información generada por esta explotación, diseñar un producto dedifusión web, dirigido a investigadores especializados en temas de mortalidad ysupervivencia, que maximizando el contenido útil de información suministradapreserve la confidencialidad de la información.
Fuentes de la BDLP
Fuentes de datos
La fuente de este trabajo ha sido la Base de Datos Longitudinal de Población deAndalucía (BDLP), la cual es un sistema de finalidad exclusivamente estadística, queintegra la información nominal de diferentes registros estadísticos y administrativos deámbito poblacional. La BDLP nace a partir del Registro de Población de Andalucía(RPA), creado por la Ley 8/2002 del Plan Estadístico de Andalucía 8/2002. actualPlan Estadístico y Cartográfico de Andalucía ha definido a la BDLP (Articulo 18.bde la Ley 3/2013) como ámbito prioritario de actuación en cuanto a infraestructurade información estadística.En la actualidad, la BDLP integra información proveniente de las siguientes fuentes:
• Las variaciones continuas de los padrones municipales de población.• Los Boletines estadísticos de partos, defunciones y matrimonios del Movimiento
Natural de Población (MNP).• La información de los Censos de 1991, 2001 y la muestra censal de 2011• Otras fuentes administrativas tales como los datos de cotizaciones y pensiones de
la Seguridad SocialLa BDLP se constituye como un banco de datos histórico que recoja los itinerariosdemográficos de los individuos desde el nacimiento hasta su muerte, organizada enforma de base de datos, donde las claves de identificación individual establecen lasrelaciones entre las diferentes áreas del sistema. Actualmente, la BDLP, integra infor-mación relativa a casi 11 millones de personas distintas, que en algún momento desde1996 han estado inscritas en alguno de los padrones municipales de Andalucía. Más de5 millones de estas personas han protagonizado alguna inscripción en el MNP. En casi8 millones de ellas se cuenta con la información recopilada en los censos de poblacióny en 5,5 millones de ellas se dispone de información socio-económica proveniente delos ficheros de Pensiones y Cotizaciones de la Seguridad Social.
Estructura de la BDLP
Padrones Censos PoblaciónM.N.P.Seguridad Social
Pensiones7,6M(1,7M)
~99%
vPersonas
Cotizaciones53,3M(4,3M)
~95%
Partos1,6M~99%
vPersonas
Matrimonios0,7M~95%
Defunciones1,2M~95%
VariacionesA:33MB:26M
vPersonas
Extraciones160M
Muestra 20110,7M>99%
vPersonas
20017,4M~99%
19917,0M~78%
Personas10,7M
5,4M5,2M
7,8M
Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001
F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2
1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas
http://epidemos.es/Sevilla2016 2/3
Diseño del estudio
Con la información de la BDLPA se ha diseñado un estudio longitudinal de cohortesusando información de los padrones municipales, el Censo de población y vivien-das de 2001 y los Boletines Estadísticos de Defunción. Esta información ha sidocombinada con objeto de obtener una base de datos de explotación construida con lassiguientes especificaciones:
• Población de partida: Se selecciona a los individuos recogidos en el Censo de2001 (7.357.547), localizados en algún alta padronal en un municipio deAndalucía y de estos se selecionan las altas activas el 1-1-2002 (98,3 % de loscensados).
• Periodo de seguimiento (Ventana de observación): Sobre estapoblación censada y residente en Andalucía el 1-1-2002 se comprueban lasmodificaciones de su situación de residencia o estado vital, recogidas tanto en lasaltas y bajas padronales como en los Boletines de Defunción, desde el 1 enerode 2002 hasta el 31 de Diciembre de 2013 (12 años de seguimiento).
• Condiciones que determinan el fin del seguimiento: El fin deseguimiento de cada uno de los individuos participantes se puede producir poruna de estas tres causas:• Fallecimiento registrado en MNP y/o baja padronal por defunción• Emigración fuera de Andalucía por salida de Andalucía, por emigración informada por una
baja padronal.• Censura por fin de estudio En la gran mayoría de los casos el fin de seguimiento se produce
por llegar vivo y residente en Andalucía a la fecha de cierre de estudio 31-12-2013.
Población de referencia y ventana de seguimiento
1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010
05
1015
2025
3035
4045
5055
6065
7075
8085
9095
100
Periodo
Eda
d
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
Cie
rre
del s
egui
mie
nto
Com
ienz
o de
l seg
uim
ient
o
Periodoobservación
Observación exposiciónVariables Censo 2001
●
●
DefunciónPerdida por emigración
Historia previa al comienzo del seguimientoEn seguimiento del estado vital y residencial
7,2 Millones de personas comienza el seguimiento el 1−Ene−2002
706 Mil fallecidos entre 1−Ene−2002 y 31−Dic−2013
350 Mil perdidas por emigracion fuera de Andalucía entre 1−Ene−2002 y 31−Dic−2013
79,6 Millones de personas−año de exposición a riesgo en el estudio
Resultados
Tres productos diferentes se presentan en la publicación web: Estadísticas Longitudi-nales de Supervivencia y Longevidad en Andalucía
1 Una serie de tablas estadísticas con defunciones y personas-año clasificadas enlas categorías de riesgo definidas con la información del censo de 2001. Sedistribuyen en forma de cubos OLAP, manipulables mediante aplicación web obien directamente descargables en formato pc-axis
2 Unos ficheros de microdatos, con muestras aleatorias de individuos y hogares.Para la selección muestral se han utilizado como estratos las secciones censalesen la muestra de personas y las unidades territoriales del POTA en la deviviendas. En cada estrato se ha realizado un muestreo aleatorio simple con unafracción de muestreo del 10 %. En los microdatos para cada uno de losindividuos seleccionados se ha incluido, además de las variables censales, sutiempo de seguimiento y en su caso las modificaciones de la zonas de residencia.
3 Mapas de mortalidad para área pequeña en celdillas regulares de 250 metros y 1Km de lado, con la mortalidad general y para los grandes grupos de causa.
http://www.juntadeandalucia.es/institutodeestadisticaycartografia/longevidad
Generación de los cubos OLAP de la publicación
Las escalas de tiempo edad y periodo son habituales predictores en los modelos de-mográficos, que están cambiando de un modo continuo desde el inicio al fin del segui-miento. Si bien es posible trabajar con ellas como variables continuas si disponemosde ficheros de microdatos, lo habitual es transformarlas en variables discretas, talescomo años cumplidos o periodos anuales, para facilitar su agregación y la producciónde tablas y resúmenes numéricos con eventos y tiempos de exposición a riesgo.La discretización de las variables temporales es imprescindible para poder poder gene-rar los cubos OLAP con las defunciones y persona-año. Para discretizalas se definenuna serie de puntos de corte en cada escala. A nivel práctico, este paso consiste enasumir que una variable continua (por ejemplo, la edad) se transforma en una funciónescalonada, bajo con la asunción de equivalencia del efecto en los intervalos en quese han discretizado. Estas fronteras dibujan un malla sobre el diagrama de Lexis, quedividen los episodios en sub-episodios en los cuales el efecto edad y periodo se asumeinvariables.
Tabulación de las Defunciones y Personas-año
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
5152
5354
5556
5758
5960
6162
6364
6566
Periodo
Eda
des
●
●
● ●
Cie
rre
del s
egui
mie
nto
Com
ienz
o de
l seg
uim
ient
o
0 Defu19.2 Pers−año
0 Defu4.4 Pers−año
0 Defu4.8 Pers−año
0 Defu6.6 Pers−año
0 Defu5.6 Pers−año
0 Defu6.6 Pers−año
0 Defu15.4 Pers−año
1 Defu13.7 Pers−año
0 Defu7.5 Pers−año
0 Defu7.5 Pers−año
0 Defu5.4 Pers−año
0 Defu4.2 Pers−año
0 Defu4.2 Pers−año
1 Defu3.7 Pers−año
0 Defu3.1 Pers−año
0 Defu3.1 Pers−año
0 Defu4.1 Pers−año
0 Defu4.1 Pers−año
0 Defu4.1 Pers−año
0 Defu1.1 Pers−año
●
●
DefuncionesPerdidas por emigración
Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001
F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2
1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas
http://epidemos.es/Sevilla2016 3/3
Algunos ejemplos de explotación
Sevilla: Mortalidad 2002-2013 y desempleo en 2001
Tasas de mortalidad por nivel educativo y edad
Hombres Mujeres
10
100
1000
40 60 80 40 60 80edad
Tasa
por
10.
000
pers
onas
y a
ño
EstudiosAnalfabetosMenos de 5 años1º grado2º grado 1º ciclo2º grado 2º cicloSuperiores
Campo de Gibraltar: Mortalidad 2002-20013 y desempleoen 2001
Comparaciones internacionales
e30 por nivel educativo
● ●
●
●
●●
●●
●●
●●
●●
● ●
●●
● ●
●
●
● ●
● ●
● ●
●●
●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
Men
os q
ue s
ecun
daria
Sec
unda
ria s
uper
ior
Est
udio
s su
perio
res
Estonia
Hungría
Polonia
República Checa
Dinamarca
EU21 media
Irlanda
Canadá
Portugal
Suecia
Finlandia
Eslovenia
Noruega
Países Bajos
Andalucía
Italia
40 50Expectativa de vida
Zon
a ge
ográ
fica
sexo●
●
HombresMujeres
La referencia para la Esperanza de vida en otros países es OCDEhttp://www.visualizing.org/datasets/economic-return-education-2012. El periodo de la estimaciones es entorno a la primera decada del siglo XXI. Los niveles educativos utilizados se han agrupado en tres niveles:menos que secundaria superior, secundaria superior y estudios superiores. La intervalos y el punto centralrepresentan, de izquierda a derecha, el indicador de esperanza de vida de menor a mayor nivel educativo
Conclusiones y recomendaciones
1 El estudio longitudinal de supervivencia de la cohorte censal de 2001 ha puesto a disposición pública un extenso y novedoso banco de datos, susceptible de ser utilizado para la investigaciónEpidemiológica y Demográfica
2 El aprovechamiento pleno de la información difundida por este estudio, requiere algunas capacitaciones en metodología y herramientas de tratamiento de datos que hoy no son habituales en loscurrículum formativos universitarios. Quizás este hecho explique una demanda de estos datos inferior a las expectativas originales.
3 El diseño de este estudio, es fácilmente re-utilizable para la investigación de otros fenómenos demográficos. En la actualidad se está trabajando en publicaciones similares para estudiar fecundidad,migraciones o biografias laborales.
4 La integración de la información de la BDLP con los sistemas de información sanitaria desarrollados con una lógica biográfica similar, constituiría un instrumento de excepcional interés para lainvestigación epidemiológica en nuestro medio.