risco relativo espacial em estudos caso ......foi conduzido um estudo caso-controle com base...
TRANSCRIPT
RISCO RELATIVO ESPACIAL EM ESTUDOS CASO-CONTROLE
COM RESPOSTA MULTINOMIAL
L.V.A Silveira1, A.C.C.N. Mafra2, R. Cordeiro2, L.B. Nucci2, C. Stephan2
1 Departamento de Bioestatística (IB), Universidade do Estado de São Paulo UNESP, Botucatu,
SP. 2Laboratório de Análises Espaciais de Dados Epidemiológicos (epiGeo),Universidade Estadual
de Campinas UNICAMP, Campinas, SP.
Introdução
O estudo do risco no espaço tem se tornado cada vez mais comum em pesquisas
epidemiológicas1-5, pois permite identificar áreas que contém fatores ainda não estudados e que
muitas vezes não poderiam ser incluídos em um modelo, por sua complexidade, mas que se sabe
ser referente às características específicas daquela região. Outra vantagem, quando não se inclui
na análise outros fatores além do espacial, é identificar áreas onde são necessárias ações de
intervenção.
Para o caso específico de estudos do tipo caso-controle, Bithell6 definiu o risco relativo
espacial como uma razão de densidades de pontos que poderia ser obtido através de estimativas
de Kernel. Alguns anos mais tarde, Kelsall e Diggle7 mostrariam que o mesmo risco relativo
poderia ser estimado através do ajuste de Modelos Aditivos Generalizados onde, além da análise
não-paramétrica do espaço, poderia ser incluída uma análise paramétrica de covariáveis de
interesse.
Todo este desenvolvimento foi feito para estudos onde a resposta é binomial (casos e
controles). Porém, existem circunstâncias onde se deseja categorizar a resposta de interesse em
mais do que dois grupos, exigindo assim uma abordagem multinomial.
Nos últimos anos muitos estudos epidemiológicos do tipo caso-controle têm utilizado o
formato multinomial em suas análises8-12. Quando aplicável, a categorização dos casos em mais
níveis de resposta enriquece a análise e traz informações discriminadas para cada tipo específico
de caso.
Os modelos multinomiais podem ser ajustados de diversas maneiras13 e pode-se averiguar
se a resposta é nominal ou ordinal e enquadrar o estudo no formato mais adequado, porém Mafra
et. al11 ressaltam a importância de conduzir as análises de estudos do tipo caso-controle
comparando cada tipo de caso com os controles, para assim poder ter medidas de risco.
Neste trabalho, define-se o risco relativo espacial de forma bivariada, permitindo a inclusão
de outras covariáveis na análise e mostra-se a maneira de estimar tal risco através de modelos
aditivos generalizados e obter áreas de significância por meio de simulações de Monte Carlo.
Dados
Foi conduzido um estudo caso-controle com base populacional com 779 trabalhadores
informais que sofreram acidente do trabalho na cidade de Piracicaba, sudeste do Brasil, em 2007,
e que foram atendidos em um dos oito pronto-socorros desta cidade, como controles, foram
estudados 1544 trabalhadores informais que não sofreram acidente de trabalho nos três anos
anteriores e que trabalhassem na região de estudo14. Neste trabalho foram utilizadas as seguintes
variáveis:
- coordenadas geográficas do local de ocorrência dos acidentes, para casos e
- coordenadas geográficas do local de trabalho, para controles;
- idade do trabalhador (anos);
- anos de escolaridade;
- sexo (masculino ou feminino);
- grande grupo de ocupação, sendo estes definidos como: serviço, cientistas, administração,
agropecuária, manutenção, operários, técnicos, indefinidos.
Na Figura 1 tem-se a distribuição espacial de pontos dos casos e controles.
Figura 1: Distribuição espacial dos locais de acidente e trabalho. A) Pontos dos casos leves e dos controles. B) Pontos dos casos graves e controles. Piracicaba (Brazil), 2007.
Risco Relativo Espacial para respostas multinomiais
Considere um conjunto de pontos que consistem na localização de casos e controles
como observações de dois processos de Poisson independentes I e II na região 2ℜ⊂A , com
intensidades λ1(x) e λ2(x), respectivamente. A função log-risco, aparte uma constante aditiva
conhecida, é definida por Kelsall e Diggle15, como:
( ) ( )( )
=
xx
x2
1log λλρ .
À partir daí, o risco seria obtido através do exponencial do log-risco:
( ) ( )( )xx ρθ exp=
E para obter o risco relativo, basta dividir o risco pontual pelo risco médio na região do
estudo16.
Definição do risco espacial
No caso multinomial, o principal pressuposto é de que, no modelo de processos de
Poisson, cada uma das diferentes categorias de resposta são estocasticamente independentes.
Sendo r o número de categorias de resposta, tem-se r processos de Poisson independentes com
funções de intensidade λj(x), j=1,...,r.
Seja qj a proporção amostral de casos do tipo j, ou seja, a proporção de indivíduos na
categoria j contemplados na amostra, em relação a estes indivíduos na população. Para uma
determinada doença e uma delimitada região de interesse, seja x uma matriz de coordenadas
geográficas que mapeia indivíduos com a doença em e u uma matriz de covariáveis de
interesse associadas aos indivíduos estudados. A probabilidade de qualquer indivíduo, observado
no conjunto de dados, pertencer a categoria j é dada por:
( )
( )rj
q
qp
r
m
mm
jj
j ..., ,2 ,1 ,
,
,),(
1
==
∑=
ux
uxux
λ
λ
(1)
sendo ( )xjλ , a função densidade espacial de ocorrência de casos do tipo j da doença em
(número de ocorrências por unidade de área na localização x), ( )∑=
=r
j
jp1
1ux, .
Em estudos onde há informação da distribuição espacial da população fonte, como, por
exemplo, estudos do tipo caso-controle, há a possibilidade de se comparar cada uma das
categorias de casos com a categoria de controles através de uma abordagem nominal. Seja r a
categoria referente aos controles, o log-risco é definido da seguinte maneira:
( )( )( )
1,,2,1,,
,ln, −=
= rj
r
j
j Kux
uxux
λ
λρ (2)
Estimando o log-risco
Kelsall e Diggle7 consideram o uso de regressão com uma proposta semi-paramétrica na
estimação do log-risco espacial, como métodos alternativos para estimar a razão de densidades,
junto ao ajuste de demais covariáveis de interesse. Segundo os autores, estas estimativas são
obtidas a partir do logaritmo da razão de duas densidades que podem ser estimadas através de
funções Kernel. Para tanto, os autores propõe uma regressão Kernel de Nadaraya-Watson para
obter estimativas de p(x,u), considerando um Kernel Gaussiano Ponderado. O Modelo Aditivo
Generalizado (GAM) seria uma opção viável para estimar o logito de p(x,u), para uma
determinada banda h. Como a resposta, neste caso, é binominal, este é o próprio log-risco, a
parte uma constante aditiva conhecida.
Para estender este desenvolvimento para estudos caso-controle em que a resposta é
multinomial, foi proposto o ajuste de GAM para o Polytomous Logistic Model13.
Com base nos GAM apresentados por Hastie e Tibshirani17, Kelsall e Diggle7 propuseram
um algoritmo para estimar o risco espacial através de uma função Kernel Bidimensional de
forma semi-paramétrica com a adição de covariáveis não espaciais, quando a resposta é
binomial. Para um ajuste que incorpore resposta multinomial, tal algoritmo precisou ser
modificado para o caso específico do modelo multinomial escolhido.
O logito estimado para este tipo de análise permite obter o risco estimado, a menos uma
constante multiplicativa.
A significância dos componentes paramétricos estimados são obtidos de modo usual,
como nos modelos lineares generalizados, com base na magnitude da razão entre estimativas e
seus respectivos erros padrão. Para obter a significância da variação do risco relativo espacial
estimado (RREE), não foram ainda descritos métodos analíticos, porém Kelsall e Diggle15
propõem um procedimento de Monte Carlo para dados binomiais, o qual foi adaptado para a
análise multinomial.
Resultados
Para o estudo dos acidentes de trabalho foram estimados os riscos relativos espaciais
através de dois modelos: um puramente espacial (apenas com as coordenadas geográficas) e
outro semiparamétrico que, além do espaço, contém as variáveis: idade, sexo, anos de
escolaridade do trabalhador e o grupo de ocupação do mesmo.
As funções para o ajuste dos GAM e estimação dos RREE foram executadas no software
R 2.7. Os mapas foram construídos no ArcMap 9.2.
As informações da parte paramétrica do ajuste estão na Tabela 1. Uma análise de
deviance que compara os dois modelos ajustados nos dá uma deviance de 117,49 com 20 graus
de liberdade, mostrando que a inclusão das covariáveis à análise espacial é altamente
significativa (p-valor<0,0001 para um teste χ2 ).
Tabela 1: Medidas obtidas através do ajuste do modelo semiparamétrico (covariáveis e espaço). N=2323. Piracicaba (SP), 2007. leves versus controles graves versus controles
OR LI(OR) LS(OR) OR LI(OR) LS(OR)
Idade 0,97 0,96 0,97 0,99 0,98 1,00
Anos de Escolariadade 0,94 0,92 0,96 0,96 0,92 1,00
Sexo Feminino 1,00 - - 1,00 - -
Masculino 1,84 1,49 2,28 2,37 1,60 3,52
Grupos de Ocupação Serviços 1,00 - - 1,00 - -
Cientista 1,20 0,83 1,73 1,02 0,51 2,04
Administração 0,79 0,43 1,46 1,32 0,55 3,18
Agropecuária 1,90 1,09 3,31 2,22 0,87 5,66
Manutenção 1,57 1,15 2,14 1,59 0,90 2,80
Operário 1,44 1,18 1,75 1,60 1,12 2,27
Técnico 1,14 0,89 1,46 1,78 1,20 2,63
Indefinido 2,20 1,61 3,00 1,56 0,76 3,19 OR: Odds Ratio; LI: 95% Limite Inferior; LS: 95% Limite Superior.
Os RREE obtidos através do modelo apenas espacial podem ser visualizados na Figura
2, e os obtidos com a inclusão de covariáveis, na Figura 3.
Figura 2: Distribuição espacial do risco relativo de acidentes de trabalho. Modelo apenas espacial. Piracicaba (Brazil), 2007. A) Risco de casos leves em relação aos controles. B) Risco de casos graves em relação aos controles.
Figura 3: Distribuição espacial do risco relativo de acidentes de trabalho. Modelo com espaço, idade, escolaridade, sexo e grupo de ocupação. Piracicaba (Brazil), 2007. A) Risco de casos leves em relação aos controles. B) Risco de casos graves em relação aos controles.
Discussão
Na análise de acidentes de trabalho foram encontradas áreas de risco e de proteção
significativas ainda que com a inclusão de covariáveis, sendo que estas variaram conforme o tipo
de caso analisado, algo que ressalta a importância das análises multinomiais, quando estas são
adequadas.
Este trabalho apresenta o caminho completo para uma análise espacial de estudos caso-
controle com resposta multnomial e ainda permite a inclusão de covariáveis.
Tal análise permite a identificação de áreas específicas, auxiliando no planejamento de
ações de controle dos agravos, que poderão ter enfoque no tipo específico de caso.
Referências
1. Abreu MNS, Siqueira AL, Cardoso CS, Caiaffa WT. Ordinal logistic regression models:
application in quality of lifes studies. Cadernos de Saúde Pública 2008;24(Sup 4):S581-S591.
2. French JL, Wand MP. Generalized additive models for cancer mapping with incomplete
covariates. Biostatistics 2004, 5(2):177-191.
3. Ozonoff A, Webster T, Vieira V, Weinberg J, Ozonoff D, Aschengrau A. Cluster
detection methods applied to the Upper Cape Cod cancer data. Environ. Health. 2005; 4:19.
4. Shimakura SE, Carvalho MS, Aerts DRGC, Flores R. Distribuição espacial do risco:
modelagem da mortalidade infantil em Porto Alegre, RS, Brasil. Cad. Saúde Pública 2001;
17(5):1251-61.
5. Zangirolanie LT, Cordeiro R, de Medeiros MA, Stephan C. Spatial distribution of risks
for work-related injuries in a city of Southeastern Brazil.Rev. Saúde Pública. 2008; 42(2): 287-
93.
6. Bithell JF. An application of density estimation to geographical epidemiology. Stat Med
1990;9(6):691-701.
7. Kelsall JE, Diggle PJ. Kernel estimation of relative risk. Bernoulli 1995;1(1-2):03-16.
8. Campbell PT, Sloan M, Kreiger N. Utility of proxy versus index respondent information
in a population-based case-control study of rapidly fatal cancers. Ann Epidemiol.
2007;17(4):253-7.
9. Chiu BC, Dave BJ, Blair A, Gapstur SM, Chmiel JS, Fought AJ, Zahm SH,
Weisenburger DD. Cigarette smoking, familial hematopoietic cancer, hair dye use, and risk of
t(14;18)-defined subtypes of non-Hodgkin's lymphoma. Am J Epidemiol. 2007;165(6):652-9.
10. Haelterman E, Marcoux S, Croteau A, Dramaix M. Population-based study on
occupational risk factors for preeclampsia and gestational hypertension. Scand J Work Environ
Health. 2007;33(4):304-17.
11. Mafra ACCN, Nucci LB, Cordeiro R, Stephan C. Case-control studies with multinomial
responses:a proposal for analysis [portuguese]. Cadernos de Saúde Pública [IN PRESS].
12. Song XY, Lee SY, Ng MC, So WY, Chan JC. Bayesian analysis of structural equation
models with multinomial variables and an application to type 2 diabetic nephropathy. Stat Med.
2007;26(11):2348-69.
13. Agresti A. Catergorical data analysis. 2nd Ed. New York: John Wiley & Sons; 2002.
14. Stephan C. Distribuição do risco de acidente do trabalho entre trabalhadores
precarizados de Piracicaba. - Campinas, SP : [Tese de Doutorado], Faculdade de Ciências
Médicas, 2008.
15. Kelsall JE, Diggle PJ. Spatial variation in risk of disease: a nonparametric binary
regression approach. Journal of the Royal Statistical Society (Series C): Applied Statistics
1998;47(4):559-573.
16. Bailey TC, Cordeiro R, Lourenço RW. Semiparametric Modeling of the Spatial
Distribution of Occupational Accident Risk in the Casual Labor Market, Piracicaba, Southeast
Brazil. Risk Analysis 2007;27(2):421-431.
17. Hastie TJ, Tibshirani RJ. Generalized additive models. London: Chapman and Hall;
1990.