orientando : alexandro vieira lopes orientadora : profª. drª.vilma mayumi tachibana 1/ 26...
TRANSCRIPT
Orientando : Alexandro Vieira Lopes
Orientadora : Profª. Drª.Vilma Mayumi Tachibana
1/ 26
Regressão Logística e Aplicação em Software
Estatísticos
INTRODUÇÃO
2/ 26
Razão de Razão de ChancesChances
Aplicação Conjunto Dados Aplicação Conjunto Dados CardíacosCardíacos
Aplicação e Comparação Aplicação e Comparação dos Software Estatísticosdos Software Estatísticos
RAZÃO DE CHANCES
3/ 26
O que os Coeficientes estimados do modelo informam num estudo
Variável Independente DicotômicaDicotômica
Variável Independente PolitômicaPolitômica
Variável Independente ContínuaContínua
RAZÃO DE CHANCES
4/ 26
Variável Independente Dicotômica
1 e
A RAZÃO DE CHANCES é uma medida de associação que aproxima o mais (menos) provável do resultado estar presente entre aqueles com X = 1 do que entre aqueles com X = 0.
RAZÃO DE CHANCES
5/ 26
A razão de chances é:
A chance da ocorrência de Problema Cardíaco é 8 vezes maior em pessoas com idade maior que 55 anos do que em uma pessoa com idade inferior a 55 anos.
Idade (X)
Prob. Card. Y >=55 (1) < 55 (0) Total
Presente (1) 21 22 43
Ausente (0) 6 51 57
Total 27 73 100
11,851/22
6/21
APLICAÇÃO DADOS CARDÍACOS
6/ 26
Hospital Pró-Cardíaco- RJ ; N = 599 Pacientes
APLICAÇÃO DADOS CARDÍACOS
7/ 26
IdadeIdade
SexoSexo = 0= 0 =1=1
Hipertensão Arterial: Hipertensão Arterial: Ausência = Ausência = 00 , Presença = , Presença = 11
Ausência = Ausência = 00 , Presença = , Presença = 11
Histórico Familiar:Histórico Familiar:
Não = Não = 00 , Sim = , Sim = 11
8/ 26
Infarto Prévio: Não = Infarto Prévio: Não = 00 , Sim = , Sim = 11
Não Fumante = Não Fumante = 00 , Fumante = , Fumante = 11
Óbito Óbito HospitalarHospitalar
= 0 = 0 = 1= 1
Killip de entrada Killip de entrada (intensidade):1,2,3,4.(intensidade):1,2,3,4.
Localização Parede: anterior,inferior, Localização Parede: anterior,inferior, lateral, onda Q: Não = lateral, onda Q: Não = 00 , Sim , Sim = = 11
APLICAÇÃO DADOS CARDÍACOS
RESULTADOS
Logito: g(x)g(x) = -5,688 + 0,02653*idade – = -5,688 + 0,02653*idade – -1,0693*sexo – 0,3607*has + 0,8363*iamp+ -1,0693*sexo – 0,3607*has + 0,8363*iamp+ +0,3984*diab - - 0,5155*fumo – 0,4053*hfam + +0,3984*diab - - 0,5155*fumo – 0,4053*hfam + 0,4707*parea + 0,4052*parei + + 04812*parel + 0,4707*parea + 0,4052*parei + + 04812*parel + 1,5733*kient.1,5733*kient.
MODELO COMPLETOMODELO COMPLETO
))((exp1
))((exp)(
xg
xgx
9/ 26
RESULTADOSMODELO COMPLETOMODELO COMPLETO
V a l o r P - v a l o r
P e a r s o n 5 1 5 , 2 8 8 0 , 7 7 1
D e v i a n c e 3 1 1 , 0 2 7 1
H o s m e r - L e m e s h o w 3 , 1 7 2 0 , 9 2 3
G ( R a z ã o V e r o s s i m i l h a n ç a s ) 1 5 5 , 0 1 3 0
Á r e a R O C 0 , 8 6 9
10/ 26
RESULTADOS
MODELO REDUZIDO MODELO REDUZIDO
Logito: g(x)g(x) = -6,6745 + 0,0383*idade – = -6,6745 + 0,0383*idade –0,9826*sexo + +1,8411*iamp + 1,8265*kient –0,9826*sexo + +1,8411*iamp + 1,8265*kient –0,6943*iamp*kient.0,6943*iamp*kient.
Seleção de Variáveis STEPWISESTEPWISE p-valor entrada = 0,15
p-valor remoção = 0,20. Termos de Interação.
11/ 26
))((exp1
))((exp)(
xg
xgx
RESULTADOS SOFTWARE STATA
12/ 26
RESULTADOS
MODELO REDUZIDOMODELO REDUZIDO
Valor P-valor
Pearson 522,85 0,755
Deviance 316,01 1
Hosmer -Lemeshow 3,2018 0,9211
G (Razão Verossimilhanças) 150,03 0
Área ROC 0,864
13/ 26
RESULTADOS
COMPARAÇÃO DE MODELOSCOMPARAÇÃO DE MODELOS
Gnovo = G(modelo completo) – G (modelo reduzido) Gnovo = 155,013 – 150,03 = 4,9834,983. Modelo completo p = 11 covariáveisModelo reduzido k = 5 covariáveis. )(2
511 )05,0(26= = 12,59
Como Gnovo = 4,983 <
)05,0(26 = 12,59.
14/ 26
Coeficientes das variáveis que NÃONÃO estão no modelo reduzido são iguais a zero ( i = 0 ). Variáveis NÃONÃO têm signficância estatística. Modelo reduzido sintetiza as variáveis mais importantes.
RESULTADOSRAZÃO DE CHANCESRAZÃO DE CHANCES
Sexo
Óbito Masculino (1) Feminino (0) Total
Sim (1) 43 38 81
Não (0) 391 127 518
Total 434 165 599
A razão de chances é:
A chance de óbito hospitalar é 33 vezes maior entre as mulheres comparado com os homens.
367,0127/38
391/43 9829,0ˆ eou 0,37
15/ 26
RESULTADOSPONTO DE PONTO DE CORTECORTE
Gráfico de Sensitividade Sensitividade xx Especificidade Especificidade, valores são obtidos a partir de diferentes pontos de corte.
Ponto de Corte = 0,110,11.
Se a probabilidade de um paciente for maior que 0,11 ele é classificado como tendo óbito óbito hospitalarhospitalar..
16/ 26
Software Reg. Log
Múltipla
Reg Log
Multinomial
Reg Log
Ordinal Diagnóstico
Tabela de
Classificação
Área
ROC
Seleção
Stepwise
Razão de
Chances
Verificação
do Ajuste
do Modelo
SAS X X X X X X X X X
R X X X X X X
Minitab X X X X X X X
SPSS X X X X X X X
COMPARAÇÃO SOFTWARE
17/ 26
CONSIDERAÇÕES FINAIS
18/ 26
Regressão Logística: Estudos de Regressão Logística: Estudos de Coorte, Caso-Controle ; Escolha do Coorte, Caso-Controle ; Escolha do Tamanho da Amostra ; Dados são Tamanho da Amostra ; Dados são Correlacionados.Correlacionados.
Manual dos Software.Manual dos Software.
Noções do Diagnóstico em Noções do Diagnóstico em Regressão Logística , Regressão Logística , && Regressão Regressão Logística Multinomial e Ordinal.Logística Multinomial e Ordinal.
CONSIDERAÇÕES FINAIS
19/ 26
Dificuldade de lidar com Dificuldade de lidar com observações perdidas e observações perdidas e colinearidade.colinearidade.
O modelo de Regressão Logística é uma O modelo de Regressão Logística é uma excelente opção para dados da variável excelente opção para dados da variável resposta binários: facilidade de resposta binários: facilidade de interpretação dos parâmetros, interpretação dos parâmetros, simplicidade,popularidade e simplicidade,popularidade e disponibilidade nos software disponibilidade nos software estatísticos.estatísticos.
Aplicar técnicas: Árvores de Classificação,Aplicar técnicas: Árvores de Classificação,Redes Neurais ou Análise Discriminante.Redes Neurais ou Análise Discriminante.Comparação dos modelos.Comparação dos modelos.
REFERÊNCIAS
20/ 26
BARROS, C. S. et al. Infarto agudo do miocárdio: um estudo Infarto agudo do miocárdio: um estudo bibliográfico sob a visão da enfermagembibliográfico sob a visão da enfermagem. Recife, 2006. Disponível em: <http://www.cbcenf.com.br/anaiscofen/pdf9/0226.pdf>. Acesso em: 10 set. 2008. BASSANEZI, R. C. Ensino-aprendizagem com modelagem matemáticaEnsino-aprendizagem com modelagem matemática. São Paulo: Contexto, 2004. 389 p. BUSSAB, W. de O.; MORETIN, P. A. Estatística básicaEstatística básica. 5. ed. São Paulo: Saraiva, 2002. 526 p. COLLETT, D. Modelling binary dataModelling binary data. London: Chapman & Hall, 1991. 369 p. FARHAT, C. A. V. Análise de diagnóstico em regressão logísticaAnálise de diagnóstico em regressão logística. 2003. 113 f. Dissertação (Mestrado em Estatística) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo.
REFERÊNCIAS
21/ 26
HOSMER, D. W.; LEMESHOW, S. Applied logistic regressionApplied logistic regression. 2nd ed. New York: Wiley, 2000. 375 p. ISHIKAWA, N. I. Uso de transformações em modelos de regressão Uso de transformações em modelos de regressão logísticalogística. 2007. 92 f. Dissertação (Mestrado em Ciências) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo. KRISHNAMOORTHY, K. Handbook of statistical distributions with Handbook of statistical distributions with applicationsapplications.. Boca Raton: Chapman & Hall/CRC, 2006. 345 p. KUBRUSLY, R. S. O tamanho do infinitoO tamanho do infinito. . Projeto novas tecnologias de Projeto novas tecnologias de ensinoensino. Rio de Janeiro, 2004. Disponível em: <http://www.dmm.im.ufrj.br/projeto/diversos/tamanho.html>. Acesso em: 1 jan. 2008. MONTGOMERY, D. C. et al. Introduction to linear regression analysisIntroduction to linear regression analysis. 2nd ed. New York: Wiley, 2001. 641 p.
SOUZA, A. D. P. Métodos aproximados em modelos hierárquicos Métodos aproximados em modelos hierárquicos dinâmicos bayesianosdinâmicos bayesianos. 1999. 142 f. Tese (Doutorado em Ciências em Engenharia de Produção) – COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro. SOUZA, E. C. Análise de influência local no modelo de regressão Análise de influência local no modelo de regressão logísticalogística. 2006. 101 f. Dissertação (Mestrado em Agronomia) – Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba. Disponível em: < http://www.teses.usp.br/teses/disponiveis/11/11134/tde-12042006-143935/>. Acesso em: 19 mar. 2008. TACHIBANA, V. M. Métodos aproximados em modelos bayesianos de Métodos aproximados em modelos bayesianos de resposta aleatorizada e regressão logísticaresposta aleatorizada e regressão logística. 1995. 133 f. Tese (Doutorado em Ciências em Engenharia de Produção) – COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro.
22/ 26
REFERÊNCIAS
BIBLIOGRAFIA
23/ 26
ANDRADE, A.O. Aplicação do modelo logístico multinomial no estudo Aplicação do modelo logístico multinomial no estudo da decisão do votoda decisão do voto. 2006. 152 f. Dissertação (Mestrado em Estudos Populacionais e Pesquisas Sociais) – Escola Nacional de Ciências Estatísticas, IBGE, Rio de Janeiro. Disponível em: <http://www.ence.ibge.gov.br/pos_graduacao/mestrado/dissertacoes/pdf/2006/adriana_oliveira_andrade_TC.pdf>. Acesso em: 08 mar. 2008. BUSSAB, W. de O. Análise de variância e de regressãoAnálise de variância e de regressão. São Paulo: Atual, 1986. 147 p. HAIR Jr, J. F. et al. Análise multivariada de dadosAnálise multivariada de dados. Tradução de Adonai Schlup Sant’ana, Anselmo Chaves Neto. Bookman, 2005. 593 p. JOHNSON, R. A.; WICHERN, D.W. Applied multivariate statistical Applied multivariate statistical analysisanalysis. 6th ed. New Jersey: Prentice Hall, 2007. 773 p. KLEINBAUM, D.G. Logistic Regression. A self-learning textLogistic Regression. A self-learning text. New York: Springer-Verlag, 1994. 282 p.
BIBLIOGRAFIA
MIGON, H. S. et al. Modelos hierárquicos e aplicaçõesModelos hierárquicos e aplicações. São Paulo: ABE, 2008. 269 p. MOOD, A. M. et al. Introduction to the theory of statisticsIntroduction to the theory of statistics. 3rd ed. New York: McGraw-Hill, 1974. 564 p. MYERS, R. H. et al. Generalized linear models with applications in Generalized linear models with applications in engineering and the sciencesengineering and the sciences. New York: Wiley, 2002. 342 p. OHTOSHI, C. Uma comparação de regressão logística, árvores de Uma comparação de regressão logística, árvores de classificação e redes neurais: analisando dados de créditoclassificação e redes neurais: analisando dados de crédito. 2003. 89 f. Dissertação (Mestrado em Estatística) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo. SANTOS, M.A. Regressão logística sob enfoque bayesianoRegressão logística sob enfoque bayesiano. 2007. 69 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente, 2007. 24/ 26
AGRADECIMENTOSObrigado a Deus e a nossa Senhora por tudo. Agradeço a minha orientadora professora Vilma
Mayumi Tachibana, que foi como uma mãe para mim.Sou muito grato a todos os colegas da turma da
estatística e especialmente a Bruno Pierre Lopes Vasconcelos, Cláudio Sá Rodrigues de Lima, Meire Midori Hori Pereira e Roberta Santos Ferreira por toda ajuda durante esta graduação.
Muito obrigado a Marta Bengüela, Genir Pulitti, Alessandra Kellen e Ermelinda Magosso, por dar me a oportunidade de morar tão perto da faculdade e por toda a caridade.
Agradecimento, a minha mãe Maria do Socorro Maria do Socorro Vieira Lopes, João Bosco Lopes, Alan Vieira LopesVieira Lopes, João Bosco Lopes, Alan Vieira Lopes que são a motivação de todo empenho e dedicação.
25/ 26
PRESIDENTE PRUDENTE
2008
4º ANO ESTATÍSTICA
Contato: [email protected]
Regressão Logística e Aplicação em Software
Estatísticos
26/ 26
Site : http://geocities.yahoo.com.br/alexandro2x