teste de hipótese & p-value
TRANSCRIPT
Teste de Hipoteses &Valor-P
Matias Romario&
Gabriel
Universidade Federal do Ceara
03/06/2016
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 1 / 34
Sumario
1 IntroducaoDefinicaoAplicacaoTeoremasEstatıstica de TestesDecisao
2 ExemplosCalculo do valor-p
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 2 / 34
Metodos Estatısticos
Testes de Hipoteses consiste em verificar se a informacao estatıstica esuficientemente significante para rejeitar uma dada hipotese em favor deoutra (que e, de fato, o que se pretende comprovar estatisticamente).
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 3 / 34
Introducao a Hipoteses e Notacao
Sao fundamentais os seguintes conceitos para realizar um teste de hipotese:
Hipotese nula (H0: θ ∈ Θ):E a hipotese que assumimos como verdade para a construcao do teste.E o efeito, teoria, alternativa que estamos interessados em testar.
Hipotese alternativa (H1:θ ∈ Θ):E o que consideramos caso a hipotese nula nao tenha evidenciaestatıstica que a defenda.
Estatıstica do Teste: T (X )
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 4 / 34
Introducao a Hipoteses e Notacao
Continuando
Regiao de rejeicao: RR (a hipotese nula e rejeitada quando T (X ) ∈RR).
Erro do tipo I:A probabilidade de rejeitarmos a hipotese nula quando ela eefetivamente verdadeira (α)
Erro do tipo II:A probabilidade de rejeitarmos a hipotese alternativa quando ela eefetivamente verdadeira (β).
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 5 / 34
Conceitos iniciais
A ideia geral que temos a partir do slides atenriores e de que:
1 Faz-se uma suposocao inicial
2 Coleta-se evidencias (dados) em uma populacao
3 Baseado na avaliacao das evidencias, decide se aceita ou rejeita ahipotese inicial
*Em um Teste de Hipotese - Indepedente dos parametros da populacaoenvolvida - Os tres passos anteriores devem ser obedecidos.*Em estatıstica, nos sempre assumimos que a hipotese nula e verdadeira,ou seja, a hipotese nula e sempre o nosso pressuposto inicial.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 6 / 34
Exemplos de Erros
Como pela lei uma pessoa e inocente ate que se prove o contrario, ashipoteses sao:H0: A pessoa e inocente.H1: A pessoa e culpada.
Erro I: A pessoa e condenada apesar de ser inocente.
Erro II: A pessoa e absolvida apesar de ser culpada.
Naturalmente, a Justica procura reduzir a possibilidade de ocorrer o Erro I,pois entende-se que e mais grave condenar inocentes do que absolvercriminosos.
VerdadeDecisao Hipotese nula Hipotese alternativaNao rejeita a nula OK Erro tipo IIRejeitar nula Erro tipo I OK
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 7 / 34
Observacoes
Fixamos H0 :µ=µ0. Dependendo da informacao que fornece o problemaque estamos estudando, a hipotese alternativa pode ter uma das tresformas abaixo:H1 :µ 6= µ0 (teste bilateral);H1 :µ > µ0 (teste unilateral a direita);H1 :µ < µ0 (teste unilateral a esquerda).Fixar o nıvel de significancia α.
Testeσ S
n≥ 30 z z
n<30 z t
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 8 / 34
Introducao a Matematica do Teste
A estatıstica de teste e um valor calculado a partir da amostra, e que eusado para tomar a decisao acerca de rejeitar ou nao a hipotese nula.para proporcoes:
T =X − np0√np0q0
Estatıstica de teste para a media (σ conhecido):
T =X − µ0
σ/√n
Estatıstica de teste para a media da amostra:
Z =X − µ0
s/√n
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 9 / 34
Exemplo Ilustrativo
Uma linha de producao opera com um peso medio de enchimentode 16 ml por recipiente. Sobrenchimento e Subenchimento saoproblemas serios e a linha de producao deve ser paralisada se algumdeles ocorrer. De dados passados sabe-se que o Desvio Padrao e0,8ml. Um inspetor de qualidade analisa uma amostra de 30unidades a cada duas horas, e nesse intervalo ele toma a decisao.Se a media amostral foi de 15,82 ml, qual atitude tomar?Temos:µ0 = 16 mlH0 = 16H1 6= 16Supomos a confiancia do teste em 95 ←− α = 0,05
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 10 / 34
Solucao para uma amostra
Atraves da tabela, podemos observar que se trata de um teste do tipo Z.Trata-se de um teste bilateral, pois valores diferentes de 16 sao rejeitados.Entao ambos os lados da cauda de nosso grafico recebem 0,025, enotamos que na nossa tabela Z e encontramos o valor -1,96.Temos: σ = 0, 8, n = 30, x = 15,82 e µ0 = 16
Z =X − µ0
σ/√n
=
Z =15, 82− 16
0, 8/√
30= 1, 23
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 11 / 34
Exemplo 2
Um fabricante de conservas anuncia que o conteudo de seu produto e, emmedia, 2000 gramas, com desvio padrao de 40 gramas. A fiscalizacao depesos e medidas investigou uma amostra aleatoria de 64 latas, verificandouma media de 1990 gramas. Fixando o nivel de significancia em 0,05,devera o fabricante ser multado?
µ0 = 2000 gramasH0 = 2000H1 < 2000
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 12 / 34
Solucao
Temos a situacao em que se apresenta um H1 < µ0 . Logo, temos um testeunilateral a esquerda. Utilizando a tabela Z, encontramos o valor -1,64,temos tambem:n = 64, x = 1990 e µ0 = 2000 e σ = 40
Z =X − µ0
σ/√n
=
Z =1990− 2000
40/√
64= −2
Encontra-se dentro da area de H1 , logo o fabricante tem que ser multadopor colocar menos que o anuciado.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 13 / 34
Exemplo 3
Considere que uma industria compra de um certo fabricante, pinos cujaresistencia media a ruptura e especificada em 60 kgf (valor nominal daespecificacao). Em um determinado dia, a industria recebeu um grandelote de pinos e a equipe tecnica da industria deseja verificar se o loteatende as especificacoes.
H0 : O lote atende as especificacoes (Hipotese Nula)H1 : O lote nao atende as especificacoes (Hipoteses alternativa)Seja a V.A(variavel aleatoria) X : resistencia a ruptura X∼N(µ; 25)H0 : µ = 60 (Hipoteses simples)H1 : µ 6= 60 (Hipoteses Composta bilateral)
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 14 / 34
Forma Alternativa
Definicao Alternativa 1 do Teste de Hipoteses
Uma hipoteses estatıstica e uma afirmacao ou conjetura sobre o parametro, ouparametros, da distribuicao de probabilidades de uma caracterıstica, X, dapopulacao ou de uma v.a.
Definicao Alternativa 2 do Teste de Hipoteses
Um teste de uma hipoteses estatıstica e o procedimento ou regra de decisao quenos possibilita decidir por H0 ou H1 , com base a informacao contida na amostra.
Suponha que a equipe tecnica da industria tenha decidido retirar uma amostraaleatoria de tamanho n=16, do lote recebido, medir a resistencia de cada pino ecalcular a resistencia media X (estimador de µ)
X ∼ N
(µ,
25
16
)
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 15 / 34
Resolucao
Para quais valores de X a equipe tecnica deve rejeitar H0 e portantonao aceitar o lote?
Se o lote esta fora de especificacao, isto e, H1 :µ 6= 60, espera-se que amedia amostral seja inferior ou superior a 60 kgf .Suponha que equipe tecnica tenha decidido adotar a seguinte regra:rejeitar H0 se x for maior que 62.5 kgf e ou menor que 57.5 kgf .R
R= (x > 62,5 ou x < 57,5) −→Regiao de rejeicao de H0.
Rc = Ra =(x ≤ 57,5 x ≤ 62,4) −→Regiao de aceitacao de H0.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 16 / 34
Exemplo 2
Considerando o exemplo 1.H0 : Aceitar o lote.H1 : Nao aceitar o lote.Erro tipo I: Nao aceitar o lote sendo que ela esta dentro dasespecificacoes.Erro tipo II: Aceitar o lote sendo que ela esta fora das especificacoes.P(Erro Tipo I) = α(Nıvel de Significancia)α = P( Rejeitar H0 | H0 verdadeira)P(Erro Tipo II) = β = P(Nao rejeitar H0 | H0 falso)
1− β = P(Rejeitar |H0 Falso) →Poder do teste
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 17 / 34
Continuacao...
Considerando as hipoteses do exemplo 1: H0 : µ = 60 contra H1 : µ 6= 60.α = P(x > 62.5 ou x < 57.5 | H0 :µ = 60) → sob H0 , x ∼ N(60, 25/16).α = P(x > 62.5 | H0 : µ = 60) + P(x < 57.5 | H0 : µ = 60)=
P=
[x−60√25/16
> 62.5−60√25/16
]+ P
[x−60√25/16
< 57.5−60√25/16
]=
P[Z > 2] + P[Z < -2] = 0.02275 + 0. 02275 = 0.0445
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 18 / 34
Para duas amostras populacionais
Seja X uma variavel aleatoria contınua, para uma populacao 1 temos amedia de X igual a µ1 e para uma populacao 2 temos µ2. O objetivo ecompara a media populacional µ1 e µ2
A hipotese nula e a alterantiva do teste sao respectivamente:H0 : µ1 = µ2
H1 : µ1 6= µ2
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 19 / 34
Exemplo
Um estudo objetivou analisar a associacao entre diversas variaveis com asındrome metabolica (SM) em indivıduos de origem japonesa, com 30 anosde idade ou mais.Pergunta: Indivıduos com SM e sem SM possuem, em media, valoresiguais para pressao sistolica?Temos duas populacoes, uma com SM(µ1: media de PAS para P.1) eoutra sem SM(µ2)σ1 seria o desvio para a P.1 e σ2 para a P.2
Existe uma versao do teste de comparacao que pressupoe σ1 = σ2 e outraque nao faz esse pressuposto.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 20 / 34
Matematica do Teste para duas populacoes
Quando σ1 e σ2 sao conhecidos
Z =X 1 − X 2√σ2
1n + σ2
2n
=
Quando σ21 = σ2
2 = σ2 Sao desconhecidos
T =X 1 − X 2 − (µ1 − µ2)
S2p
√1n + 1
n
=
Onde S2p e uma media entre as variancias amostrais ponderada pelo grau
de liberdade n1-1 e n2-1:
S2p =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 21 / 34
Continuacao
Lembramos que H0 e verdadeira, t0 e um valor de uma variavel aleatoriaque segue a distribuicao t de Student com n1+n2 -2 graus de liberdade.Utilizando P(rejeita H0 | H0 e verdadeira) = 0.05 = αTemos um grafico bipartido com 0.025 em ambas as caldas. Entaosupomos que retiramos duas amostras, n1 = 50 e n2 = 52.
Grau de liberdade = n1+n2 -2 = 50 + 52 - 2 = 100, α = 0.05, logo1-α = 0.95Vamos agora encontrar o valor de t∗ na tabela de distribuicao t Student(t∗ = 1,984)
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 22 / 34
Resolucao
Considerando:n1 =52 n2 = 50x1 = 142,1 mmHg x2 = 121,6 mmHgs1 = 23,0 mmHg s2 = 21,3 mmHg
S2p =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2=
S2p =
51 ∗ 232 + 49 ∗ 21, 32
52 + 50− 2= 492, 0981
T =X 1 − X 2
S2p
√1n + 1
n
=142, 1− 121
492, 0981√
152 + 1
50
=20, 5
4, 39379= 4, 67
Valor t0 > t∗, logo rejeitamos H0
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 23 / 34
Tomada de Decisao
Nas estatısticas, existem duas maneiras de determinar se a evidencia eprovavel ou improvavel dada a suposicao inicial:
Podemos tomar a “abordagem de valor crıtico” (Apresentado emmuitos dos livros mais antigos).
Podemos tomar a “abordagem do P-value” (que e usado na maioriadas vezes em pesquisa, artigos de revistas e software estatıstico).
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 24 / 34
Valor-P
A escolha do nıvel de significancia do teste e completamente arbitraria,uma forma alternativa para resolver esse problema e:Calcular uma quantidade chamada nıvel crıtico, probabilidade designificancia ou valor-pA abordagem P-value consiste em determinar o “provavel” ou“improvavel”, determinando a partir de probabilidade, assumindo que ahipotese nula e verdadeira. Se o valor P e pequeno, digamos P ≤ α, entaoe “provavel”, e se o valor P e grande, digamos mais do que α (P > α),entao e “improvavel”.Se o valor P < α, a hipotese nula e rejeitada em favor da hipotesealternativa. Se o valor P > α, a hipotese nula nao e rejeitada .
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 25 / 34
Teoremas
Valor P
o p-valor e a probabilidade de observar resultados extremos quanto aquelesque foram obtidos se a hipotese nula for verdadeira. A ideia e que se ovalor-p for grande ele fornece evidencia de que H0 e verdadeira, enquantoque um valor-p e pequeno, indica que existe evidencia nos dados contraH0.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 26 / 34
Heurıstica
Podemos considerar, especificamente quatro passos para resolver qualquerproblema de teste de hipoteses com o valor-P.
1 Especificar as Hipoteses nula e alternativas.2 Usando os dados de exemplo e assumindo que a hipotese nula e verdadeira,
calcular o valor da estatıstica de teste (T-test). Para realizar o teste dehipotese para a media da populacao µ, usamos a estatıstica T.
T =X − µs√
n
3 Usando a distribuicao conhecida da estatıstica de teste, calcular o valor P:“Se a hipotese nula e verdadeira, qual e a probabilidade de que nosobservamos uma estatıstica de teste mais extremo na direcao da hipotesealternativa”
4 Definir o nıvel de significancia, α, a probabilidade de ter um erro de tipo Iser pequeno - 0,01, 0,05 ou 0,10 . Compare o valor P para α. Se o valor P≤ α, rejeitar a hipotese nula em favor da alternativa. Se o valor P > α,nrejeitar a hipotese nula.
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 27 / 34
Probabilidade de Significancia Valor-p
Valores Significados
P ≥ 0,10 Nao existe evidencia contra H0
0,05 ≤ P < 0,10 Fraca evidencia contra H0
0,01 ≤ P < 0,05 Evidecia significativa...0,001 ≤ P < 0,01 Evidencia altamente significativaP < 0,001 Evidencia extremanente significativa
Amostras de valores
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 28 / 34
Exemplo 1
Um neurologista esta testando o efeito de uma nova droga no tempo deresposta injetando em 100 ratos uma dose da droga, sujeitando cada um aestımulos neurologicos, e anotando o tempo de resposta. O neurologistasabe que a media do tempo de resposta para os ratos nao injetados com adroga e de 1,2 segundos. A media do tempo de resposta dos 100 ratosinjetados e de 1,05 segundos, com um desvio padrao amostral de 0,5segundos.Voce acha que a droga tem efeito no tempo de resposta?
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 29 / 34
Resolucao
Temos que:H0: Droga nao ter efeito =⇒ µ0 = 1,2 segundos.H1: Droga faz efeito =⇒ µ 6= 1,2s quando a droga e dada.considere H0
σx =σ√100
=S√100
=0, 5
100
σx = 0.005
z =1, 2− 1, 05
0, 05=
0, 15
0, 05= 3
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 30 / 34
Valor-P
Temos que Z=3 na Tabela de Distribuicao Normal Padronizada(tabela Z) equivalea 0,4987, isso multiplicando por dois (ja que e bilateral) da 0,9974 = 99,7%Nosso p-value equivale a 0.003
0.97x
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 31 / 34
Simulacao
Os sistemas de escapamento de uma aeronave funcionam devido a umpropelente solido. A taxa de queima desse propelente e uma caracterısticaimportante do produto. As especificacoes requerem que a taxa media dequeima tem de ser 50 centımetros por segundo. Sabemos que o desviopadrao da taxa de queima e σ=2 centımetros por segundo. Oexperimentalista decide especificar uma probabilidade do erro tipo I, ounıvel de significancia, de α=0,05. Ele seleciona uma amostra aleatoria den=25 e obtem uma taxa media amostral de queima de x = 51,3centımetros por segundo. Que conclusoes poderiam ser tiradas?
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 32 / 34
Referencias
B. Burt Gerstman (2008)
Basic Biostatistics; Statistics for public Health Practice
cap.9
Ricardo S. Ehlers (2011)
Teste de Hipotese. Notas de aulas - USP disponıvel emhttp://www.icmc.usp.br/ ehlers/inf/cap6.pdf
Vıctor H. L. Davila (2012)
Teste de Hipotese, IME-UNICAMP. Disponıvel emhttp://www.ime.unicamp.br/ hlachos/Inferencia Hipo1.pdf
Entre outros disponıveis na internet
Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 33 / 34