testes de hipóteses

Upload: julio-machado

Post on 09-Jul-2015

546 views

Category:

Documents


1 download

TRANSCRIPT

UNIDADE 5 Introduo aos testes de hiptesesUm teste de hipteses um procedimento que usa estatstica amostral para testar uma alegao sobre o valor de um parmetro populacional. Pesquisadores das mais diversas reas contam com os testes de hipteses para a tomada de decises sobre novos medicamentos ou resultados de eleies, por exemplo. Observe a seguir exemplos de afirmaes que poderiam ser feitas acerca da populao: O tempo mdio para a realizao de um teste de 80 minutos. Trs por cento de toda a produo defeituosa. A percentagem de desempregados em duas cidades vizinhas igual. A quilometragem por litro de combustvel a mesma para trs marcas de gasolina. A finalidade de testes de hipteses avaliar afirmaes sobre os valores de parmetros populacionais. Suponha, por exemplo, que um fabricante alegue que a vida mdia das pilhas AA de 300 minutos. Se voc suspeitasse que essa alegao no vlida, como poderia mostrar que ela falsa? Obviamente, voc no pode testar todas as pilhas. Todavia, voc ainda pode tomar uma deciso razovel acerca da validade da alegao extraindo uma amostra ao acaso da populao. Se a mdia amostral for diferente o bastante da alegao, podese decidir que ela falsa. Considere ainda uma segunda situao: Inspeciona-se uma amostra de 142 peas de uma grande remessa, encontrando-se 8% de defeituosas. O fornecedor garante que no haver mais de 6% de peas defeituosas em cada remessa. O que devemos responder? A afirmao do fornecedor verdadeira? Ou a diferena entre a afirmao do fornecedor e o resultado da amostra explicada pela variao amostral? Vamos entender os fundamentos de um teste de hipteses para que consigamos responder perguntas como as que foram feitas acima.

1

5.1 Hipteses estatsticasUma alegao sobre um parmetro populacional chamada de hiptese estatstica. Para testar uma hiptese estatstica, voc deve estabelecer cuidadosamente um par de hipteses uma representa uma alegao e a outra, seu complemento. Quando uma dessas hipteses rejeitada, a outra deve ser aceita. Dessas duas hipteses, aquela que contm uma afirmativa de igualdade a hiptese nula. O complemento de uma hiptese nula a hiptese alternativa. Hiptese nula (denotada por H0) uma hiptese estatstica que contm uma afirmativa de igualdade e deve escrever-se como =, < ou >. Para a mdia, temos as trs formas possveis para a hiptese nula: H0: = 0 H0: > 0 Onde, 0 algum valor que voc deseja testar. H0: < 0 Hiptese alternativa (denotada por Ha) o complemento da hiptese nula. uma afirmativa que deve ser verdadeira se H0 for falsa contm uma afirmativa de desigualdade, tal como . Para a mdia, a hiptese alternativa comporta apenas uma das trs formas: Ha: 0 Ha: < 0 Ha: > 0 O quadro a seguir mostra a relao entre as afirmativas verbais possveis sobre o parmetro e as hipteses nula e alternativa correspondentes. Afirmativas semelhantes podem ser feitas para outros parmetros populacionais, tais como p (proporo), (desvio padro) ou 2 (varincia). Formulao verbal da H0 A mdia igual a algum valor (0). A mdia maior ou igual a algum valor (0) A mdia menor ou igual a algum valor (0) Formulao matemtica H0: = 0 Ha: 0 H0: > 0 Ha: < 0 H0: < 0 Ha: > 0 Formulao verbal da Ha A mdia diferente de algum valor (0). A mdia menor do que algum valor (0) A mdia superior a algum valor (0)

2

Exerccio Estabelecendo as hipteses nula e alternativaEstabelea as hipteses nula e alternativa e identifique qual representa a alegao. a) Uma universidade alega que a proporo de seus alunos formados em quatro anos de 82%. b) Um fabricante de torneiras alega que a taxa de fluxo mdio de um determinado tipo inferior a 2,5 gales por minuto. c) Um fabricante de pneus alega que a varincia no dimetro de um determinado modelo de 8,6 polegadas. d) Uma companhia que fabrica cereais alega que o peso mdio do contedo de suas caixas de cereais superior a 200 gramas. e) Uma estao de rdio alega que sua proporo de audincia local maior do que 39%. f) Um restaurante alega que o desvio padro para a durao do intervalo entre um atendimento e outro inferior a 2,9 minutos.

5.2 Tipos de erros e nvel de significnciaNo importando qual das hipteses representa a alegao, voc comear sempre um teste de hipteses assumindo que a condio de igualdade na hiptese nula verdadeira. Esse mesmo raciocnio utilizado em processos criminais onde Presume que o ru seja inocente at que sua culpa seja estabelecida sem sombra de dvida, a suposio de inocncia uma hiptese nula. Assim, quando realizar um teste de hipteses, voc deve tomar uma de duas decises: 1) Rejeitar a hiptese nula 2) Aceitar a hiptese nula Uma vez que sua deciso baseia-se em informao incompleta (uma amostra em vez de toda a populao), h sempre a possibilidade de se tomar a deciso errada. O quadro a seguir mostra os quatro resultados possveis de um teste de hipteses: Deciso Aceitar H0 Rejeitar H0 A verdade real de H0 H0 falsa H0 verdadeira Deciso correta Erro do tipo II (1 - ) Erro do tipo I Deciso correta (1 - )

Erro tipo I (denotada por ): Ocorre se a hiptese nula for rejeitada quando ela for realmente verdadeira. Erro tipo II (denotada por ): Ocorre se a hiptese nula no for rejeitada quando ela for realmente falsa. Uma das etapas de nosso processo de teste de hipteses envolve a escolha do nvel de significncia (), que a probabilidade de um erro tipo I. Entretanto, no selecionamos (a probabilidade de erro tipo II). Seria timo se pudssemos ter sempre =0 e =0, mas isto no possvel; devemos, pois, procurar controlar as probabilidades de erro e . Pode-se mostrar, matematicamente, que , e o tamanho (n) da amostra esto todos 3

inter-relacionados, de forma que, escolhidos quaisquer dois deles, o terceiro est automaticamente determinado. Valem as seguintes consideraes de ordem prtica: 1. Para fixo, um aumento do tamanho n da amostra ocasiona uma reduo de ; isto , uma amostra maior reduz a chance de cometermos o erro de aceitar a hiptese nula quando ela falsa. 2. Para um tamanho n, fixo, de amostra, uma diminuio de acarreta um aumento de ; reciprocamente, um aumento de acarreta uma diminuio de . 3. Para reduzir e , devemos aumentar o tamanho da amostra. O nvel de significncia de um teste a probabilidade de uma hiptese nula ser rejeitada, quando verdadeira.

5.3 Estatstica de teste, regio crtica e valor crticoA estatstica de teste uma estatstica amostral, ou um valor baseado nos dados amostrais. Utiliza-se uma estatstica de teste para tomar uma deciso sobre a rejeio ou no da hiptese nula. A regio crtica o conjunto de todos os valores da estatstica de teste que levam rejeio da hiptese nula. O valor crtico o valor, ou valores, que separa(m) a regio crtica dos valores da estatstica de teste que no levam rejeio da hiptese nula. Os valores crticos dependem da natureza da hiptese nula, da distribuio amostral principal, e do nvel de significncia ().

Figura 1 A distribuio amostral particionada em regies de aceitao e de rejeio, com o valor crtico como ponto divisrio

5.4 Teste unilaterais e testes bilateraisNosso interesse em detectar desvios significativos de determinado parmetro pode envolver desvios em ambas as direes ou apenas numa direo. Observe as situaes a seguir que envolvem sucessivas jogadas de uma moeda: 1. A moeda pode ser considerada no equilibrada se aparece um nmero muito grande, ou muito pequeno, de caras. A hiptese alternativa seria simplesmente a moeda no equilibrada, ou seja, Ha: p 0,5, e investigaramos ento desvios em ambas a direes. 4

2. Se estivssemos apostando em caras, ento nossa preocupao seria somente com um nmero muito pequeno de caras. A hiptese alternativa seria aparecem muito poucas caras, isto , Ha: p < 0,5, e s estaramos interessados ento nesse tipo de desvio do nmero esperado de caras. Essencialmente, a hiptese alternativa usada para indicar qual aspecto nos interessa. H trs casos possveis: concentrar am ambas as direes, concentrar nos desvios abaixo do valor esperado ou concentrar nos desvios acima do valor esperado. Simbolicamente, no caso da jogada de uma moeda, esses trs casos podem ser representados como a seguir:

a

a

a Figura 2 Comparao da partio de uma distribuio amostral para testes unilaterais e bilaterais. Note-se, nos testes unilaterais, que o sinal > ou o sinal < aponta para a cauda utilizada.

5

5.5 O mtodo clssico de testes de hiptesesIdentificar a hiptese nula (contm a condio de igualdade) e a hiptese alternativa (complementar)

Escolher o nvel de significncia com base na gravidade do erro tipo I. So muito comuns os valores 0,05 e 0,01.

Identificar o teste a ser utilizado.

Determinar a estatstica de teste.

Determinar o(s) valor(es) crtico(s) e a regio crtica.

Rejeitar H 0 se a estatstica de teste est na regio crtica. Aceitar H 0 se a estatstica de teste no est na regio crtica.

Formular uma concluso que descreva a conseqncia prtica dos dados e dos clculos.

6

Exerccios de fixao1. Qual o objetivo de se realizar testes de hipteses? 2. Explique comparativamente: a. Erro tipo I e erro tipo II. b. Hiptese nula e hiptese alternativa. c. Nvel de significncia de 0,05 e nvel de significncia de 0,01. d. Teste unilateral e teste bilateral. 3. Suponha que o leitor dispe da seguinte informao: H0: p = 35% Ha: p 35% a. Explique por que a probabilidade de erro tipo II zero se a proporo populacional 35%. b. Explique por que a probabilidade de erro tipo I zero se a proporo populacional diferente de 35%. 4. Para cada sentena a seguir: Escreva as hipteses nula e alternativa; Identifique se o teste bilateral, unilateral direito ou unilateral esquerdo; Escreva sentenas descrevendo o erro tipo I e erro tipo II. a. Um vendedor de carros alega que pelo menos 24% de seus novos compradores voltaro para comprar seu prximo carro. b. Um clube local de xadrez alega que o perodo de tempo de uma partida tem desvio padro superior a 23 minutos. c. Um instituto de pesquisa alega que a durao mdia da maioria dos sonhos superior a 10 minutos.

7

5.6 Teste de hipteses para uma mdia (Teste z de uma amostra)O objetivo dos testes de hipteses para uma mdia avaliar afirmaes feitas a respeito da mdia populacional. Os testes de hipteses para mdia exigem dados quantitativos, isto , dados contnuos ou discretos. O teste de hipteses descrito nesta seo ser utilizado nas situaes descritas abaixo: 1. A amostra grande (n > 30) podendo-se, dessa maneira, aplicar o teorema central do limite e utilizar a distribuio normal. 2. Ao aplicar o teorema central do limite, podemos utilizar o desvio padro amostral (s) em substituio ao desvio padro populacional () quando este no for conhecido e o tamanho da amostra for grande (n > 30). 3. A amostra pequena (n < 30), a distribuio amostral essencialmente normal e o desvio padro populacional () for conhecido. Identificadas as hipteses estatsticas (H0 e Ha) e definido o nvel de significncia () podemos proceder ao clculo da estatstica de teste utilizando a frmula a seguir: x 0 z teste =

n onde 0 representa o valor da mdia que est sendo testado, representa o desvio padro populacional, n o tamanho da amostra e x a mdia da amostra.A regio crtica para o teste z construda levando-se em considerao a distribuio z, o nvel de significncia adotado no teste e a hiptese alternativa. Observe as figuras a seguir:

8

Figura 3 Regio crtica para o teste z para a mdia populacional.

Dessa forma, para o teste z para uma mdia, podemos estabelecer o seguinte critrio de deciso: Hiptese alternativa (Ha) Ha: < 0 Ha: > 0 Rejeitar a hiptese nula se: Zteste < -z Zteste > z Zteste < -z/2 Ha: 0 ou zteste > z/2 Vale lembrar que os valores z e z/2 so obtidos diretamente da tabela da distribuio normal padro. Observe o exemplo a seguir: (Adaptado de Levine et al.) Uma das principais medidas de qualidade dos servios oferecidos por qualquer organizao corresponde velocidade atravs da qual ela responde a uma reclamao feita pelos clientes. Uma grande loja de departamentos, de controle familiar passou por uma grande expanso nos ltimos anos. Foi selecionada uma amostra de 50 reclamaes com relao instalao de pisos deste ano, ou seja, correspondem ao tempo de espera (em dias) entre o recebimento da 9 -z/2 < zteste < z/2 No rejeitar a hiptese nula se: Zteste > -z Zteste < z

reclamao e a soluo do problema relacionado com a reclamao. Nesta amostra o tempo mdio de espera foi de 29 dias e o desvio padro de 21 dias. O gerente afirma que o tempo mdio de espera de no mximo 20 dias. Com um nvel de 5% de significncia h evidncias que comprovem a alegao do gerente? Como a amostra grande (n>30) podemos utilizar o teste z para uma mdia. A partir do enunciado podemos identificar as hipteses nula e alternativa da seguinte maneira: H0: < 20 Ha: > 20 Como o nvel de significncia (), pr-determinado, foi de 0,05 (5%) e o teste unilateral direito devemos localizar na tabela da distribuio normal padro o valor de z, ou seja, z0,05=1,64. Dessa forma podemos representar a regio crtica do teste da seguinte maneira.

= 0,05

1,64

Calculando a estatstica de teste, obtemos:

z teste =

x 0

=

29 20 3,03 21 50

n

Como a estatstica de teste zteste=3,03 maior do que o valor da tabela z0,05=1,64 deve-se rejeitar a hiptese nula, ou seja, h evidncia suficiente para afirmar que o tempo mdio de espera (em dias) entre o recebimento da reclamao e a soluo do problema relacionado com a reclamao superior a 20 dias, contradizendo a afirmao do gerente.

Exerccio em sala1. (Adaptado de Stevenson, 2001) Suponha que queiramos avaliar a afirmao de um fabricante, de que seus pneus radiais suportam uma quilometragem de 40000 milhas, no mnimo. Para uma amostra aleatria de 49 pneus observou-se uma mdia de durao de 38000 milhas. Sabe-se que o desvio padro populacional da durao dos pneus de 3500 milhas. Utilize um nvel de significncia de 0,03. O que voc pode concluir?

10

O mtodo do valor p para o teste de hiptesesMuitos artigos profissionais e programas de computador utilizam outra abordagem do teste de hipteses, baseada no clculo do valor de uma probabilidade, ou valor p. Dada uma hiptese nula e um conjunto de dados amostrais, o valor p reflete a probabilidade de se obter tais resultados no caso da hiptese nula ser, de fato verdadeira. Um valor p muito pequeno sugere que os resultados amostrais so muito improvveis sob a hiptese nula, ou seja, constitui evidncia contra a hiptese nula. O critrio de deciso baseado no valor p feito da seguinte maneira: Rejeitar a hiptese nula (H0) se o valor p no mximo igual ao nvel de significncia (). No rejeitar a hiptese nula (H0) se o valor p maior do que o nvel de significncia (). O esquema a seguir mostra a determinao dos valores p. Tipo de teste Valor p rea direita da estatstica de teste Representao grfica

Unilateral direito

Bilateral

2 x a rea direita do mdulo da estatstica de teste.

Observao: O valor da estatstica de teste dever ser utilizado em mdulo para esse clculo!

Unilateral esquerdo

rea esquerda da estatstica de teste

Considere o exemplo citado anteriormente (Adaptado de Levine et al.). Para chegar concluso utilizou-se a regio crtica, porm, uma outra maneira de concluir o problema seria por meio do clculo do valor p. O teste realizado do tipo unilateral direito e a estatstica de teste encontrada foi de zteste = 3,03. Dessa maneira, para calcular o valor p necessrio encontrar o valor da rea direita da estatstica de teste. Observe a figura:

11

O valor p ser duas vezes essa rea. 3,03

Estatstica de teste.

Utilizando a tabela da distribuio normal padro temos que a rea direita de 3,03 (0,5 - 0,4988) = 0,0012 e, conseqentemente esse ser o valor p. Interpretando o valor p: Se rejeitarmos H0, ou seja, se afirmarmos que o tempo mdio de espera (em dias) entre o recebimento da reclamao e a soluo do problema relacionado com a reclamao de no mximo 20 dias estamos cometendo um erro de 0,0012. Como o valor p menor do que o nvel de significncia (0,0012 < 0,05) devemos rejeitar a hiptese nula, ou seja, a mesma concluso obtida por meio da regio crtica.

Exerccio em sala1. Para o exerccio anterior (Adaptado de Stevenson, 2001) que mostra o caso da durao de pneus radiais, obtenha a concluso utilizando o valor p. 2. Um representante de um grupo comunitrio informa a um potencial construtor de um shopping, que a renda familiar mdia mensal nesta rea superior a R$6500. Suponha que, para o tipo de rea envolvida, a renda familiar possa ser assumida como seguindo a distribuio normal, e que o desvio padro pode ser aceito como sendo igual a = 2000, baseado em um estudo anterior. Para uma amostra aleatria de 55 residncias, a renda familiar mdia encontrada de R$6300. Verifique se h evidncias que confirmem a hiptese do representante do grupo comunitrio, considere um nvel de 2% de significncia. Utilize a regio crtica e o valor p para concluir o teste.

Teste de hipteses (z) com intervalos de confianaJ vimos anteriormente o mtodo de estimao intervalar que consiste em encontrar uma estimativa intervalar de um parmetro populacional com contm os valores provveis daquele parmetro. Por conseguinte, devemos rejeitar uma afirmao de que o parmetro populacional tenha um valor que no est compreendido no intervalo de confiana. importante lembrar que, como vimos o mtodo de construo de intervalos de confiana bilaterais para um parmetro, essa correspondncia direta entre um intervalo de confiana e um teste de hiptese deve ser feita quando o teste bilateral.

Exerccio em sala1. Um estudante de direito quer conferir a alegao de sua professora de que fraudadores condenados passam, em mdia 12,3 meses na cadeia. Uma amostra aleatria de 35 casos do arquivo judicirio indicou uma mdia de 11,5 meses. Suponha que o desvio padro seja = 3,8 meses. Adote um nvel de 4% de significncia. O que o estudante pode concluir a partir dos dados da amostra? Utilize a regio crtica, o valor p e o intervalo de confiana.

12

5.7 Teste de hipteses para uma mdia (Teste t-Student de uma amostra)O teste t-Student, assim como o teste z (visto anteriormente), um teste de hipteses para a mdia. Ele ser utilizado quando as trs condies a seguir so vlidas: A amostra pequena (n < 30); desconhecido; A populao original tem distribuio essencialmente normal. Quando o desvio padro da populao no conhecido (o que o caso no teste tStudent), usa-se o desvio padro da amostra como estimativa, substituindo por s nas frmulas. Isto no acarreta maiores dificuldades, pois o desvio padro amostral d uma aproximao bastante razovel do verdadeiro valor, na maioria dos casos. Alm disso, pelo Teorema do Limite Central, sabemos que, quando o tamanho da amostra superior ou igual a 30, a distribuio das mdias aproximadamente normal. Todavia, para amostras de menos de 30 observaes, a aproximao normal no adequada. Devemos ento usar a distribuio t-Student, que a distribuio correta quando se usa s. Aps a identificao do teste a ser utilizado, procedemos com a definio das hipteses estatsticas (H0 e Ha) e do nvel de significncia (). A partir da encontramos a estatstica de teste: x 0 t teste = s

n onde 0 representa o valor da mdia que est sendo testado, s representa o desvio padro da amostra (j que o desvio padro da populao desconhecido), n o tamanho da amostra e x a mdia da amostra.A regio crtica para o teste t-Student definida da mesma forma que no teste z, ou seja, levando-se em considerao a distribuio t-Student, o nvel de significncia adotado no teste e a hiptese alternativa. O valor crtico obtido na tabela t-Student onde: Graus de liberdade = n 1. Aps determinar o nmero de graus de liberdade (na linha da tabela), localizar, na coluna, o valor correspondente rea da cauda que se deseja obter, o valor crtico ser o valor que corresponde ao cruzamento da linha e da coluna que foram determinados. Lembrando que se um valor crtico est localizado na cauda esquerda, devemos consider-lo negativo. Observe o exemplo a seguir: (Adaptado de Morettin & Bussab, 2007) A associao dos proprietrios de indstrias metalrgicas est muito preocupada com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos tem sido da ordem de 60 horas/homem por ano. Tentou-se um programa de preveno de acidentes, aps o qual foi tomada uma amostra de nove indstrias e medido o nmero de horas/homens perdidas por acidente obtendo-se uma mdia de 50 horas e um desvio padro de 20 horas. Voc diria, considerando-se um nvel de significncia

13

de 5%, que houve alguma alterao no tempo perdido com acidentes de trabalho? Suponha que a populao segue aproximadamente a distribuio normal. Neste exemplo no h qualquer informao sobre o desvio padro populacional e, alm disso, a amostra pequena (n < 30) e tem distribuio normal. Portanto, temos que prosseguir com o teste utilizando a distribuio t-Student: Hipteses: H0: = 60 versus. Ha: 60 Nvel de significncia: = 0,05. Estatstica de teste: t teste =50 60 = 1,5 20

9 Graus de liberdade: n 1 = 9 1 = 8.

Regio crtica:

-t

0

t

Distribuio t-Student Valor crtico Observe que estamos na coluna que representa o valor de /2, j que o teste bilateral.

Valor crtico (obtido na tabela da distribuio t-Student):

Valor crtico: t = 2,306 Podemos observar que a estatstica de teste (tteste = -1,5) est dentro do intervalo de -2,306 a 2,306, ou seja, conclumos por no rejeitar H0. Dessa forma, podemos dizer que no h evidncias de que tenha havido alterao no tempo mdio perdido com acidentes de trabalho em indstrias metalrgicas. Se optssemos por resolver esse exemplo usando o valor p teramos que utilizar as mesmas idias do teste z (que j foram demonstradas), ou seja, como estamos solucionando um teste bilateral, o valor p dado por:

14

O valor p ser duas vezes o valor dessa rea tteste = 1,5 Observe que o valor da estatstica de teste est em mdulo, ou seja, para encontrar o valor p em um teste bilateral deve-se utilizar o valor da estatstica de teste sempre positivo.

Dessa forma temos que localizar na tabela t-Student o Valor p = 2 P(t > Estatstica de teste) , ou seja, na linha correspondente ao nmero de graus de liberdade (n 1 = 8) devemos localizar o valor mais prximo da estatstica de teste (tteste=1,5, considerando-se o valor positivo), observe a seguir:

Valor mais prximo da estatstica de teste (tteste =1,255, considerando-se o valor positivo) O valor 0,1 encontrado corresponde rea acima da estatstica de teste positiva, ou seja, dessa forma o valor p = 2 x 0,1 = 0,2, ou seja, se rejeitarmos a hiptese nula estamos cometendo um erro de 0,2 = 20%, como o erro mximo permitido de = 0,05 = 5%, devemos portanto aceitar a hiptese nula. Conclumos que o tempo mdio perdido com acidentes de trabalho igual a 60 horas/homem, no havendo indcios suficientes para concluirmos que houve alterao.

Teste de hipteses (t-Student) com intervalos de confianaJ vimos anteriormente o mtodo de estimao intervalar que consiste em encontrar uma estimativa intervalar de um parmetro populacional com contm os valore provveis daquele parmetro. Por conseguinte, devemos rejeitar uma afirmao de que o parmetro populacional tenha um valor que no est compreendido no intervalo de confiana. Vimos tambm que, no caso da distribuio t-Student, o desvio padro populacional no conhecido e em seu lugar utilizamos a estimativa por meio do desvio padro da amostra. Dessa forma o intervalo de confiana para a mdia quando desconhecido obtido pela frmula: s x (t ) n Lembrando que, s representa o desvio padro da amostra (j que o desvio padro da populao desconhecido), n o tamanho da amostra, x a mdia da amostra e t

15

o valor crtico obtido na tabela da distribuio t-Student, levando em considerao o nmero de graus de liberdade a rea correspondente a (j que o teste bilateral). 2 Vale lembrar mais uma vez que, como vimos o mtodo de construo de intervalos de confiana bilaterais para um parmetro, essa correspondncia direta entre um intervalo de confiana e um teste de hiptese deve ser feita quando o teste bilateral. Voltando ao exemplo do tempo perdido com acidentes de trabalho, como temos um teste bilateral, podemos optar por obter a concluso com base apenas no intervalo de 95% de confiana (j que o nvel de significncia adotado de 5%):

x (t )

s n

= 50 (2,306 )

20 9

= 50 15,373 = [34,627 ; 65,373]

Com base no resultado do intervalo de confiana podemos observar que com 95% de confiana o tempo mdio perdido com acidentes de trabalho em indstrias metalrgicas pode variar de 34,627 horas/homem a 65,373 horas/homem. Dessa forma, como a mdia testada (0 = 60) encontra-se dentro do intervalo de confiana, devemos aceitar a hiptese nula, concluindo que no h indcios de que tenha havido alterao.

Propriedades importantes da distribuio t-Student1. A distribuio t-Student diferente para cada tamanho de amostra:

2. A distribuio t-Student tem a mesma forma geral de sino da distribuio normal padronizada; sua forma mais aberta reflete a maior variabilidade esperada em pequenas amostras.

16

3. A distribuio t-Student tem mdia t = 0 (tal como a distribuio normal padronizada, que tem mdia z = 0). 4. O desvio padro da distribuio t-Student varia com o tamanho da da amostra, e maior do que 1 (ao contrrio da distribuio normal padronizada, em que = 1). 5. medida que o tamanho da amostra aumenta, a distribuio t-Student se aproxima da distribuio normal. Para valores de n > 30, as diferenas so to pequenas que podemos usar os valores crticos z em lugar de t.

Exerccios em salaPara os exerccios abaixo utilize a regio crtica, o valor p e o intervalo de confiana (quando apropriado): 1. (Adaptado de Morettin & Bussab) Um escritrio de investimentos acredita que o rendimento mdio das diversas aes que movimenta de 20%. Uma nova estratgia foi definida com o objetivo de aumentar p rendimento mdio das diversas aes que movimenta. Para verificar esta hiptese, tomaram-se 18 empresas ao acaso obtendo-se um rendimento mdio de 24,56% e um desvio padro de 5%. Suponha que a populao tenha distribuio aproximadamente normal. Faa o teste estatstico para comprovar que a nova estratgia realmente eficiente para aumentar o rendimento mdio das diversas aes. Use um nvel de significncia de 1%. 2. Uma amostra aleatria de oito pedidos dos arquivos de uma companhia mostra que os pedidos de certa pea de uma mquina forma despachados em: 12 10 17 14 13 18 11 9 dias. Ao nvel de 5% de significncia , podemos concluir que, em mdia, tais pedidos so despachados me menos de 10 dias?

17

5.8 Teste de hipteses para uma proporoOs testes de hipteses para propores so adequados quando os dados sob anlise consistem de contagens ou freqncias de itens. A finalidade de tais testes avaliar afirmaes sobre a proporo (ou percentagem) de uma populao. As suposies associadas ao teste de hipteses para uma proporo so descritas a seguir: Devem ser verificadas as condies para um experimento binomial. Isto , temos um nmero fixo de provas independentes com probabilidade constante, e cada prova comporta dois resultados, que so designados como sucesso e fracasso. As condies n p 5 e n (1 p ) 5 so ambas verificadas, de modo que a distribuio binomial das propores amostrais pode ser aproximada por uma distribuio normal com = n p e = n p (1 p ) . Se as duas suposies acima forem satisfeitas podemos realizar o teste de hipteses para uma proporo utilizando a tabela da distribuio normal padro. A notao que utilizaremos a seguinte: n = tamanho da amostra; x p = (proporo amostral) n p = proporo populacional (usada nas hipteses) A estatstica de teste que ser utilizada obtida por: p p0 z teste = p (1 p ) n Em muitos aspectos, o teste de hipteses para uma proporo se assemelha grandemente ao teste z, principalmente pelo fato de que utilizam a mesma distribuio de probabilidades. Dessa forma, a regio crtica, o valor crtico e o valor p para o teste de proporo so obtidos exatamente da mesma maneira que o teste z para uma mdia. Vamos agora considerar um exemplo que ilustra a aplicao prtica dos conceitos dados acima: Em um estudo da eficcia do air-bag em automveis, constatou-se que, em 821 colises de carros de tamanho mdio equipados com air-bag, 46 colises resultaram em hospitalizao do motorista. Ao nvel de significncia de 0,01, teste a afirmao de que a taxa de hospitalizao nos casos de air-bag inferior taxa de 7,8% para colises de carros de tamanho mdio equipados com cintos automticos de segurana. 46 Podemos observar que a proporo amostral de = p = 0 ,056 e a proporo 821 populacional admitida de 7,8% (0,078). O nvel de significncia a ser adotado de 0,01 e as hipteses podem ser definidas da seguinte maneira: H0: p > 0,078 Ha: p < 0,078 18

Podemos verificar que as exigncias do teste so ambas satisfeitas: n p 5 821 x 0,078 = 64,04 n (1 p ) 5 821 x (1 0,078) = 756,96 A estatstica de teste : z teste = Regio crtica: p p0 = p(1 p ) n 0,056 (1 0,056 ) 821 0,056 0,078

= 2,74

= 0,01

-z Valor crtico O valor crtico dever ser o valor de z na tabela da distribuio normal que corresponde a uma rea de 0,49, ou seja, z = 2,33. Como a estatstica de teste (-2,74) menor do que o valor crtico (-2,33) devemos rejeitar a hiptese nula. Valor p: Valor p

Estatstica de teste O valor p ser a rea da distribuio normal padro abaixo da estatstica de teste (-2,74), ou seja, 0,5 0,4969 = 0,0031. Interpretando o valor p temos que: Se rejeitarmos H0, ou seja, se afirmarmos que a taxa de hospitalizao nos casos com airbag inferior a 7,8% estamos cometendo um erro de 0,0031. Como o valor p (0,0031) menor do que o nvel de significncia (0,01) vamos rejeitar H0. Concluindo, h indcios suficientes para garantir que a taxa de hospitalizao nos casos de automveis equipados com air-bag inferior taxa de 7,8%. Vale a pena lembrar que, para testes bilaterais, existe a opo de concluso por meio do intervalo de confiana j conhecido: (1 ) p p p z n Devemos rejeitar uma afirmao de que o parmetro populacional tenha um valor que no est compreendido no intervalo de confiana.

19

Exerccios em salaPara os exerccios abaixo utilize a regio crtica, o valor p e o intervalo de confiana (quando apropriado): 1. Um sistema de reservas da companhia Y acusa uma taxa de 7% de nocomparecimento. Adotou-se ento um novo processo, pelo qual as reservas so confirmadas no dia anterior ao do vo, fazendo-se um estudo de 5218 reservas pelo novo sistema, selecionadas aleatoriamente. Se se registraram 333 nocomparecimentos, teste a afirmao de que a taxa de no-comparecimento menor no novo sistema. O novo sistema se afigura eficiente na reduo do nocomparecimento? Utilize um nvel de 2% de significncia. 2. Em um estudo de 71 fumantes que estavam procurando deixar de fumar utilizando uma terapia especial, 32 no estavam fumando um ano aps o tratamento. Ao nvel de 0,10 de significncia, teste a afirmao de que, dos fumantes que procuram deixar de fumar com aquela terapia, no mximo 25% voltam a fumar um ano aps o tratamento. Esses resultados sugerem que a terapia no eficaz?

20

DISTRIBUIO NORMAL PADRODISTRIBUIO NORMAL PADRO

P (0 < Z < z )

0z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 1 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 2 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 3 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 4 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 5 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998

z6 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 7 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 8 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,4998 9 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998

21

DISTRIBUIO t-STUDENTDistribuio t-Student

P(t > tteste )rea 0g.l 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 0,25 1 0,817 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,7 0,697 0,695 0,694 0,692 0,691 0,69 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,682 0,682 0,682 0,682 0,682 0,125 2,414 1,604 1,423 1,344 1,301 1,273 1,254 1,24 1,23 1,221 1,214 1,209 1,204 1,2 1,197 1,194 1,191 1,189 1,187 1,185 1,183 1,182 1,18 1,179 1,178 1,177 1,176 1,175 1,174 1,173 1,172 1,172 1,171 1,17 1,17 0,1 3,078 1,8856 1,6377 1,5332 1,4759 1,4398 1,4149 1,3968 1,383 1,3722 1,3634 1,3562 1,3502 1,345 1,3406 1,3368 1,3334 1,3304 1,3277 1,3253 1,3232 1,3212 1,3195 1,3178 1,3164 1,315 1,3137 1,3125 1,3114 1,3104 1,3095 1,3086 1,3077 1,307 1,3062 0,05 6,314 2,92 2,3534 2,1319 2,0151 1,9432 1,8946 1,8596 1,8331 1,8125 1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247 1,7208 1,7172 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973 1,6955 1,6939 1,6924 1,6909 1,6896 0,025 12,71 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,16 2,145 2,131 2,12 2,11 2,101 2,093 2,086 2,08 2,074 2,069 2,064 2,06 2,056 2,052 2,048 2,045 2,042 2,04 2,037 2,035 2,032 2,03 0,0125 25,45 6,205 4,177 3,495 3,163 2,969 2,841 2,752 2,685 2,634 2,593 2,56 2,533 2,51 2,49 2,473 2,458 2,445 2,433 2,423 2,414 2,405 2,398 2,391 2,385 2,379 2,373 2,368 2,364 2,36 2,356 2,352 2,348 2,345 2,342

t0,01 31,82 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,65 2,625 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,5 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,453 2,449 2,445 2,441 2,438 0,005 63,66 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,25 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,75 2,744 2,738 2,733 2,728 2,724 0,0025 127,3 14,09 7,453 5,598 4,773 4,317 4,029 3,833 3,69 3,581 3,497 3,428 3,372 3,326 3,286 3,252 3,222 3,197 3,174 3,153 3,135 3,119 3,104 3,091 3,078 3,067 3,057 3,047 3,038 3,03 3,022 3,015 3,008 3,002 2,996 0,001 318,3 22,33 10,21 7,173 5,893 5,208 4,785 4,501 4,297 4,144 4,025 3,93 3,852 3,787 3,733 3,686 3,646 3,611 3,579 3,552 3,527 3,505 3,485 3,467 3,45 3,435 3,421 3,408 3,396 3,385 3,375 3,365 3,356 3,348 3,34 0,0005 636,6 31,6 12,92 8,61 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,14 4,073 4,015 3,965 3,922 3,883 3,85 3,819 3,792 3,768 3,745 3,725 3,707 3,69 3,674 3,659 3,646 3,633 3,622 3,611 3,601 3,591

22