Download - Teste de Hipótese - Parte 2
Teste de hipótese para a variância
populacional
• Para testar a variância populacional usaremos
a distribuição χ�.
• Os estudos realizados para o teste de hipótese
supõem que a variância tem uma distribuição
normal.
Teste de hipótese para a variância
• Supondo
– H0: σ2= σ02
– H1: σ2 > σ02
• Sabendo que, a distribuição amostral χ� tem
a seguinte relação com a variância da amostra
Teste de hipótese para a variância
populacional
• Analisando o gráfico da distribuição χ� ,
podemos definir nosso teste de hipótese e
supondo H0 verdadeira.
Teste de hipótese para a variância
populacional
• Para o caso
– H0: σ2= σ02
– H1: σ2 > σ02
Concluímos o seguinte teste de hipótese
Se χ2n-1> χ2
n-1,α a hipótese H0 é rejeitada
Teste de hipótese para a variância
populacional
Definição da região de rejeição de �
χ2
12
α
2Lχ 2
Rχ
12
α1 –α
χ220χ
α1 –α
χ2
α
20χ
1 –α
Unicaudalà direita
Unicaudalà esquerda
Bicaudal
Exemplo
Uma amostra de dez elementos extraída de uma
população suposta normal forneceu variância
igual a 12,4. Pergunta-se: esse resultado é
suficiente para se concluir ao nível de 5% de
significância que a variância dessa população é
inferior a 25?
Hipóteses:
��: �� = 25
��: �� < 25
���� = �
� =� − 1 ��
��� =
9 ∙ 12,4
25= 4,464
Temos
�;��%� = 3,325
O valor crítico tabelado é:
Como o valor experimental não foiinferior ao valor crítico, devemosaceitar �� e não podemos concluir, ao nível de 5% de significância, que a variância dessa população sejainferior a 25
����
χ2
α1 –α
�;��%�
Exercício 6
Uma empresa de processamento de laticínios declara
que a variância da quantidade de gordura no leite
integral processado por ela é de não mais que 0,25.
Você suspeita que essa afirmação esteja errada e
descobre que uma amostra aleatória de 41 contêineres
de leite tem uma variância de 0,27. Com α = 0,05, há
evidência suficiente para rejeitar a declaração da
empresa? Suponha que a população seja normalmente
distribuída.
Exercício 7
Uma grande empresa de equipamentos estimaque a variância na vida de seus equipamentosseja 3. Você trabalha para um grupo de defesado consumidor e lhe é pedido para testar essaafirmação. Você descobre que uma amostraaleatória das vidas de 27 dos equipamentos da empresa tem uma variância de 2,8. Com α=0,05, você tem evidência suficiente para
rejeitar a afirmação do fabricante?
Teste de hipótese de uma proporção
populacional
• Da distribuição amostral, sabemos que o
estudo da proporção populacional por meio
de amostragem é dado pela distribuição � e
� .
• Além disso, sabemos que se �� ≥ 5 e
�(1 − �) ≥ 5 , podemos aproximar a
distribuição � de uma distribuição normal
Teste de hipótese de uma proporção
populacional
• De modo análogo ao que foi feito para a
média populacional, concluímos os seguintes
teste de hipótese para a proporção
populacional
$ =� − ��
�� 1 − �� /�
Aproximação pela
Normal
Teste de hipótese de uma proporção
populacional
Exemplo
Desconfia-se de que uma moeda fosse viciada,
realizou-se um experimento que consistiu em
lançar essa moeda cem vezes. Obtiveram-se 59
caras e 41 coroas. Ao nível de 5% de
significância, pode-se afirmar a existência de
vício na moeda?
�� ≥ 5
�(1 − �) ≥ 5
As hipóteses a testar referem-se à proporção � de vezes (ou
probabilidade) em que a moeda dá, por exemplo, cara. Se ela
não possui vício, tal proporção deve ser igual a 0,5. Logo, as
hipóteses a testar são:
��: � = 0,5
��: � ≠ 0,5
Determinação da região de rejeição
Então, consultando a tabela:
z0-1,96
0,025
1,96
0,025
$(/� = $�,���
A frequência relativa de caras observadas foi: � =�
�=
59
100= 0,59
Então: $ =)*�)+
)+ ��)+ /�=
�,����,��
�,� ���,� /���= 1,80
Z=1,80
z0-1,96
0,025
1,96
0,025
Como $ = 1,80 não está na região de rejeição, devemos aceitar
a hipótese �� . Logo, ao nível de significância - = 5% , não ficou
comprovada a existência de vício na moeda:
Exercício 8
A Zogby Internacional declara que 45% das pessoas nos
Estados Unidos são a favor de tornar a venda do cigarro
ilegal dentro dos próximos 10 anos. Você decide testar
essa afirmação e entrevista uma amostra de 200
pessoas, dentre as quais, 49% são a favor da lei. Com α
= 0,05, há evidência o bastante para apoiar a
afirmação?
Exercício 9
O centro de pesquisas Pew afirma que mais de 55% dos adultos
norte-americanos assistem seus noticiários locais regularmente.
Você decide testar essa afirmação e entrevista uma amostra de
425 adultos nos Estados Unidos sobre esse assunto. Dos 425
entrevistados, 255 responderam que assistem seus noticiários
locais regularmente. Com α = 0,05, há evidência o suficiente para
apoiar essa afirmação do centro de pesquisas Pew?
Correção de continuidade
• Por utilizar a distribuição normal como aproximação da distribuição binomial, o teste de uma proporçãopopulacional pode utilizar uma correção de continuidadepara uma maior precisão
$ =� − �� ± 1/ 2�
�� 1 − �� /�
• Quando a � − �� > 0, a correção deverá ser subtraída do numerador
• Quando a � − �� < 0, a correção deverá ser somada do numerador
Tamanho da amostra
Da mesma forma que para média (µ), também
podemos calcular o tamanho da amostra “n”para o caso de uma proporção populacional
� =$( �� 1 − �� + $1 � 1 − �
� − ��
�
Onde � é o valor da proporção populacionalalém do qual fixamos em, no máximo, β a
probabilidade de cometer o erro do tipo II.
Teste de hipótese de duas
amostras
Teste de hipótese de duas amostras
• Trabalhamos até agora com dados de uma
amostra.
• Queremos agora comparar dados de duas
amostras de populações distintas
– Peso de animais antes e depois de uma dieta
– Número de acidentes em rodovias distintas
– Altura de alunos de cursos diferentes
– Renda per capita das regiões de um país.
Teste de hipótese de duas amostras
• Compara dois parâmetros de duas populações.
• Métodos de amostragem:
– Dados não emparelhados (populações não-
correlacionadas)
• A amostra selecionada de uma população não tem
relação com a amostra selecionada da segunda
população.
– Dados emparelhados (amostras pareadas ou combinadas
– populações correlacionadas)
• Cada membro de uma amostra corresponde à um
membro da outra amostra.
Dados emparelhados e não-
emparelhados
Populações não-correlacionadas(não emparelhados)
Amostra 1 Amostra 2
Populações correlacionadas(emparelhados)
Amostra 1 Amostra 2
Exemplo: dados emparelhados e não
emparelhados
Classifique o par de dados como emparelhados ou não-
emparelhados.
•Amostra 1: Os batimentos cardíacos de 35 indivíduos em
repouso antes de tomar café.
•Amostra 2: Os batimentos cardíacos dos mesmos indivíduos
depois de tomar duas xícaras de café.
Solução:Dados emparelhados(As amostras podemser pareadas com respeito à cada indivíduo)
Exemplo: dados emparelhados e não
emparelhados
Classifique o par de amostras como emparelhadas ou não-
emparelhadas.
•Amostra 1: Pontuações de testes de 35 estudantes de estatística.
•Amostra 2: Pontuações de testes de 42 estudantes de biologia
que não estudam estatística.
Solução:Amostras não emparelhadas(Não é possível formar um par entre osmembros das duas amostras; os tamanhos das amostras sãodiferentes, e os dados representampontuações para diferentesindivíduos.)
Testes de hipótese de duas
populações com dados emparelhados
1. Hipótese nula H0
– Uma hipótese estatística que geralmente declara que não há
diferença entre os parâmetros de duas populações.
– Sempre contém o símbolo ≤, =, ou ≥.
2. Hipótese alternativa H1
– Uma hipótese estatística que é verdadeira quando H0 é falsa.
– Sempre contém o símbolo >, ≠, ou <.
Dados emparelhados
• Os resultados de duas amostras constituemdados emparelhados quando estãorelacionados dois a dois segundo algumcritério.
• Obrigatoriamente temos que as duasamostras possuem o mesmo tamanho.
• Realizar um teste t para testar a média dadiferença para uma população de dadosemparelhados.
Teste t para a diferença entre médias
• Para realizar um teste de hipótese de duas amostras,
a diferença entre cada dado emparelhado é
encontrada primeiro:
�d = x1 – x2 Diferença entre as entradas para dados
emparelhados.
• Logo podemos considerar uma única amostra de n
diferenças
• O teste estatístico é a média2̅ dessas diferenças.
ddn∑=
Média das diferenças entre entradasde dados emparelhados nasamostras dependentes.
Três condições são necessárias à realização do teste:
1. As amostras devem ser selecionadas aleatoriamente.
2. As amostras devem ser dependentes
(emparelhadas).
3. Ambas as populações devem ser normalmente
distribuídas.
Se esses requisitos são alcançados, então a distribuição
amostral para 2̅ é aproximada de uma distribuição t
com n – 1 graus de liberdade, onde n é o número de
dados emparelhados.
d-t0 t0µd
Símbolos usados para o teste t para µd = ∆
O número de dados emparelhados
A diferença entre entradas para dados emparelhados,d = x1 – x2
A média hipotética das diferenças de dados emparelhados na população
n
d
Símbolo Descrição
∆
Símbolo Descrição
d A média das diferenças entre as entradas de dados emparelhados nas amostras dependentes
O desvio padrão das diferenças entre as entradas de dados emparelhados nas amostras dependentes
ddn∑=
222
( )( )
1 1d
ddd d nsn n
ΣΣ −Σ −= =− −
sd
Teste t para a diferença entre médias
• O teste estatístico é:
• O teste estatístico padronizado é:
• Os graus de liberdade são:
g.l. = n – 1
ddn∑=
56�7 =89 − ∆
:8/ 6
Exemplo
Dez cobaias adultas foram submetidas ao tratamento com certa ração durante uma semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os pesos, em gramas, no princípio e no fim da semana, designados respectivamente por ;< e =<, são dados a seguir. Ao nível de 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos animais?
Cobaia xi Yi
1 635 640
2 704 712
3 662 681
4 560 558
5 603 610
6 745 740
7 698 707
8 575 585
9 633 635
10 669 682
• Queremos saber se em média, o peso dos
animais é maior ou não após o tratamento com a
ração.
• Queremos saber se em média y>x, ou
equivalentemente se y-x>0
• Denotando por d=y-x, queremos fazer o seguinte
teste de hipótese (nível de significância de 1%)
– H0: μd=0
– H1: μd>0
Determinação da região de rejeição
t0 2,82
0.01Então, consultando a tabela:
>���;? = >�;�% = 2,82
Para determinar >��� é preciso calcular 2̅ e �@:
2̅ =∑ 2<
�<B�
�=
66
10= 6,6
�@� =
∑ 2< − 2̅��
<B�
� − 1=
446,4
9= 49,6 �@ = 49,6 = 7,043
Então:>��� = >� =
2̅ − ∆
�@/ �=
6,6 − 0
7,043/ 10= 2,96
t0 2,82
0.01Verificando:
2,96
Rejeitamos �� ao nível de significância de 1%. Logo, concluímos, a
esse nível, que o uso da ração contribui para o aumento do peso
médio dos animais
Exercício 10
Golfista 1 2 3 4 5 6 7 8
Placar (antigo) 89 84 96 82 74 92 85 91
Placar (novo) 83 83 92 84 76 91 80 91
Um fabricante de tacos de golfe afirma que os golfistaspodemdiminuir seus placares usando os tacos de golferecém-projetados por ele. Oito jogadores de golfe sãoescolhidos aleatoriamente e é pedido a cada um que forneçaseu mais recente placar. Após usar os novos tacos por um mês, é pedido novamente aos jogadores que forneçamseusplacares mais recentes. Os placares para cada um sãomostrados na tabela. Assumindo que os placares de golfe sãodistribuídos normalmente, existe evidência suficiente paraapoiar a afirmação do fabricante paraα = 0,10?
Dados não emparelhados
• Quando os dados são não emparelhados, não fazsentido calcular a diferença entre os valores dasamostras.
• Neste caso o estudo é feito com base nas médiasdas amostras.
• As amostras podem ter números de elementosdistintos
• Serão estudados três casos para os dados não-emparelhados:
� São conhecidos os desvios-padrão das duas populações
� Não são conhecidos os desvios-padrão mas pode admitir quesão iguais
� As duas populações tem desvios padrão diferentes edesconhecidos.
Três condições são necessárias para desempenhar um
teste z para a diferença de duas médias populacionais,
μ1 e μ2.
1. As amostras precisam ser aleatoriamente
selecionadas.
2. As amostras precisam ser independentes.
3. Cada amostra precisa ter um tamanho de pelo
menos 30, ou, se não, cada população precisa ter uma
distribuição normal com desvio padrão conhecido.
1° Caso: Dados não emparelhados com variância da população conhecida
Se esses requisitos foremprenchidos, a distribuição das amostras
para D� − D� (a diferença das médias amostrais) é uma distribuiçãonormal com:
Distribuição amostral para:
1 2x x−1 2µ µ−
1 2x x−−σ
1 2x x−σ
Média: D ;̅� − D ;̅� = D� − D� = ∆
Desvio padrão: � ;̅� − ;̅� =��
�
��
+��
�
��
D� − D�
1° Caso: Dados não emparelhados com variância da população conhecida
• O teste estatístico é D� − D�
• O teste estatístico padronizado é
• Quando as amostras são grandes, você pode usar s1 e s2no lugar de σ1 e σ2. Se as amostras não são grandes, você ainda pode um teste-z de duas amostras, contantoque as populações sejam distribuídas normalmente e osdesvios padrões populacionais sejam conhecidos.
1° Caso: Dados não emparelhados com variância da população conhecida
Exemplo
Uma máquina automática enche latas com base no pesolíquido, com variabilidade praticamente constante eindependente dos ajustes na média, dada por um desvio-padrão de 5g. Duas amostras, retiradas em dois períodosde trabalho consecutivos de dez e de vinte latas,forneceram pesos líquidos médios de, respectivamente,184,6g e 188,9g. Desconfia-se que a regulagem damáquina quanto ao peso médio possa ter sido modificadaentre a coleta das duas amostras. Qual a conclusão comnível de significância de 5% e 1%?
Exercício 11
Uma organização de educação de consumidores afirma
que há uma diferença entre a média da dívida do
cartão de crédito de homens e mulheres nos Estados
Unidos. Os resultados de uma pesquisa aleatória de
200 indivíduos de cada grupo são mostrados a seguir.
As duas amostras são independentes. Os resultados
apoiam a afirmação da organização? Use α = 0,05.
Mulheres (1) Homens (2)
s1 = $750 s2 = $800
n1 = 200 n2 = 200
1 $2290x = 2 $2370x =
2° Caso: Dados não emparelhados com
variância da população desconhecida
• Considerando mesma variância para as duas
populações e
• H0: μ1-μ2=0
• H1: μ1-μ2<0
• Como fazer o teste de hipótese com relação as
médias?
Exemplo
• Os dados que seguem referem-se a cinco
determinações da resistência de dois tipos de
concreto. Ao nível de 5% de significância, há
evidência de que o concreto 1 seja mais
resistente que o concreto 2?
Concreto 1 Concreto 2
54 50
55 54
58 56
51 52
57 53
Exercício 12
A qualidade de rebites é melhor quanto maior sua
resistência média. Seis rebites de duas marcas foram
ensaiadas ao cisalhamento, tendo-se obtido as
seguintes cargas de ruptura
1 2 3 4 5 6
marca A 34,9 35,5 38,8 39,2 33,7 37,6
marca B 38,5 39,0 40,7 42,9 37,8 41,4
Esses resultados ratificam a afirmação do produtor da
marca B de que seus rebites são melhores? (α=5%)
sim
Exercício
O gerente de uma frota de carros está testando duas marcasde pneus. Ele coloca, ao acaso, um pneu de cada marca nasduas rodas traseiras de oito carros e anda com os carros atéque os pneus se desgastem. Os dados (em quilômetros) sãomostrados a seguir. Com um nível de significância de 1%, qualdesses pneus você prefere? Construa o intervalo de confiançapara a diferença de vida-média dos pneus.
Carro 1 2 3 4 5 6 7 8
Marca 1 36.925 45.300 36.240 32.100 37.210 48.360 38.200 33.500
Marca 2 34.318 42.280 35.500 31.950 38.015 47.800 37.850 33.215
3° Caso: Dados não emparelhados com
variância desconhecida
• Considerando variância diferente para cada
população
Graus de liberdade
Exemplo
Deseja-se saber se duas máquinas de empacotar caféestão fornecendo o mesmo peso médio por pacote.Entretanto, como uma das máquinas é nova e a outravelha, é razoável supor que trabalhem com diferentesvariabilidades dos pesos colocados nos pacotes. Asamostras disponíveis constam de seis pacotes produzidospela máquina nova e nove produzidos pela máquinavelha. Os pesos, em quilogramas, desses pacotes são:
Máquina nova 0,82 0,83 0,79 0,81 0,80 0,81
Máquina velha 0,79 0,82 0,73 0,74 0,80 0,77 0,75 0,840,78
Qual a conclusão ao nível de significância de 5%?
Teste de hipótese para duas
proporções
• Considere o seguinte teste de hipótese H0
• H0=p1-p2= p0 =0
• Supondo que n1p1>=5, n1(1-p1)>=5, n2p2>=5 e
n2(1-p2)>=5.
• Fazemos o seguinte cálculo para o teste de
hipótese.
Exemplo
Em uma pesquisa de opinião, 32 dentre 80
homens declaram apreciar certa revista,
acontecendo o mesmo com 26 dentre 50
mulheres. Ao nível de 5% de significância, os
homens e as mulheres apreciam igualmente a
revista?
Exercício 13
Uma equipe de pesquisa médica conduziu um estudo para
testar o efeito de um medicamento na redução de colesterol.
Ao final do estudo, os pesquisadores descobriram que dos
4.700 sujeitos selecionados aleatoriamente que tomaram o
medicamento, 301 morreram de doenças do coração. Dos 4.300
sujeitos selecionados aleatoriamente que tomaram um placebo,
357 morreram de doenças do coração. Em α = 0,01, você pode
concluir que a taxa de mortalidade por doenças do coração é
menor para aqueles que tomaram a medicação do que para
aqueles que tomaram o placebo?
(Adaptado de New England Journal of Medicine)
Solução: 1 = Medicação 2 = Placebo