Download - Teste de Hipótese - Parte 2

Teste de hipótese para a variância

populacional

• Para testar a variância populacional usaremos

a distribuição χ�.

• Os estudos realizados para o teste de hipótese

supõem que a variância tem uma distribuição

normal.


• Supondo

– H0: σ2= σ02

– H1: σ2 > σ02

• Sabendo que, a distribuição amostral χ� tem

a seguinte relação com a variância da amostra


populacional

• Analisando o gráfico da distribuição χ� ,

podemos definir nosso teste de hipótese e

supondo H0 verdadeira.


populacional

• Para o caso

– H0: σ2= σ02

– H1: σ2 > σ02

Concluímos o seguinte teste de hipótese

Se χ2n-1> χ2

n-1,α a hipótese H0 é rejeitada


populacional

Definição da região de rejeição de �

χ2

12

α

2Lχ 2

Rχ

12

α1 –α

χ220χ

α1 –α

χ2

α

20χ

1 –α

Unicaudalà direita

Unicaudalà esquerda

Bicaudal

Exemplo

Uma amostra de dez elementos extraída de uma

população suposta normal forneceu variância

igual a 12,4. Pergunta-se: esse resultado é

suficiente para se concluir ao nível de 5% de

significância que a variância dessa população é

inferior a 25?

Hipóteses:

��: �� = 25

��: �� < 25

�� = �

� =� − 1 ��

�� =

9 ∙ 12,4

25= 4,464

Temos

�;��%� = 3,325

O valor crítico tabelado é:

Como o valor experimental não foiinferior ao valor crítico, devemosaceitar �� e não podemos concluir, ao nível de 5% de significância, que a variância dessa população sejainferior a 25

��

χ2

α1 –α

�;��%�

Exercício 6

Uma empresa de processamento de laticínios declara

que a variância da quantidade de gordura no leite

integral processado por ela é de não mais que 0,25.

Você suspeita que essa afirmação esteja errada e

descobre que uma amostra aleatória de 41 contêineres

de leite tem uma variância de 0,27. Com α = 0,05, há

evidência suficiente para rejeitar a declaração da

empresa? Suponha que a população seja normalmente

distribuída.

Exercício 7

Uma grande empresa de equipamentos estimaque a variância na vida de seus equipamentosseja 3. Você trabalha para um grupo de defesado consumidor e lhe é pedido para testar essaafirmação. Você descobre que uma amostraaleatória das vidas de 27 dos equipamentos da empresa tem uma variância de 2,8. Com α=0,05, você tem evidência suficiente para

rejeitar a afirmação do fabricante?

Teste de hipótese de uma proporção

populacional

• Da distribuição amostral, sabemos que o

estudo da proporção populacional por meio

de amostragem é dado pela distribuição � e

� .

• Além disso, sabemos que se �� ≥ 5 e

�(1 − �) ≥ 5 , podemos aproximar a

distribuição � de uma distribuição normal


populacional

• De modo análogo ao que foi feito para a

média populacional, concluímos os seguintes

teste de hipótese para a proporção

populacional

$ =� − ��

�� 1 − �� /�

Aproximação pela

Normal


populacional

Exemplo

Desconfia-se de que uma moeda fosse viciada,

realizou-se um experimento que consistiu em

lançar essa moeda cem vezes. Obtiveram-se 59

caras e 41 coroas. Ao nível de 5% de

significância, pode-se afirmar a existência de

vício na moeda?

�� ≥ 5

�(1 − �) ≥ 5

As hipóteses a testar referem-se à proporção � de vezes (ou

probabilidade) em que a moeda dá, por exemplo, cara. Se ela

não possui vício, tal proporção deve ser igual a 0,5. Logo, as

hipóteses a testar são:

��: � = 0,5

��: � ≠ 0,5

Determinação da região de rejeição

Então, consultando a tabela:

z0-1,96

0,025

1,96

0,025

$(/� = $�,��

A frequência relativa de caras observadas foi: � =�

�=

59

100= 0,59

Então: $ =)*�)+

)+ ��)+ /�=

�,��,��

�,� ��,� /��= 1,80

Z=1,80

z0-1,96

0,025

1,96

0,025

Como $ = 1,80 não está na região de rejeição, devemos aceitar

a hipótese �� . Logo, ao nível de significância - = 5% , não ficou

comprovada a existência de vício na moeda:

Exercício 8

A Zogby Internacional declara que 45% das pessoas nos

Estados Unidos são a favor de tornar a venda do cigarro

ilegal dentro dos próximos 10 anos. Você decide testar

essa afirmação e entrevista uma amostra de 200

pessoas, dentre as quais, 49% são a favor da lei. Com α

= 0,05, há evidência o bastante para apoiar a

afirmação?

Exercício 9

O centro de pesquisas Pew afirma que mais de 55% dos adultos

norte-americanos assistem seus noticiários locais regularmente.

Você decide testar essa afirmação e entrevista uma amostra de

425 adultos nos Estados Unidos sobre esse assunto. Dos 425

entrevistados, 255 responderam que assistem seus noticiários

locais regularmente. Com α = 0,05, há evidência o suficiente para

apoiar essa afirmação do centro de pesquisas Pew?

Correção de continuidade

• Por utilizar a distribuição normal como aproximação da distribuição binomial, o teste de uma proporçãopopulacional pode utilizar uma correção de continuidadepara uma maior precisão

$ =� − �� ± 1/ 2�

�� 1 − �� /�

• Quando a � − �� > 0, a correção deverá ser subtraída do numerador

• Quando a � − �� < 0, a correção deverá ser somada do numerador

Tamanho da amostra

Da mesma forma que para média (µ), também

podemos calcular o tamanho da amostra “n”para o caso de uma proporção populacional

� =$( �� 1 − �� + $1 � 1 − �

� − ��

�

Onde � é o valor da proporção populacionalalém do qual fixamos em, no máximo, β a

probabilidade de cometer o erro do tipo II.

Teste de hipótese de duas

amostras

Teste de hipótese de duas amostras

• Trabalhamos até agora com dados de uma

amostra.

• Queremos agora comparar dados de duas

amostras de populações distintas

– Peso de animais antes e depois de uma dieta

– Número de acidentes em rodovias distintas

– Altura de alunos de cursos diferentes

– Renda per capita das regiões de um país.

Teste de hipótese de duas amostras

• Compara dois parâmetros de duas populações.

• Métodos de amostragem:

– Dados não emparelhados (populações não-

correlacionadas)

• A amostra selecionada de uma população não tem

relação com a amostra selecionada da segunda

população.

– Dados emparelhados (amostras pareadas ou combinadas

– populações correlacionadas)

• Cada membro de uma amostra corresponde à um

membro da outra amostra.

Dados emparelhados e não-

emparelhados

Populações não-correlacionadas(não emparelhados)

Amostra 1 Amostra 2

Populações correlacionadas(emparelhados)

Amostra 1 Amostra 2

Exemplo: dados emparelhados e não

emparelhados

Classifique o par de dados como emparelhados ou não-

emparelhados.

•Amostra 1: Os batimentos cardíacos de 35 indivíduos em

repouso antes de tomar café.

•Amostra 2: Os batimentos cardíacos dos mesmos indivíduos

depois de tomar duas xícaras de café.

Solução:Dados emparelhados(As amostras podemser pareadas com respeito à cada indivíduo)

Exemplo: dados emparelhados e não

emparelhados

Classifique o par de amostras como emparelhadas ou não-

emparelhadas.

•Amostra 1: Pontuações de testes de 35 estudantes de estatística.

•Amostra 2: Pontuações de testes de 42 estudantes de biologia

que não estudam estatística.

Solução:Amostras não emparelhadas(Não é possível formar um par entre osmembros das duas amostras; os tamanhos das amostras sãodiferentes, e os dados representampontuações para diferentesindivíduos.)

Testes de hipótese de duas

populações com dados emparelhados

1. Hipótese nula H0

– Uma hipótese estatística que geralmente declara que não há

diferença entre os parâmetros de duas populações.

– Sempre contém o símbolo ≤, =, ou ≥.

2. Hipótese alternativa H1

– Uma hipótese estatística que é verdadeira quando H0 é falsa.

– Sempre contém o símbolo >, ≠, ou <.

Dados emparelhados

• Os resultados de duas amostras constituemdados emparelhados quando estãorelacionados dois a dois segundo algumcritério.

• Obrigatoriamente temos que as duasamostras possuem o mesmo tamanho.

• Realizar um teste t para testar a média dadiferença para uma população de dadosemparelhados.

Teste t para a diferença entre médias

• Para realizar um teste de hipótese de duas amostras,

a diferença entre cada dado emparelhado é

encontrada primeiro:

�d = x1 – x2 Diferença entre as entradas para dados

emparelhados.

• Logo podemos considerar uma única amostra de n

diferenças

• O teste estatístico é a média2̅ dessas diferenças.

ddn∑=

Média das diferenças entre entradasde dados emparelhados nasamostras dependentes.

Três condições são necessárias à realização do teste:

1. As amostras devem ser selecionadas aleatoriamente.

2. As amostras devem ser dependentes

(emparelhadas).

3. Ambas as populações devem ser normalmente

distribuídas.

Se esses requisitos são alcançados, então a distribuição

amostral para 2̅ é aproximada de uma distribuição t

com n – 1 graus de liberdade, onde n é o número de

dados emparelhados.

d-t0 t0µd

Símbolos usados para o teste t para µd = ∆

O número de dados emparelhados

A diferença entre entradas para dados emparelhados,d = x1 – x2

A média hipotética das diferenças de dados emparelhados na população

n

d

Símbolo Descrição

∆

Símbolo Descrição

d A média das diferenças entre as entradas de dados emparelhados nas amostras dependentes

O desvio padrão das diferenças entre as entradas de dados emparelhados nas amostras dependentes

ddn∑=

222

( )( )

1 1d

ddd d nsn n

ΣΣ −Σ −= =− −

sd

Teste t para a diferença entre médias

• O teste estatístico é:

• O teste estatístico padronizado é:

• Os graus de liberdade são:

g.l. = n – 1

ddn∑=

56�7 =89 − ∆

:8/ 6

Exemplo

Dez cobaias adultas foram submetidas ao tratamento com certa ração durante uma semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os pesos, em gramas, no princípio e no fim da semana, designados respectivamente por ;< e =<, são dados a seguir. Ao nível de 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos animais?

Cobaia xi Yi

1 635 640

2 704 712

3 662 681

4 560 558

5 603 610

6 745 740

7 698 707

8 575 585

9 633 635

10 669 682

• Queremos saber se em média, o peso dos

animais é maior ou não após o tratamento com a

ração.

• Queremos saber se em média y>x, ou

equivalentemente se y-x>0

• Denotando por d=y-x, queremos fazer o seguinte

teste de hipótese (nível de significância de 1%)

– H0: μd=0

– H1: μd>0

Determinação da região de rejeição

t0 2,82

0.01Então, consultando a tabela:

>��;? = >�;�% = 2,82

Para determinar >�� é preciso calcular 2̅ e �@:

2̅ =∑ 2<

�<B�

�=

66

10= 6,6

�@� =

∑ 2< − 2̅��

<B�

� − 1=

446,4

9= 49,6 �@ = 49,6 = 7,043

Então:>�� = >� =

2̅ − ∆

�@/ �=

6,6 − 0

7,043/ 10= 2,96

t0 2,82

0.01Verificando:

2,96

Rejeitamos �� ao nível de significância de 1%. Logo, concluímos, a

esse nível, que o uso da ração contribui para o aumento do peso

médio dos animais

Exercício 10

Golfista 1 2 3 4 5 6 7 8

Placar (antigo) 89 84 96 82 74 92 85 91

Placar (novo) 83 83 92 84 76 91 80 91

Um fabricante de tacos de golfe afirma que os golfistaspodemdiminuir seus placares usando os tacos de golferecém-projetados por ele. Oito jogadores de golfe sãoescolhidos aleatoriamente e é pedido a cada um que forneçaseu mais recente placar. Após usar os novos tacos por um mês, é pedido novamente aos jogadores que forneçamseusplacares mais recentes. Os placares para cada um sãomostrados na tabela. Assumindo que os placares de golfe sãodistribuídos normalmente, existe evidência suficiente paraapoiar a afirmação do fabricante paraα = 0,10?

Dados não emparelhados

• Quando os dados são não emparelhados, não fazsentido calcular a diferença entre os valores dasamostras.

• Neste caso o estudo é feito com base nas médiasdas amostras.

• As amostras podem ter números de elementosdistintos

• Serão estudados três casos para os dados não-emparelhados:

� São conhecidos os desvios-padrão das duas populações

� Não são conhecidos os desvios-padrão mas pode admitir quesão iguais

� As duas populações tem desvios padrão diferentes edesconhecidos.

Três condições são necessárias para desempenhar um

teste z para a diferença de duas médias populacionais,

μ1 e μ2.

1. As amostras precisam ser aleatoriamente

selecionadas.

2. As amostras precisam ser independentes.

3. Cada amostra precisa ter um tamanho de pelo

menos 30, ou, se não, cada população precisa ter uma

distribuição normal com desvio padrão conhecido.

1° Caso: Dados não emparelhados com variância da população conhecida

Se esses requisitos foremprenchidos, a distribuição das amostras

para D� − D� (a diferença das médias amostrais) é uma distribuiçãonormal com:

Distribuição amostral para:

1 2x x−1 2µ µ−

1 2x x−−σ

1 2x x−σ

Média: D ;̅� − D ;̅� = D� − D� = ∆

Desvio padrão: � ;̅� − ;̅� =��

�

��

+��

�

��

D� − D�


• O teste estatístico é D� − D�

• O teste estatístico padronizado é

• Quando as amostras são grandes, você pode usar s1 e s2no lugar de σ1 e σ2. Se as amostras não são grandes, você ainda pode um teste-z de duas amostras, contantoque as populações sejam distribuídas normalmente e osdesvios padrões populacionais sejam conhecidos.


Exemplo

Uma máquina automática enche latas com base no pesolíquido, com variabilidade praticamente constante eindependente dos ajustes na média, dada por um desvio-padrão de 5g. Duas amostras, retiradas em dois períodosde trabalho consecutivos de dez e de vinte latas,forneceram pesos líquidos médios de, respectivamente,184,6g e 188,9g. Desconfia-se que a regulagem damáquina quanto ao peso médio possa ter sido modificadaentre a coleta das duas amostras. Qual a conclusão comnível de significância de 5% e 1%?

Exercício 11

Uma organização de educação de consumidores afirma

que há uma diferença entre a média da dívida do

cartão de crédito de homens e mulheres nos Estados

Unidos. Os resultados de uma pesquisa aleatória de

200 indivíduos de cada grupo são mostrados a seguir.

As duas amostras são independentes. Os resultados

apoiam a afirmação da organização? Use α = 0,05.

Mulheres (1) Homens (2)

s1 = $750 s2 = $800

n1 = 200 n2 = 200

1 $2290x = 2 $2370x =

2° Caso: Dados não emparelhados com

variância da população desconhecida

• Considerando mesma variância para as duas

populações e

• H0: μ1-μ2=0

• H1: μ1-μ2<0

• Como fazer o teste de hipótese com relação as

médias?

Exemplo

• Os dados que seguem referem-se a cinco

determinações da resistência de dois tipos de

concreto. Ao nível de 5% de significância, há

evidência de que o concreto 1 seja mais

resistente que o concreto 2?

Concreto 1 Concreto 2

54 50

55 54

58 56

51 52

57 53

Exercício 12

A qualidade de rebites é melhor quanto maior sua

resistência média. Seis rebites de duas marcas foram

ensaiadas ao cisalhamento, tendo-se obtido as

seguintes cargas de ruptura

1 2 3 4 5 6

marca A 34,9 35,5 38,8 39,2 33,7 37,6

marca B 38,5 39,0 40,7 42,9 37,8 41,4

Esses resultados ratificam a afirmação do produtor da

marca B de que seus rebites são melhores? (α=5%)

sim

Exercício

O gerente de uma frota de carros está testando duas marcasde pneus. Ele coloca, ao acaso, um pneu de cada marca nasduas rodas traseiras de oito carros e anda com os carros atéque os pneus se desgastem. Os dados (em quilômetros) sãomostrados a seguir. Com um nível de significância de 1%, qualdesses pneus você prefere? Construa o intervalo de confiançapara a diferença de vida-média dos pneus.

Carro 1 2 3 4 5 6 7 8

Marca 1 36.925 45.300 36.240 32.100 37.210 48.360 38.200 33.500

Marca 2 34.318 42.280 35.500 31.950 38.015 47.800 37.850 33.215

3° Caso: Dados não emparelhados com

variância desconhecida

• Considerando variância diferente para cada

população

Graus de liberdade

Exemplo

Deseja-se saber se duas máquinas de empacotar caféestão fornecendo o mesmo peso médio por pacote.Entretanto, como uma das máquinas é nova e a outravelha, é razoável supor que trabalhem com diferentesvariabilidades dos pesos colocados nos pacotes. Asamostras disponíveis constam de seis pacotes produzidospela máquina nova e nove produzidos pela máquinavelha. Os pesos, em quilogramas, desses pacotes são:

Máquina nova 0,82 0,83 0,79 0,81 0,80 0,81

Máquina velha 0,79 0,82 0,73 0,74 0,80 0,77 0,75 0,840,78

Qual a conclusão ao nível de significância de 5%?

Teste de hipótese para duas

proporções

• Considere o seguinte teste de hipótese H0

• H0=p1-p2= p0 =0

• Supondo que n1p1>=5, n1(1-p1)>=5, n2p2>=5 e

n2(1-p2)>=5.

• Fazemos o seguinte cálculo para o teste de

hipótese.

Exemplo

Em uma pesquisa de opinião, 32 dentre 80

homens declaram apreciar certa revista,

acontecendo o mesmo com 26 dentre 50

mulheres. Ao nível de 5% de significância, os

homens e as mulheres apreciam igualmente a

revista?

Exercício 13

Uma equipe de pesquisa médica conduziu um estudo para

testar o efeito de um medicamento na redução de colesterol.

Ao final do estudo, os pesquisadores descobriram que dos

4.700 sujeitos selecionados aleatoriamente que tomaram o

medicamento, 301 morreram de doenças do coração. Dos 4.300

sujeitos selecionados aleatoriamente que tomaram um placebo,

357 morreram de doenças do coração. Em α = 0,01, você pode

concluir que a taxa de mortalidade por doenças do coração é

menor para aqueles que tomaram a medicação do que para

aqueles que tomaram o placebo?

(Adaptado de New England Journal of Medicine)

Solução: 1 = Medicação 2 = Placebo

Download - Teste de Hipótese - Parte 2

Top Related