tópico 3 testes de hipóteses - 2 amostras

44
Estatística II UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS FACULDADE DE ECONOMIA Prof. Dr. Ricardo Bruno Nascimento dos Santos

Upload: ricardo-bruno-universidade-federal-do-para

Post on 01-Jul-2015

742 views

Category:

Education


1 download

DESCRIPTION

Testes de Hipóteses para Duas Amostras: Testes de Média Testes para Proporções

TRANSCRIPT

Page 1: Tópico 3   Testes de Hipóteses - 2 amostras

Estatística II

UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS

FACULDADE DE ECONOMIA

Prof. Dr. Ricardo Bruno Nascimento dos Santos

Page 2: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE

HIPÓTESES

COM DUAS

AMOSTRAS

Page 3: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostras

A questão agora se baseia em verificarmos se duas amostras distintas

possuem ou não as mesmas características. Ou seja, podemos inferir para

comparar duas populações distintas. Vamos partir do exemplo sobre dois grupos

que fazem exercícios físicos e outro que não realiza temos as seguintes

informações:

Praticantes de Atividades Físicas (n=1.593)

Característica Frequência Proporção

40 a 49 anos 367 0,2304

Renda de R$ 5,000 a 10,000

239 0,1500

Não fumam 1.322 0,8299

Não Praticantes de Atividades Físicas (n=29.948)

Característica Frequência Proporção

40 a 49 anos 6.290 0,2104

Renda de R$ 5,000 a 10,000

5.990 0,2000

Não fumam 23.360 0,7800

Page 4: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostras

A pergunta que fica é: Podemos concluir que existe uma proporção

significativamente maior de pessoas que praticam ou não atividades

físicas entre 40 e 49 anos, com renda entre 5 a 10 mil e que não fumam?

Deve-se, diante desses elementos fazer alguns questionamentos com

relação a amostra que será observado a seguir.

Page 5: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Antes devemos verificar se as amostras são ou não independentes.

Duas amostras serão consideradas independentes se a amostra

selecionada de uma das populações não é relacionada à amostra da

segunda população.

Elas podem ser consideradas dependentes se cada informação de uma

amostra corresponde a um membro da outra amostra. Amostras

dependentes também são chamadas de amostras emparelhadas ou

amostras relacionadas.

Diferença entre médias (amostras grandes e independentes)

Page 6: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Já foi frisado que trabalhar com a população é algo trabalhoso,

cansativo e demorado, por esse motivo inferimos sobre amostras. Teste

de médias visa identificar se amostras diferentes possuem

comportamentos ou características semelhantes.

Para visualizar essa diferença podemos assumir que não há diferenças

na médias das duas populações, ou seja 𝜇1 − 𝜇2 = 0, evidentemente que

expressando isso para amostras teríamos 𝑥1 − 𝑥2. Imagine que tenhamos

os seguintes resultados:

Diferença entre médias (amostras grandes e independentes)

Page 7: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

A situação anterior pode ser representada no gráfico da normal a

seguir. A situação a que se segue tem a característica de mostrar 𝜇1 −𝜇2 = 0. Pelo gráfico verifica-se que seja bem improvável obter médias

amostrais que se difiram por 4 minutos se a diferença real é zero. A

diferença amostral entre médias seria de mais de 2,5 desvios padrões da

diferença hipotética de 0! Então podemos concluir que existe uma

diferença significativa na quantidade de tempo que estudantes

universitários do sexo masculino e do sexo feminino passam conectados

no dia.

Diferença entre médias (amostras grandes e independentes)

Page 8: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostrasDiferença entre médias (amostras grandes e independentes)

Page 9: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Já sabemos como são formadas as hipóteses nulas e alternativas.

Lembrando sempre que as alternativas de hipóteses abrangem:

TESTE Z DE DUAS AMOSTRAS PARA A DIFERENÇA ENTRE

MÉDIAS

O que devemos verificar então seria:

1. As amostras devem ser selecionadas aleatoriamente

2. As amostras devem ser INDEPENDENTES

3. Cada tamanho de amostra deve ser pelo menos 30 ou, se não, cada

população deve ter uma distribuição normal com o conhecido.

Diferença entre médias (amostras grandes e independentes)

Page 10: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostrasDiferença entre médias (amostras grandes e independentes)

Page 11: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Então podemos proceder com o teste da seguinte forma:

𝑧 =𝐷𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 ℎ𝑖𝑝𝑜𝑡é𝑡𝑖𝑐𝑎

𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜

Assim formalmente o teste z para duas amostras para grandes

amostras (n>30), e considerando que as amostras são independentes será

dado por:

𝑧 = 𝑥1 − 𝑥2 − 𝜇1 − 𝜇2

𝜎 𝑥1− 𝑥2

Com

𝜎 𝑥1− 𝑥2=

𝜎1

𝑛1+

𝜎2

𝑛2

Diferença entre médias (amostras grandes e independentes)

Page 12: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostrasDiferença entre médias (amostras grandes e independentes)

Page 13: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Exemplo: Teste z de duas amostras para diferenças de médias.

Um grupo de cartão de crédito quer testar se a diferença entre a média

de cartões de débito das famílias do Rio de Janeiro e de São Paulo. O

resultado da amostra aleatória de 250 famílias para cada estado são

mostradas na tabela abaixo:

As duas amostras são independentes. Assuma que 𝜎1 = 𝑅$ 1.045 para

Rio de Janeiro e 𝜎2 = 𝑅$ 1.350 para São Paulo. Os resultados suportam

a afirmação do grupo? Teste a 𝛼 = 0,05

Diferença entre médias (amostras grandes e independentes)

Page 14: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

As hipóteses nula e alternativa são:

Pelo fato de o teste de bicaudal e o nível de significância ser de 5%,

os valores críticos serão −𝑧0 = −1,96 𝑒 𝑧0 = 1,96 . A região de

rejeição será 𝑧 < −1,96 𝑒 𝑧 > 1,96. A estatística de teste padronizada

será:

Diferença entre médias (amostras grandes e

independentes)

Intepretação: Não há evidência a 5% de significância sobrea afirmação do grupo que exista diferença entre o uso docartão de débito das famílias do Rio e São Paulo.

Page 15: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Se o pressuposto de que as duas distribuições sã normais, então

podemos usar o teste de diferença de médias para populações menores

que 30 observações. Porém o que será retratado agora é de que ambas

devem ser independentes. Dessa forma:

1. Os desvios padrões populacionais são desconhecidos;

2. As amostras devem ser selecionadas aleatoriamente;

3. As amostras são independentes.

4. As populações são normalmente distribuídas ou cada tamanho da

amostra é de pelo menos 30.

Diferença entre médias (amostras pequenas

e independentes)

Page 16: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Page 17: Tópico 3   Testes de Hipóteses - 2 amostras
Page 18: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Assim os requisitos para o teste t serão:

Diferença entre médias (amostras pequenas

e independentes)

Page 19: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Page 20: Tópico 3   Testes de Hipóteses - 2 amostras
Page 21: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Exemplo: Teste t de duas amostras para diferença entre médias

O resultado de um teste matemático para amostras aleatórias simples

de estudantes para dois professores diferentes na mesma escola é

mostrado abaixo:

Podemos concluir que existe uma diferença na média das notas de

matemática dos estudantes para os dois professores? Use 𝛼 = 10%.

Assuma que as populações são normalmente distribuídas para os dois

professores.

Diferença entre médias (amostras pequenas

e independentes)

Page 22: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostrasDiferença entre médias (amostras pequenas

e independentes)

No nível de significância de 10% não existe evidências que de suporte para aafirmação de que a média das notas de matemática dos estudantes sejamdiferentes para os dois professores

Page 23: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Exemplo: teste t para duas amostras para a diferença entre médias

A Renaut supõe o custo médio operacional por Km de um sedã é

menor que o custo de seu principal concorrente. Você é contratado para

conduzir um estudo usando uma amostra aleatória de 30 sedãs da

empresa Renaut e 32 amostras (aleatórias) do concorrente. Os resultados

podem ser observados na tabela abaixo:

A 𝛼 = 0,05, podemos afirmar a hipótese da Renaut? Assuma que as

variâncias das populações são iguais.

Diferença entre médias (amostras pequenas

e independentes)

Page 24: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostrasDiferença entre médias (amostras pequenas

e independentes)

Page 25: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

A 5% de significância, podemos afirmar estatisticamente que existe

evidência de que a afirmação da Renaut está correta que o custo

operacional do sedã deles é menor que o concorrente.

Diferença entre médias (amostras pequenas

e independentes)

Page 26: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Quando as amostras são dependentes

Nessa situação devemos utilizar um procedimento diferente e

encontrar uma diferença entre médias para dados emparelhados dado por

𝑑 = 𝑥1 − 𝑥2

A estatística do teste é a média 𝑑 dessas diferenças:

𝑑 = 𝑑

𝑛As seguinte condições devem ser satisfeitas:

1. As amostras devem ser selecionadas aleatoriamente

2. As amostras devem ser dependentes

3. Ambas populações devem ser normalmente distribuídas.

Diferença entre médias (amostras

dependentes)

Page 27: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Graficamente o teste se baseará na condição que:

Diferença entre médias (amostras

dependentes)

Page 28: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras Diferença entre médias (amostras

dependentes)

Page 29: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras Diferença entre médias (amostras

dependentes)

Page 30: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

O teste t para diferença de médias então será dado por:

Diferença entre médias (amostras

dependentes)

Page 31: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras Diferença entre médias (amostras

dependentes)

Page 32: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Exemplo:

A fabricante de calçados afirma que os atletas podem aumentar suas

alturas de salto vertical usando sapatos de treinamento do fabricante. As

alturas de salto vertical de oito atletas selecionados aleatoriamente foram

medidos. Depois que os atletas usaram os sapatos por 8 meses, suas

alturas de salto vertical foram medidas novamente. As alturas de

impulsão vertical (em polegadas) para cada atleta são mostrados na

tabela abaixo.

Diferença entre médias (amostras

dependentes)

Page 33: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

A um α = 0,10, há evidência suficiente para apoiar a afirmação do

fabricante? Assuma as alturas de salto vertical são normalmente

distribuídas.

Diferença entre médias (amostras

dependentes)

Page 34: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras Diferença entre médias (amostras

dependentes)

Podemos afirmar que a nível10% de significância, que existeevidências que dão suporte aafirmação do fabricante.

Page 35: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS

amostras

Lembrando que as hipóteses serão:

Considerando que:

1. As amostras são aleatoriamente selecionadas

2. As amostras são independentes

3. As amostras são grandes ou normalmente distribuídas, lembrando

que a regra 𝑛𝑝 ≥ 5 e 𝑛𝑞 ≥ 5 ainda deve ser observada.

Caso a hipótese indique 𝒑𝟏 = 𝒑𝟐, 𝒑𝟏 ≤ 𝒑𝟐 𝒐𝒖 𝒑𝟏 ≥ 𝒑𝟐, então 𝒑𝟏 =𝒑𝟐 é assumida a expressão 𝒑𝟏 − 𝒑𝟐 = 𝟎

Diferença entre proporções

Page 36: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostras

Então as possibilidades serão:

A hipótese pautando-se em 𝜇 𝑝1− 𝑝2= 𝑝1 − 𝑝2

O desvio padrão para proporção de duas amostras será:

Diferença entre proporções

Page 37: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostras

Repare que precisamos conhecer a variância da proporção da

população calculada. Podemos calcular o peso da estimativa de 𝑝1 𝑒 𝑝2

usando:

Onde 𝑥1 = 𝑛1 𝑝1 e 𝑥2 = 𝑛2 𝑝2. Com o peso da estimativa 𝑝, o desvio

padrão amostral da distribuição para 𝑝1 − 𝑝2 será

Assim o teste z será dado por

𝑧 = 𝑝1 − 𝑝2 − 𝑝1 − 𝑝2

𝑝 𝑞1𝑛1

+1𝑛2

Diferença entre proporções

Page 38: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Page 39: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Page 40: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostras

Exemplo: Um estudo de 150 ocupantes selecionados aleatoriamente

em carros de passageiros e 200 ocupantes selecionados aleatoriamente

em picapes mostra que 86% dos ocupantes de veículos de passageiros e

74% dos ocupantes em picapes usam cintos de segurança. A um nível de

significância de 10%, podemos rejeitar a alegação de que a proporção de

ocupantes que usam cintos de segurança é o mesmo para carros de

passeio e picapes? Ver dados na tabela abaixo:

Diferença entre proporções

Page 41: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Page 42: Tópico 3   Testes de Hipóteses - 2 amostras

TESTES DE HIPÓTESES para DUAS amostrasDiferença entre proporções

Há evidência suficiente a nível de 10% de significância para rejeitar a alegação de quea proporção de ocupantes que usam cintos de segurança é a mesma para carros depasseio e caminhonetes.

Page 43: Tópico 3   Testes de Hipóteses - 2 amostras

APLICAÇÃO NO R(Clique na Figura para ir ao vídeo Prático do R)

Page 44: Tópico 3   Testes de Hipóteses - 2 amostras

PRÓXIMA AULA

REGRESSÃO LINEAR

SIMPLES