e statistic a aula 21
DESCRIPTION
e Statistic a Aula 21TRANSCRIPT
EstatísticaEstatísticaAula 21Aula 21
Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia
Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves
Aula 21Aula 21
Teste de Hipóteses para duas médiasTeste de Hipóteses para duas médias
Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostrasAté o momento vimos testes de hipótese para média (com conhecido ou desconhecido) e para variância (e desvio padrão)Observe a série de vazões
abaixo ...Há algo acontecendo nela?
E se calcularmos a média em 2 períodos?
Com base nos dados das amostras de cada população, pode-se apresentar conclusões com relação a comparação das duas populações, usando para isto o teste de hipótese.
Inferência Estatística para Duas Populações
Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras
N1 N2
Nosso objetivo agora é realizar testes de hipóteses a respeito da diferença ou não entre 2 médias e 2 variâncias
Ou ainda testar se 2 grupos de dados, emparelhados ou independentes, vêm de populações com médias ou variâncias diferentes
Mas o que são grupos independentes ou dependentes (emparelhados)?
Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras
Teste de Hipóteses – 2 amostrasTeste de Hipóteses – 2 amostras
Duas amostras são independentes se os valores amostrais de uma população não estão relacionados ou de alguma forma emparelhados ou combinados com os valores amostrais selecionados de outra população. Se existe alguma relação de modo que cada valor em uma amostra esteja emparelhado com o valor correspondente na outra amostra, as amostras são dependentes ou emparelhadas
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes
Suposições:1)As 2 amostras são independentes;2)As amostras são aleatórias;3)Os 2 tamanhos amostrais são ambos grandes (n1 > 30 e n2 >30) ou ambas as amostras provêm de populações com distribuições normais
Estatística de teste
BA
XX 2121
)( t1n
B1n
AB)(Agl
2
2
1
2
2
Graus de
liberdade
onde e 1
21
nsA
2
22
nsB
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentesValores críticos tabela da curva t
Hipóteses: H0: 1 = 2 ou 1 - 2 = 0 e H1: 1 ≠ 2
Intervalo de confiança:
BAE ct
EXXEXX 2121 )( 21
onde , 1
21
nsA
2
22
nsBe
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentesExemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentesCom o que vimos anteriormente (IC para uma amostra), poderíamos já ter noção se há diferença ou não?
Gênero N n %N pop gl tc fatormédia
amostral s E EcorrLim inf
Lim sup
Masculino
606 32 5,28 finita 31 2,04 0,974 23,8 3,0 1,08 1,05 22,8 24,9
Feminino268 20 7,46 finita 19 2,09 0,964 21,0 1,6 0,60 0,58 20,4 21,6
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentesExemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentes
23,8
21,0
15,0 30,0
22,8 24,9
20,4 21,6
A não superposição de Ics parece indicar que há diferença significativa entre as médias. Entretanto, vamos realizar o teste formal
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentesExemplo: investigar se há evidência estatística para afirmar que o IMC dos alunos e das alunas de cursos diurnos do Ctec (exceção de Eng. do Petróleo) são diferentes1) Parâmetro de interesse 1 - 12) Hipótese nula H0 1 - 1 = 0 3) Hipótese alternativa H1 1 ≠ 2 4) Nível de significância = 0,055) Estatística de teste t (desconhecemos e )6) Região de rejeição para a estatística
0
0 ,4
-3 -2 -1 0 1 2 3- tc tc
95%2,5% 2,5%
7) Grandezas amostrais necessárias
2,995 s23,81X
1
1
Inferência sobre 2 médias: amostras independentesInferência sobre 2 médias: amostras independentes
1,629 s20,98X
2
2
Estatística de teste
0,280328,97
nsA
1
21
0,133202,65
nsB
2
22
4,410,1330,280
020,9823,81
t
8) DecisãoValor crítico de tc
gl = 49, o que significa tc = 2,009 (mais próximo gl = 50)
Como t de teste cai na região crítica, a hipótese H0 tem que ser rejeitada, ou seja, há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que os Índices de Massa Corpórea (IMC) para os homens são diferentes dos IMCs das mulheres, para alunos do curso diurno do Ctec, com exceção do curso de Eng. do Petróleo
AplicaçõesAplicações
49
120(0,133)
132(0,280)
0,133)(0,280
1nB
1nA
B)(Agl 22
2
2
2
1
2
2
Os resultados que vimos já seriam vislumbrados comestatística descritiva?
IMC masculino
IMC feminino
AplicaçõesAplicações
IMC feminino
IMC masculinoE quanto à normalidade das populações?
AplicaçõesAplicações
Exemplo: estabeleça o IC para a diferença entre as médias do IMC do exemplo anterior
1,290,6432,0090,1330,2802,009BAE ct
Calculando a margem de erro para gl = 49 tc = 2,009
Intervalo de confiança: EXXEXX 2121 )( 21
1,292,83 )( 1,292,83 21
4,12 )( 1,54 1 2Estamos confiantes 95% de que 1 excede 2por uma quantidade que está entre 1,54 e 4,12
O valor zero está neste IC?
AplicaçõesAplicações
Exemplos de amostras emparelhadas
Ao conduzir um experimento para testar a eficácia de uma dieta de baixa gordura, o peso de cada sujeito é medido uma vez antes da dieta e uma vez após a dieta
Para testar a eficácia de uma técnica de tratamento do esgoto com o objetivo de reduzir, por exemplo, a presença de patógenos, mede-se um indicador antes e depois do tratamento, em várias amostras
Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas
Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas
Suposições:
1)Os dados amostrais consistem em pares combinados;2)As amostras são aleatórias;3)O no de pares combinados de dados amostrais é grandes (n > 30) ou os pares de valores têm diferenças que são de uma população com distribuição normal
Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadas
d
d diferença individual entre 2 valores em um único par combinadod valor médio das diferenças d para a população de todos os pares combinados valor médio das diferenças d para os dados amostrais emparelhados (igual à média dos valores x – y)sd desvio padrão das diferenças d para os dados amostrais combinadosn no de pares de dados Estatística
de testen
sd
d
dt
gl = n - 1
Inferência sobre 2 médias: amostras emparelhadasInferência sobre 2 médias: amostras emparelhadasHipóteses: H0: d = 0 e H1: 1 ≠ 2 ou H1: d > 0 ou H1: d < 0
Intervalo de confiança:
nsE d ctEdEd d onde
Exemplo: Um artigo no Journal of Strain Analysis (1983, Vol. 18, No 2) compara vários métodos para predizer a resistência de cisalhamento para traves planas metálicas. Dados para 2 desses métodos, os procedimentos de Karlsruhe e Lehigh, quando aplicados a 9 traves específicas, são mostrados na tabela. Desejamos determinar se há qualquer diferença (na média) entre os 2 métodos.
AplicaçõesAplicações
Trave Método de Karlsruhe Método de Lehigh Diferença dj
S1/1 1,186 1,061 0,119S2/1 1,151 0,992 0,159S3/1 1,322 1,063 0,259S4/1 1,339 1,062 0,277S5/1 1,200 1,065 0,138S2/1 1,402 1,178 0,224S2/2 1,365 1,037 0,328S2/3 1,537 1,086 0,451S2/4 1,559 1,052 0,507
AplicaçõesAplicações1) Parâmetro de interesse D = 1 - 12) Hipótese nula H0 D = 0 3) Hipótese alternativa H1 D ≠ 0 4) Nível de significância = 0,055) Estatística de teste t (desconhecemos e )6) Região de rejeição para a estatística
0
0 ,4
-3 -2 -1 0 1 2 3- tc tc
95%2,5% 2,5%
7) Grandezas amostrais necessárias
Estatística de teste
6,059
0,13560,2736
ns
dd
d
t0,1356 s0,2736d
D
8) DecisãoValor crítico de tc
gl = 9 – 1 = 8, duas caudas tc = 2,306
Como t de teste cai na região crítica, a hipótese H0 tem que ser rejeitada, ou seja, há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que os métodos de previsão fornecem resultados diferentes.Especificamente, podemos dizer que o método Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh
AplicaçõesAplicações
- 2,306 0 2,306
t6,05
EstatísticaEstatísticaAula 21Aula 21
Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia
Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves