lei dos grandes números – extraia observações aleatórias e independentes de uma população de...
TRANSCRIPT
Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média
À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população .
Características de uma população podem ser descritas pelos parâmetros.
Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra.
As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma
estatística amostral Indicam como variam as estatísticas devido a
variações no processo de amostragem.
Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média e desvio padrão .
A média da distribuição amostral de médias é igual à média populacional
O desvio-padrão da distribuição amostral de médias é dada por:
A distribuição amostral de médias é aproximadamente normal, para n grande.
A estatística correspondente à equação abaixo é aproximadamente N(0,1).
n
nx
Z)(
Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse.
A média da distribuição amostral da proporção é igual à proporção populacional.
O desvio-padrão da distribuição amostral da proporção é dado por:
A distribuição amostral da proporção é aproximadamente normal, para n grande.
A estatística correspondente à equação abaixo é aproximadamente N(0,1).
n
ppp
)1(
nPP
Ppz a
)1(
Inferência: campo da estatística no qual são tomadas decisões sobre populações, com base na informação extraída de uma amostra.
Estimativas sobre os parâmetros populacionais Estimativas pontuais Estimativas por intervalos
Formulação de testes de hipóteses sobre os mesmos
Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa.
Formato: estimativa +/- margem de erro Nível de confiança: probabilidade de que o método forneça
uma resposta correta. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um
intervalo de confiança para a verdadeira média populacional, com base na média amostral.
Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.
O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:
nZx
2
normaltabelanaobtidovalorZ 2
adotadociasignificandenível
médiadaamostralãodistribuiçdapadrãoerron
amostralmédiax
O intervalo para uma proporção pode ser representado pela expressão:
normaltabelanaobtidovalorZ 2
adotadociasignificandenível
amostralproporçãopa
n
ppzp aa
a
)1(
2
Constituem uma outra face do trabalho de inferência estatística e também fazendo uso da informação amostral.
Uma hipótese estatística: afirmação sobre parâmetros populacionais.
Teste de hipóteses: processo de decisão relativo a uma hipótese particular.
A informação de uma amostra é utilizada para avaliar a plausibilidade da hipótese formulada
Se tal informação for consistente com a hipótese tenderemos a concluir que não há evidências que favoreçam sua rejeição.
O fato de utilizar apenas uma amostra não nos permite concluir com certeza sobre a veracidade ou não de uma hipótese formulada.
Uma empresa produtora de detergente deseja avaliar se a máquina que enche as garrafas plásticas está adequadamente regulada, para o valor especificado de 5 litros, por garrafa. O desvio padrão do processo é da ordem de 0,5 litros.
Caso a máquina esteja devidamente regulada, espera-se que o valor médio de uma amostra de garrafas concorde com um valor médio de 5 litros.
Hipóteses envolvidas: H0: hipótese nula
H1: hipótese alternativa A hipótese nula (H0) é a que é sempre testada. A hipótese alternativa: oposto de H0.
H0 se refere a um valor especificado para um parâmetro da população.
H0 geralmente contém um sinal de igualdade. H1 nunca contém sinal de igualdade, pode ser
representada por: , < ou >.
Formula-se então a chamada hipótese nula (H0) como sendo:
H0: = 5, indicando que a máquina está regulada. No caso, suponha que a hipótese alternativa seja definida como:
H1: 5. Caso a hipótese nula seja verdadeira espera-se que a amostra
forneça um valor médio próximo do especificado pela mesma. Porém, devido às variações decorrentes do processo amostral,
mesmo que a hipótese nula seja verdadeira, é possível que valores diferentes da mesma sejam obtidos.
A metodologia dos testes de hipóteses nos vai fornecer elementos claros para melhor avaliar essas diferenças e tomar uma decisão, com base em critérios probabilísticos.
Erros envolvidos:
SITUAÇÃO REAL
CONCLUSÃO DO TESTE
H0 VERDADE
H0 FALSA
Não Rejeitar H0
Certo
Erro tipo II ( )
Rejeitar H0
Erro tipo I ( )
Certo
Um teste de hipóteses nos auxilia a responder a questão:
A diferença entre o valor amostral e o parâmetro é devida apenas ao acaso? (variação amostral)
Resultado amostral
Significativo
Rejeição de
H0
Variação
não casual
Não
significativo
Variação
casual
Não se
rejeita H0
Formulação das hipóteses nula e alternativa Escolha do nível de significância Escolha do tamanho da amostra Determinação da técnica apropriada e
estatística do teste Determinação dos valores críticos (região de
rejeição/regra de decisão) Coleta de dados e cálculo da estatística do
teste. Decisão Expressar a decisão no contexto do
problema.
Formulação das hipóteses nula e alternativa H0: = 5 H1: 5
Escolha do nível de significância =0,05 (5%)
Escolha do tamanho da amostra Vamos tomar uma amostra de n=25 caixas.
Determinação da técnica apropriada e estatística do teste
Determinação dos valores críticos (região de rejeição/regra de decisão) Se z>1,96 ou z<-1,96, rejeitamos H0.
nx
Z)(
Coleta de dados e cálculo da estatística do teste. Supondo que a média amostral foi de 4,75 l,
tem-se que:
Decisão Como o valor de Z=-2,5<-1,96, não existem
evidências que favoreçam a hipótese nula. (rejeitamos H0)
Expressar a decisão no contexto do problema. Concluímos que a máquina está mal regulada e,
portanto, requer uma intervenção no processo para sanar o problema.
5,205,0
25)575,4()( 0
nx
Z cal
Supondo H0 verdade, o valor-p ou nível de significância do teste, representa a probabilidade de se obter, para uma amostra n observações, um valor amostral tão ou mais discrepante que a média observada.
Se tal probabilidade for muito pequena, a média amostral observada não é compatível com a hipótese H0 e a hipótese formulada tende a ser rejeitada.
No exemplo em questão, o teste é bi-lateral, logo a probabilidade de que seja tão extrema é dada por:
Como tal valor-p é menor que o especificado (5%), concluímos pela não aceitação de H0, como anteriormente.
%)24,10124,00062,00062,0)5.2()5,2( ZPouZP
Testes para a média com desvio-padrão desconhecido Testes para proporções Testes para diferenças de médias (amostras independentes)
Variâncias conhecidas Variâncias desconhecidas e iguais Variâncias desconhecidas e diferentes
Testes para diferenças de médias (amostras pareadas ou relacionadas)
Testes para diferenças de proporções Testes tipo qui-quadrado Testes não-paramétricos Análise de variância (comparações múltiplas)