lei dos grandes números – extraia observações aleatórias e independentes de uma população de...

Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média

À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população .

Características de uma população podem ser descritas pelos parâmetros.

Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra.

As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma

estatística amostral Indicam como variam as estatísticas devido a

variações no processo de amostragem.

Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média e desvio padrão .

A média da distribuição amostral de médias é igual à média populacional

O desvio-padrão da distribuição amostral de médias é dada por:

A distribuição amostral de médias é aproximadamente normal, para n grande.

A estatística correspondente à equação abaixo é aproximadamente N(0,1).

n

nx

Z)(

Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse.

A média da distribuição amostral da proporção é igual à proporção populacional.

O desvio-padrão da distribuição amostral da proporção é dado por:

A distribuição amostral da proporção é aproximadamente normal, para n grande.

A estatística correspondente à equação abaixo é aproximadamente N(0,1).

n

ppp

)1(

nPP

Ppz a

)1(

Inferência: campo da estatística no qual são tomadas decisões sobre populações, com base na informação extraída de uma amostra.

Estimativas sobre os parâmetros populacionais Estimativas pontuais Estimativas por intervalos

Formulação de testes de hipóteses sobre os mesmos

Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa.

Formato: estimativa +/- margem de erro Nível de confiança: probabilidade de que o método forneça

uma resposta correta. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um

intervalo de confiança para a verdadeira média populacional, com base na média amostral.

Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.

O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:

nZx

2

normaltabelanaobtidovalorZ 2

adotadociasignificandenível

médiadaamostralãodistribuiçdapadrãoerron

amostralmédiax

O intervalo para uma proporção pode ser representado pela expressão:

normaltabelanaobtidovalorZ 2

adotadociasignificandenível

amostralproporçãopa

n

ppzp aa

a

)1(

2

Constituem uma outra face do trabalho de inferência estatística e também fazendo uso da informação amostral.

Uma hipótese estatística: afirmação sobre parâmetros populacionais.

Teste de hipóteses: processo de decisão relativo a uma hipótese particular.

A informação de uma amostra é utilizada para avaliar a plausibilidade da hipótese formulada

Se tal informação for consistente com a hipótese tenderemos a concluir que não há evidências que favoreçam sua rejeição.

O fato de utilizar apenas uma amostra não nos permite concluir com certeza sobre a veracidade ou não de uma hipótese formulada.

Uma empresa produtora de detergente deseja avaliar se a máquina que enche as garrafas plásticas está adequadamente regulada, para o valor especificado de 5 litros, por garrafa. O desvio padrão do processo é da ordem de 0,5 litros.

Caso a máquina esteja devidamente regulada, espera-se que o valor médio de uma amostra de garrafas concorde com um valor médio de 5 litros.

Hipóteses envolvidas: H0: hipótese nula

H1: hipótese alternativa A hipótese nula (H0) é a que é sempre testada. A hipótese alternativa: oposto de H0.

H0 se refere a um valor especificado para um parâmetro da população.

H0 geralmente contém um sinal de igualdade. H1 nunca contém sinal de igualdade, pode ser

representada por: , < ou >.

Formula-se então a chamada hipótese nula (H0) como sendo:

H0: = 5, indicando que a máquina está regulada. No caso, suponha que a hipótese alternativa seja definida como:

H1: 5. Caso a hipótese nula seja verdadeira espera-se que a amostra

forneça um valor médio próximo do especificado pela mesma. Porém, devido às variações decorrentes do processo amostral,

mesmo que a hipótese nula seja verdadeira, é possível que valores diferentes da mesma sejam obtidos.

A metodologia dos testes de hipóteses nos vai fornecer elementos claros para melhor avaliar essas diferenças e tomar uma decisão, com base em critérios probabilísticos.

Erros envolvidos:

SITUAÇÃO REAL

CONCLUSÃO DO TESTE

H0 VERDADE

H0 FALSA

Não Rejeitar H0

Certo

Erro tipo II ( )

Rejeitar H0

Erro tipo I ( )

Certo

Um teste de hipóteses nos auxilia a responder a questão:

A diferença entre o valor amostral e o parâmetro é devida apenas ao acaso? (variação amostral)

Resultado amostral

Significativo

Rejeição de

H0

Variação

não casual

Não

significativo

Variação

casual

Não se

rejeita H0

Formulação das hipóteses nula e alternativa Escolha do nível de significância Escolha do tamanho da amostra Determinação da técnica apropriada e

estatística do teste Determinação dos valores críticos (região de

rejeição/regra de decisão) Coleta de dados e cálculo da estatística do

teste. Decisão Expressar a decisão no contexto do

problema.

Formulação das hipóteses nula e alternativa H0: = 5 H1: 5

Escolha do nível de significância =0,05 (5%)

Escolha do tamanho da amostra Vamos tomar uma amostra de n=25 caixas.

Determinação da técnica apropriada e estatística do teste

Determinação dos valores críticos (região de rejeição/regra de decisão) Se z>1,96 ou z<-1,96, rejeitamos H0.

nx

Z)(

Coleta de dados e cálculo da estatística do teste. Supondo que a média amostral foi de 4,75 l,

tem-se que:

Decisão Como o valor de Z=-2,5<-1,96, não existem

evidências que favoreçam a hipótese nula. (rejeitamos H0)

Expressar a decisão no contexto do problema. Concluímos que a máquina está mal regulada e,

portanto, requer uma intervenção no processo para sanar o problema.

5,205,0

25)575,4()( 0

nx

Z cal

Supondo H0 verdade, o valor-p ou nível de significância do teste, representa a probabilidade de se obter, para uma amostra n observações, um valor amostral tão ou mais discrepante que a média observada.

Se tal probabilidade for muito pequena, a média amostral observada não é compatível com a hipótese H0 e a hipótese formulada tende a ser rejeitada.

No exemplo em questão, o teste é bi-lateral, logo a probabilidade de que seja tão extrema é dada por:

Como tal valor-p é menor que o especificado (5%), concluímos pela não aceitação de H0, como anteriormente.

%)24,10124,00062,00062,0)5.2()5,2( ZPouZP

Testes para a média com desvio-padrão desconhecido Testes para proporções Testes para diferenças de médias (amostras independentes)

Variâncias conhecidas Variâncias desconhecidas e iguais Variâncias desconhecidas e diferentes

Testes para diferenças de médias (amostras pareadas ou relacionadas)

Testes para diferenças de proporções Testes tipo qui-quadrado Testes não-paramétricos Análise de variância (comparações múltiplas)

lei dos grandes números – extraia observações aleatórias e independentes de uma população de...

Documents