universidade federal da bahia escola ... 8 estimacao de...estimaÇÃo de uma mÉdia (amostras...
TRANSCRIPT
Aula 8 : Estimação
de parâmetros
UNIVERSIDADE FEDERAL DA BAHIA
ESCOLA POLITÉCNICA
MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA
ENG C 18 Métodos de Pesquisa Quantitativos e Qualitativos
DOCENTE:CIRA SOUZA PITOMBO
INTRODUÇÃO
AMOSTRA (DADOS OBSERVADOS)
Processo de
estimação de
parâmetros
POPULAÇÃO (UNIVERSO DE ESTUDO)
PARÂMETRO: Alguma característica descritiva dos elementos
da população (média de alguma variável, por exemplo)
ESTATÍSTICA: Alguma operação com os dados de uma amostra.
Esta operação pode ser o cálculo de uma média, por exemplo.
Também chamada de estimador
EXEMPLO 1 A prefeitura de uma cidade pretende avaliar a aceitação de um certo projeto
educacional. Depois de apresentá-lo aos moradores do município, os
responsáveis por sua execução desejam avaliar o valor aproximado do
parâmetro ¶= proporção de favoráveis ao projeto, dentre os indivíduos
residentes no município. Para estimar este parâmetro, a prefeitura planeja
observar uma amostra aleatória simples de n=400 moradores e calcular o valor
da estatística P = Proporção de moradores favoráveis ao projeto na amostra
¶=P± erro amostral
P = 240/400 = 0,60 (ou 60%)
EXEMPLO 2 Para estudar o efeito da merenda escolar, introduzida nas escolas de um grande
município, planeja-se acompanhar uma amostra de n = 100 crianças, que estão
entrando na rede municipal de ensino. Dentre diversas características de
interesse, pretende-se avaliar o parâmetro µ = ganho médio de peso, dentre
todas as crianças da rede municipal de ensino, durante o primeiro ano letivo.
Da amostra de crianças em estudo, pode-se calcular a estatística X= ganho
médio de peso, durante o primeiro ano letivo, das 100 crianças em observação.
A estatística X pode ser usada como estimador do parâmetro µ
µ=X± erro amostral
A estimativa é tão mais precisa quanto menor for o
erro amostral
Um dos principais objetivos na teoria da
estimação é estimar um limite superior provável
para o erro amostral
Avaliar precisão: estimativa de parâmetro tipo
proporção de algum atributo e do tipo média de
algum atributo
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO A prefeitura de uma cidade pretende avaliar a aceitação de um certo projeto
educacional. Depois de apresentá-lo aos moradores do município, os
responsáveis por sua execução desejam avaliar o valor aproximado do
parâmetro ¶= proporção de favoráveis ao projeto, dentre os indivíduos
residentes no município. Para estimar este parâmetro, a prefeitura planeja
observar uma amostra aleatória simples de n=400 moradores e calcular o valor
da estatística P = Proporção de moradores favoráveis ao projeto na amostra
O valor de P (proporção de favoráveis numa amostra de n =
400 moradores) vai ser um valor próximo da verdadeira
proporção ¶, a qual refere a todos os moradores do
município?
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO
O valor de P (proporção de favoráveis numa amostra de n =
400 moradores) vai ser um valor próximo da verdadeira
proporção ¶, a qual refere a todos os moradores do
município?
POPULAÇÃO
¶=0,70
AMOSTRA1
(400 Moradores)
P1
AMOSTRA2
(400 Moradores) P2
AMOSTRA3
(400 Moradores)
P3
AMOSTRA100
(400 Moradores) P100
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO VALORES DE P
0,7 0,67 0,69 0,7 0,74 0,71 0,68 0,69
0,69 0,71 0,71 0,68 0,71 0,71 0,7 0,7
0,72 0,71 0,71 0,68 0,7 0,71 0,68 0,67
0,65 0,67 0,69 0,7 0,71 0,72 0,72 0,71
0,65 0,71 0,67 0,7 0,7 0,72 0,7 0,66
0,69 0,70 0,73 0,74 0,71 0,7 0,72 0,72
0,66 0,66 0,67 0,70 0,71 0,71 0,72 0,71
0,69 0,69 0,66 0,7 0,7 0,73 0,75 0,75
0,73 0,7 0,71 0,76 0,73 0,73 0,72 0,71
0,7 0,68 0,71 0,69 0,74 0,72 0,73 0,74
0,68 0,69 0,70 0,71 0,71 0,71 0,72 0,76
0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74
0,75 0,67 0,66 0,68
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO VALORES DE P
0,7 0,67 0,69 0,7 0,74 0,71 0,68 0,69
0,69 0,71 0,71 0,68 0,71 0,71 0,7 0,7
0,72 0,71 0,71 0,68 0,7 0,71 0,68 0,67
0,65 0,67 0,69 0,7 0,71 0,72 0,72 0,71
0,65 0,71 0,67 0,7 0,7 0,72 0,7 0,66
0,69 0,70 0,73 0,74 0,71 0,7 0,72 0,72
0,66 0,66 0,67 0,70 0,71 0,71 0,72 0,71
0,69 0,69 0,66 0,7 0,7 0,73 0,75 0,75
0,73 0,7 0,71 0,76 0,73 0,73 0,72 0,71
0,7 0,68 0,71 0,69 0,74 0,72 0,73 0,74
0,68 0,69 0,70 0,71 0,71 0,71 0,72 0,76
0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74
0,75 0,67 0,66 0,68
Em nenhuma das amostras o erro amostral teve magnitude superior a
0,06, ou seja 6%
96 valores de P, dentre os 100, acusaram erros amostrais inferiores a 0,05
Erro amostral 0,05 e nível de confiança 96%
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO
Problemas de estimação de uma proporção – experimento tipicamente
binomial, com parâmetros n (tamanho da amostra) e ¶ (proporção do
atributo em questão)
Se n for grande, a distribuição binomial se aproxima de uma distribuição
normal.
pn
p
)1(
-z
-1,96
z
1,96
0,95
Se exigirmos nível de confiança de 95%
de confiança, podemos explicitar um
limite superior provável para o erro
amostral, considerando a faixa de 1,96
desvios padrão, acima e abaixo do
centro de distribuição
ESTIMAÇÃO DE UMA PROPORÇÃO Tamanho da amostra razoavelmente grande
Válida a aproximação da distribuição binomial para a normal
np
)1(
-z
-1,96
z
1,96
0,95
Fixado um nível de confiança de 95%, o
Limite máximo para o erro amostral fica
em torno de Sp(1,96)
O desvio padrão da distribuição amostral de P, também conhecido como
erro padrão de P, pode ser estimado por:
n
PPS p
)1(
EXERCÍCIO EM SALA Admita que na amostra de n=400 elementos, encontramos 60% de
favoráveis. Temos, então, P=0,60 (ou 60%) e erro padrão de P dado por
Usando nível de confiança de 95%, temos um erro amostral máximo
provável de (1,96) Sp= (1,96)(0,0245)=0,048 ou 4,8%
n
PPS p
)1( 0245,0
400
)6,01(6,0
pS
Podemos dizer que o intervalo 60% ± 4,8% ( 55,2% a 64,8%) contém com
95% de confiança, o parâmetro ¶ (proporção de favoráveis em toda a
população de moradores do município)
P±(1,96) Sp é dito o intervalo de confiança para o parâmetro ¶, com nível
de confiança de 95%.
OUTROS NÍVEIS DE CONFIANÇA Arbitrado um nível de confiança, podemos obter o limite
provável para o erro amostral, multiplicando Sp por um
determinado valor z da curva normal padrão.
Estimativa do erro amostral máximo z Sp
Intervalo de confiança P± zSp
EXERCÍCIO EM SALA 2 Admita que na amostra de n=400 elementos, encontramos 60% de
favoráveis. Temos, então, P=0,60 (ou 60%) e erro padrão de P dado por
Usando nível de confiança de 99%, determine o erro amostral máximo e o
intervalo de confiança
n
PPS p
)1( 0245,0
400
)6,01(6,0
pS
ESTIMAÇÃO DE UMA MÉDIA (Amostras grandes)
Para estimar o parâmetro µ (média de alguma variável quantitativa), a
partir de X (média da variável observada numa amostra aleatória simples),
podemos seguir os mesmos princípios da estimação de uma proporção,
pois, para amostras grandes, a distribuição amostral de X também se
aproxima de uma distribuição normal.
O erro padrão da média amostral pode ser estimado, a partir do desvio
padrão amostral, S, segundo a expressão
n
SS
x
1
22
n
XnXS
Para amostras grandes, podemos avaliar o erro amostral máximo
provável por zSx, onde z pode ser obtido pelos mesmos procedimentos
anteriores, em função do nível de confiança desejado
EXERCÍCIO EM SALA 3 Observando uma amostra aleatória simples de n = 100 crianças no
primeiro ano letivo, nas escolas municipais em que se estava servindo
uma merenda especial, encontram-se as seguintes estatísticas relativas à
variável ganho de peso ao longo do ano
Ganho médio de peso das crianças da amostra KgX 0,6
Desvio padrão dos pesos das crianças da amostra kgS 0,2
Com o objetivo de estimar o parâmetro µ=ganho médio de peso da
população, podemos calcular uma estimativa para o erro padrão da média
amostral
n
SS
x kgS
x2,0
100
0,2
O erro amostral máximo provável (95% de confiança)
Kg392,0)2,0)(96,1( kg392,0000,6
A partir do acompanhamento da amostra das cem crianças, chegamos a
conclusão de que o intervalo de 5,608 a 6,392kg contém, com 95% de
confiança, o ganho médio de peso, µ, de todas as crianças da rede
municipal de ensino
ESTIMAÇÃO DE UMA MÉDIA (Amostras pequenas)
Quando dispomos de uma amostra pequena (n<30), não temos a garantia
de que a distribuição amostral da média se aproxime de uma distribuição
normal.
Porém , se a variável em estudo tiver uma distribuição razoavelmente
simétrica, parecida com uma normal, a teoria estatística mostra que é
possível construir estimativas intervalares para a média populacional µ,
utilizando uma distribuição , denominada de t de Student.
Para obter o valor t da distribuição t de student, basta calcular o grau de
liberdade: gl = n-1, fixar o nível de confiança e usar tabela da distribuição
ESTIMAÇÃO DE UMA MÉDIA (Amostras pequenas)
Para gl = 9 e nível de
confiança 95%
0 t
95%
2.5% 2.5%
O intervalo de confiança
para uma média µ tem a
seguinte expressão
xtSX
EXERCÍCIO EM SALA 4
Para verificar a eficácia de um programa de prevenção de acidentes de
trabalho, fez-se um estudo experimental, implementando este programa
em dez empresas da construção civil, escolhidas ao acaso, numa certa
região. Os dados abaixo referem-se aos percentuais de redução de
acidentes de trabalho nas 10 empresas observadas
n
SS
x
10,210
65,6
xS
Usando nível de 95% de confiança, graus de liberdade gl=9 (n=10 e
gl=n-1)