distribuições contínuas de probabilidade
TRANSCRIPT
Distribuições Contínuas de Probabilidade
Uma variável aleatória contínua é uma função definidasobre o espaço amostral, que associa valores em umintervalo de números reais.
Exemplos:
Espessura de um item
Tempo necessário para completar um teste
Tempo de espera numa fila
Peso
Para variáveis aleatórias contínuas introduzimos a funçãodensidade de probabilidade (fdp), tal que,
1f(x) dx(b)
0 (a) f(x)
-
=
A condição (a) implica que a densidade é uma função não negativa econdição (b) corresponde ao fato de que a soma (integral no caso devariáveis contínuas) das probabilidades é igual a um. A integração de±oo significa que devemos integrar sobre todos os valores de x emque f(x) é definida.
Qualquer função f(x) satisfazendo (a) e (b) é uma fdp.
Note que para variáveis contínuas as somas são substituídas porintegrais.
b.xlo ano interva valores
x assumir lidade de a probabirepresenta f(x) dx b)xP(a
b. xo a intervallores numssu mir vaade de x aprobabilid
rar a ue considea, temos qa), ou sejnto (xlor num pox ter o va
e bilidade der a probaodemos obtnuas não pveis contíPara variá
b
a
=
=
b)xP(ab)xP(ab)xP(ab)xque: P(ala, temos ponto é nu
um dadoir valor nel x assum da variávbabilidadecomo a pro Note que,
===
Geometricamente
X
f(x)
a
)bxP(a bxa intervalo no
x eixo o e f(x) fdp a entre Área
=
b
3
1 (3-2)
3
1
2
3 x
3
1 dx
3
13)x: P(2(b) Temos
é uma fdp.anto f(x) port
1 (4-1)3
1
1
4 x
3
1 dx
3
1f(x) dx0 e que f(x)(a) Temos
3x 2 intervalo vaores no x assumirilidade dee a probab(b) Calcul
p.) é uma fdque se f(x(a) verifi
valores0, outros
4x, 13
1
f(x)
ão ada a funçExemplo: D
3
2
4
1-
====
====
=
Do mesmo modo que para variáveis discretas, podemos definirpara variáveis contínuas a média, a variância e odesvio padrão. Lembando que introduzimos a fdp associada avariável aleatória considerada e substituímos as somas por
integrais.
Assim, para a variável aleatória X, temos:
2
-
222
-
σrão: σDesvio-pad
f(x) dxx-μ σ): (σVariância
x f(x) dx μ :)( Média
=
=
=m
2
3σ σe assim:
4
3
1
4
3
2
5x
3
1 dx)
2
5 (x
3
1 dx
3
1)
2
5(x f(x) dxμ)(x : σ(b) Temos
2
5
6
15)1(4
6
1
1
4
2
x
3
1 x dx
3
1 dx
3
1xx f(x) dx μ(a) Temos:
o de X.svio padrãcia e o dee a variân(b) Calcul
a X.l aleatórida variávee a média (a) Calcul
valores0, outros
4x, 13
1
f(x)
eriormentederada ant fdp consionsidere aExemplo: C
2
3
4
1
24
1
2
-
22
2224
1
4
1-
==
=
==
==
===
==
==
=
Função Distribuição Acumulada
==
ox
oo
o
dx f(x))xP(X)F(x
seja, ou ,xX que de
adeprobabilid a é F(x) (fda) acumulada ãodistribuiç função A
F(x) é análoga a distribuição de frequências relativas
acumuladas (ou % acumuladas) estudadas no início do curso
xoX
Área até xo =F(xo)=P(X ≤ xo)
Para a Distribuição Uniforme a fdp é dada por:
=
bX ou X a 0
bX a seab
1
f(X)
A Distribuição Uniforme
a b 12
(b-a)σ rão: desvio pad
2
baμmédia:
2
=
=
gráfico
Distribuição contínua que é assimétrica à direita e se estendede zero até o infinito positivo
Amplamente utilizada na teoria das filas para modelarintervalo do tempo decorrido entre chegadas em processos,tais como:
clientes em caixas eletrônicos de bancos
pacientes dando entrada em uma emergência de umhospital
pesquisas em um endereço da internet
A Distribuição Exponencial
=
0 x 0
0 xf(x)
:lexponencia ãodistribuiç a para
b
b
x
e
fdp
b=s
b=s
b=m
:padrão desvio
:iânciavar
:média22
Note que b representa o valor médio de x e 1/brepresenta uma frequência média. Em alguns livros usa-se l=1/b .
.a até 0 desde curva da abaixo área é
e-1a)P(x :aX até zero de acumulada adeprobabilidA β
a-
==
0 1 2 3 4
0.5
1.0
1.5
2.0
b = 1,0
b = 0,5
b = 2,0
b = 5,0
β de valores váriospara
0 x 0
0 xβ
ef(x) de gráfico
β
x
=
Exemplo: Cerca de 15 clientes utilizam o caixa eletrônico por hora.Supondo que a distribuição de tempos de chegada é exponencial,qual é a probabilidade de que o tempo de chegada entre clientesconsecutivos seja:
(a) Menor que três minutos?
(b) Maior que 3 minutos?
(c) Entre 2 e 4 minutos?
- A variável aleatória X= tempo
- Note que foi dada a frequência de chegada λ = 1/b = 15 /hora
-3 min = 0,05 horas
-2 min = 0,0333 horas
-4 min = 0,0666 horas
(a) P(t < 0,05) = 1 – e-λt = 1 – e-(15).(0,05) = 0,5276
(b) P(t ≥ 0,05) = 1 – P(t < 0,05) = 1 – 0,5276 = 0,4734
P(0,0333<t < 0,0666)= P(t<0,0666)- P(t<0,0333)= e-(15).(0,0666)) - e-(15).(0,0333))
0,0333
(c)
0,0666
Área de 0,0333 até 0,0666= (área de 0 até 0,0666) – (área de 0 até 0,033)
Distribuição Normal
curva em “Forma de sino”
Simétrica
Média, Mediana e Modasão iguais
A localização é determinada pela média, μ
A dispersão é determinado pelo desvio-padrão, σ
A variável aleatória tem uma amplitude teórica infinita: + até
Média = Mediana = Moda
X
f(X)
μ
σ
A fórmula para a fdp da distribuição normal é:
2
σ2
μx
πσ2
ef(x)
2
2
=
Notação:
N(m,s2) distribuição normal com média m e variância s2
Variando os parâmetros μ e σ, obtém-se diferentes distribuições normais
X
f(X)
μ
σ
Mudar a μ muda a distribuição para adireita ou para a esquerda
Mudar o σ aumenta ou diminuia dispersão
10 5 0 5 10
0.05
0.10
0.15
0.20
0.25
Exemplo gráfico
Desvio padrão fixo: s=2
Mudar a média μ desloca a distribuição para a direita ou paraa esquerda
m=-5 m=0 m=5 m=10
Mudar o desvio padrão σ aumenta ou diminui a dispersão
5 0 5 10 15
0.05
0.10
0.15
0.20
0.25Exemplo gráfico
Média fixa: m=5
m=5
s = 2
s = 4
s = 8
Distribuição Normal Padronizada( N(0,1)): distribuição normal com média zero e variância um.
2π
ef(Z)
2
Z2
=
Z
f(Z)
0
1
Valores acima da média possuem valor Z positivo
Valores abaixo da média possuem valor Z negativo
Transformação para a Distribuição Normal Padronizada
Transformação de X em normal padronizada (distribuição “Z”)mudando a variável
σ
μXZ
=
A distribuição Z sempre tem média zero e desvio-padrão 1
Exemplo
Se X é normalmente distribuído com média 100 e desvio padrão 50, o valor Z para X = 200 é
X = 200 está dois desvios-padrão acima da média
250
100200
σ
μXZ =
=
=
Comparando X e Z
Z
100
20
200 X
Note que a distribuição é a mesma, apenas a escala mudou.O problema pode ser expresso em unidades originais (X) ouem unidades padronizadas (Z)
(μ = 100, σ = 50)
(μ = 0, σ = 1)
Encontrando Probabilidades com a distribuição normal
Probability is the area under thecurve!
a b X
f(X) P a X b( )≤
A probabilidade é dada pela área abaixo da curva
≤
P a X b( )<<=
(Note que a probabilidade de qualquer valor individual é zero)
f(X)
X
0,50,5
A área total abaixo da curva é igual a 1 e a curva ésimétrica, então metade da curva está acima da média e aoutra metade está abaixo
1)XP( =
0,5)XP(μ =0,5μ)XP( =
68,26% dos valores estão dentro dos limites f(X)
Xμ μ+1σμ-1σ
Regras Gerais:
σσ
68,26%
μ ±1σ
95,44 % dos valores estão dentro dos limites
99,73% dos valores estão dentro dos limites
xμ
2σ 2σ
xμ
3σ 3σ
95,44% 99,73%
μ ± 2σ
μ ± 3σ
A Tabela da Normal Padronizada
A Tabela da Normal Padronizada fornece aprobabilidade menor do que um valor desejado paraZ (isto é, do infinito negativo até Z)
Z0 2,00
0,9772Exemplo:
P(Z < 2,00) = 0,9772
Esse valor é encontrado na tabela
0,9772
2,0P(Z < 2,00) = 0,9772
A linha fornece ovalor da primeiracasa decimal de Z
A coluna fornece o valor da segunda casa decimal de Z
2,0
,,,
Z 0,00 0,01 0,02 …
0,0
0,1
Encontrando o valor na tabela
O valor dentro da tabela representa a
probabilidade
Procedimentos Gerais para Encontrar Probabilidades
Desenhe a curva normal para o problema em termos de X
Transforme os valores X em valores Z
Use a Tabela da Normal Padronizada
Para encontrar P(a < X < b) quando X é normalmente distribuído:
Encontrando Probabilidades Normais
Suponha que X é normal com média igual a 8e desvio-padrão igual a 5
Encontre P(X < 8,6)
X
8,6
8,0
Encontrando o valor padronizado
Z0,120X8,68
μ = 8
σ = 10
μ = 0
σ = 1
0,125
88,6
σ
μXZ =
=
=
P(X < 8,6) P(Z < 0,12)
Z
0,12
Procurando P(Z < 0,12) na tabela
0,00
P(X < 8,6)= P(Z < 0,12)= 0,5478
Probabilidades Acima da Média
Suponha que X é normal com média igual a 8 e desvio-padrão igual a 5
Encontre P(X > 8,6)
X
8,6
8,0
Z
0,12
0Z
0,12
0,5478
0
1,000 1 - 0,5478 = 0,4522
P(X > 8,6) = P(Z > 0,12) = 1 - P(Z ≤ 0,12)
= 1 - 0,5478 = 0,4522
Probabilidades entre Dois Valores
Suponha que X é normal com média igual a 8 e desvio-padrão igual a 5. Encontre P(8 < X < 8,6).
P(8 < X < 8,6)
= P(0 < Z < 0,12)
Z0,120
X8,68
05
88
σ
μXZ =
=
=
0,125
88,6
σ
μXZ =
=
=
Cálculo do valor Z:
Z
0,12
0,0478
0,00
P(8 < X < 8,6) = P(0 < Z < 0,12)
= P(Z < 0,12) – P(Z ≤ 0)
= 0,5478 - 0,5000 = 0,0478
0,5000
Tabela da Probabilidade Normal Padronizada
Z
Suponha que X é normal com média igual a 8 e desvio-padrão igual a 5.
Encontre P(7,4 < X < 8)
Calculando os valores Z:
Probabilidades Abaixo da Média
X
7,48,0
05
88
σ
μXZ =
=
= 0,12-
5
87,4
σ
μXZ =
=
=
Temos:
P(7,4 < X < 8) = P(-0,12 < Z < 0)
= P(Z < 0) – P(Z ≤ -0,12)
= 0,5000 - 0,4522 = 0,0478
Lembre-se: A distribuição normal é simétricae a probabilidade é igual a P(0 < Z < 0,12)
X7,4 8,0
0,0478
0,4522
Z-0,12 0
Passos para encontrar o valor X para uma probabilidade conhecida:
1. Encontre o valor Z para a probabilidade conhecida
2. Converta o valor Z em X pela fórmula:
Encontrando o valor X para uma probabilidade conhecida
ZσμX =
Exemplo:
Suponha que X tem distribuição normal com médiaigual a 8 e desvio-padrão igual a 5
Encontre o valor X, considerando que apenas 20%dos valores são menores que esse valor X
X? 8,0
0,2000
Z? 0
Lembre-se a distribuição é simétrica
Tabela da Probabilidade Normal Padronizada: valores positivos
Como o valor 80% está entre dois valores, utilizamos o ponto médio: Temos aproximadamente P = 0,8009 dos valores ocorrem para x<0,845.
X?8,0
0,8009 ( aproximadamente 80%)
Z0,8450
X? 8,0
0,2005
Z-0,84 0
Por simetria, valores abaixo da média:
Z = -0,845
2. Converta o valor Z em X pela fórmula:
7753,
).550,84(8
ZσμX
=
=
=
Portanto: 20% dos valores da distribuição com média igual a 8e desvio-padrão igual a 5 são menores que 3,775
Exemplo:A média das ações de empresas que compoem as S&P500 é de US$ 30 e o desvio padrão é de US$8,20. Supoha que os preços das ações se distribuam normalmente.
(a) qual a probabilidade de uma empresa ter um preço de, no mínimo, US$ 40 para suas ações?
(b) Qual a probabilidade de uma empresa ter um preço não superior a US$ 20 para suas ações?
(c) qual o preço das ações para que a empresa seja incluída nas 10% maiores?
1112,0)40x(P1)40P(x portanto
0,88881,22)P(z40)P(x
1,22z :40 x para (a)
==
==
==
1112,08888,01)20P(x portanto
0,8888)22,1z(P1,22)P(z20)P(x
1,22z :20 x para )b(
==
===
==
40,50preço um tiver se maiores 10% as entre estara empresa a
40,50)8,2.(1,28530 x:então
médio) ponto o utilizando e (tabela
1,285z ecorrespondsuperior cauda na 10% de área )(
==
=c
Aproximação da Normal para a Distribuição Binomial
Quanto mais perto p estiver de 0,5, melhor será aaproximação da normal para a distribuição binomial
Quanto maior o tamanho da amostra, n, melhor seráa aproximação da normal para a distribuição binomial
Regra Geral:
A distribuição normal pode ser utilizada paraaproximar a distribuição binomial se
np ≥ 5 e n(1 – p) ≥ 5
Gráficos da distribuição binomial para p=0,7: note que amedida que n aumenta o gráfico fica mais próximo ao de umadistribuição normal.
A média e o desvio-padrão da distribuiçãobinomial são
μ = n.p
Transforme a binomial em normal utilizando afórmula:
p)np(1
npX
σ
μXZ
=
=
p)np(1σ =
Note que:
A distribuição Normal é uma distribuição contínua, enquanto quea distribuição Binomial é uma distribuição discreta.
Assim, para aproximar a distribuição Binomial (que é discreta)pela normal (que é contínua) fazemos uma correção decontinuidade ao valor discreto x na distribuição binomialrepresentando o valor x pelo intervalo de x – 0.5 a x + 0.5.
X
discreto contínuo
x – 0.5 x + 0.5
Correção de continuidade
Por exemplo:
X ≥ 120 X ≥ 119,5
X > 120 X > 120,5
X ≤ 120 X ≤ 120,5
X < 120 X < 119,5
Exemplo: Considere a distribuição binomial com n=1000 e p=0,02.Qual é P(X≤180)?
1,540,2)2).(1(1000).(0,
2)(1000).(0,180,5
p).(1pn.
pn.XZ =
=
=
X180,5 200-1,54 0 Z
Temos: np=1000.0,02=20>5 e n(1-p)=1000.0,98=980>5
Portanto, podemos aproximar a distribuição binomial pela normal.
Correção de continuidade: Aproximar P(X ≤ 180) para P(X ≤ 180,5)
Transformar a binomial em normal padronizada:
Consultando a tabela:P(Z ≤ -1,54) = 0,0618
Algumas propriedades
2
y
2
xyx
yxyx
yxyx
σσσ
padrãodesvio- e
μμμ
média com
normal ãodistribuiç tem YX aleatória variável a Então .menterespectiva
,σ e σ padrãodesvios- e μ e μ médias com ade,probabilid de normais
õesdistribuiç com tesindependen aleatórias variáveis Y e X Sejam
=
=
Verificando normalidade
Muitos procedimentos estatísticos requerem que a população tenha uma distribuição próxima da distribuição normal.
Espera-se que a amostra reflita a distribuição da população: histograma parecido, distribuição acumulada...
Outra maneira de verificar se normalidade é razoável: normal-score plot
Exemplo: considere os dados: 68, 42, 44, 75Para n=4, temos 5 faixas com probabilidade 1/5=0.2. Cada valor dos dados ordenados acumula 1/5=0.2
E corresponderiam, se fossem de uma distribuição normal, aos pontos:
normal-score plot
Score normal Dados ordenados
Score normal
Dado
s ord
en
ad
os
Um padrão retilineo indica proximidade com a distribuição normal.
Dados tabela D9 apendice do livro texto
24
0
5
10
15
20
25
30
35
40
-2 -1 0 1 2
Tc
om
pri
me
nto
do
ca
niin
o (
mm
)
score-normal
Normal-score plot para notas de uma disciplina
Transformando dados para obter normalidade: