revisão de probabilidade e estatística
DESCRIPTION
Revisão de Probabilidade e Estatística. Parte 2. Variáveis Aleatórias. Definição: Regra que atribui um valor numérico a cada possível resultado de um experimento. Exemplo: Jogue duas moedas (o experimento aleatório) e registre o número de caras: 0, 1 ou 2. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/1.jpg)
REVISÃO DE PROBABILIDADE E ESTATÍSTICAParte 2
![Page 2: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/2.jpg)
Variáveis Aleatórias Definição:
Regra que atribui um valor numérico a cada possível resultado de um experimento.
Exemplo: Jogue duas moedas (o experimento
aleatório) e registre o número de caras: 0, 1 ou 2.
Usa-se letras maiúsculas para a variável e letras minúsculas para um valor particular.
![Page 3: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/3.jpg)
Variáveis Aleatórias Probabilidades dos resultados:
Pr(X=x)=p(x) Para o exemplo das moedas:
41
21
41)Pr(
210xX
x
![Page 4: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/4.jpg)
Histograma
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1 2
Para cada valor de X, traçamos uma barra com alturaigual a p(x).
A área total é a soma das probabilidades para todos osresultados, i.e., 1.
![Page 5: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/5.jpg)
Resultado do lançamento de moedas
223,0223225,0517,051715,0260,0260025,0
)( nnnxxp x
x
ModeloProbabilístico
DadosObservados
![Page 6: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/6.jpg)
Comparação: modelo x real
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1 20
0,1
0,2
0,3
0,4
0,5
0,6
0 1 2
HistogramaProbabilístico
Histograma daFreqüência Relativa
![Page 7: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/7.jpg)
Função distribuição de probabilidade (PDF ou CDF)
)()Pr(
)Pr()(
xptX
tXtF
Xtx
X
0
0,2
0,4
0,6
0,8
1
1,2
0 1 2
)()()()()(
aFbFaXPbXPbXaP
XX
![Page 8: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/8.jpg)
Função densidade de probabilidade (pdf)
dxxdFxf )()(
2
1
)()()()( 1221
x
x
dxxfxFxFxXxP
Dada uma pdf f(x), a probabilidade de X se encontrarno intervalo (x1,x2) pode também ser calculada atravésde integração:
![Page 9: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/9.jpg)
Função probabilidade de massa (pmf)
ii pxf )(
21
)()()( 1221
xxxi
i
i
pxFxFxXxP
A probabilidade de x se encontrar no intervalo (x1,x2) pode também ser calculado através de somas:
![Page 10: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/10.jpg)
Média e Valor Esperado Média m E(x)
n
iii xp
1Para variáveis discretas
dxxxf )( Para variáveis contínuas
Soma de todos os valores possíveis, ponderada pela probabilidade de ocorrência de cada um dos valores.
![Page 11: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/11.jpg)
Variância A quantidade (x-m)2 representa a
distância quadrática entre x e a sua média.
A variância de x é o valor esperado desta quantidade:
])[()(Var 2m xEx
n
iii xp
1
2)( m
dxxfx )()( 2m
![Page 12: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/12.jpg)
Desvio Padrão A variância é normalmente denotada por s2.
A raiz quadrada da variância é chamada de desvio padrão e é denotado por s.
![Page 13: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/13.jpg)
Coeficiente de Variação
ms
média
padrão desvio C.O.V.
![Page 14: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/14.jpg)
Covariância Dadas duas v.a.s X e Y com médias mx e my,
a covariância delas é dada por:
Para variáveis independentes a covariância é zero, dado que
)()()(
)])([(),(Cov 2
yExExyE
yxEyx yxxy
mms
)()()( yExExyE
Apesar da independência sempre implicar em covariânciazero, o contrário nem sempre é verdade.
![Page 15: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/15.jpg)
Coeficiente de Correlação Ou simplesmente correlação é o valor
normalizado da covariância
yx
xyxyyx
sss
2
),(Correlação
A correlação varia sempre entre -1 e +1.
![Page 16: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/16.jpg)
Média e Variância de Somas Sejam x1, x2,..., xk k variáveis aleatórias e
a1, a2,..., ak k constantes arbitrárias (denominadas de pesos), então E(a1 x1+ a2x2+...+ akxk)= a1 E(x1)+
a2E(x2)+...+ ak E(xk) Para variáveis independentes:
)(Var)(Var)(Var
)(Var2
2221
21
2211
kk
kk
xaxaxa
xaxaxa
![Page 17: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/17.jpg)
Quantis O valor x no qual a CDF corresponde ao
valor a é chamado de a-quantil ou 100a-percentil.
Ele é denotado por xa
aaa )()( xFxxP
![Page 18: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/18.jpg)
Mediana e Moda Mediana: é o posto percentil 50 (ou
quantil 0,5) de uma variável aleatória. Moda: é o valor mais provável de uma
v.a. Ou seja, é o valor xi que corresponde à maior probabilidade pi, ou o valor de x para o qual a pdf atinge o seu valor máximo.
![Page 19: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/19.jpg)
Tentativas de Bernoulli Suponha que tenhamos um processo
aleatório com apenas dois resultados possíveis: sucesso ou falha.
As tentativas de Bernoulli são a repetição de um experimento como este, desde que: Haja apenas dois resultados em cada tentativa. A probabilidade de sucesso (p) seja a mesma
em cada tentativa. As tentativas sejam independentes.
![Page 20: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/20.jpg)
Variável Aleatória Binomial X é o número de sucessos em n
tentativas de Bernoulli com probabilidade p de sucesso.
knk ppkn
kXP
)1()(
)!(!!
knkn
kn
onde
![Page 21: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/21.jpg)
Histograma da Distribuição Binomial
6 jogadas de moedas, p = 0,5
-
0,050
0,100
0,150
0,200
0,250
0,300
0,350
0 1 2 3 4 5 6
Número de sucessos
![Page 22: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/22.jpg)
Histograma da Distribuição Binomial
20 jogadas de moedas, p = 0,5
-0,0200,0400,0600,0800,1000,1200,1400,1600,1800,200
0 2 4 6 8 10 12 14 16 18 20
![Page 23: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/23.jpg)
Mas, calcular estestermos para grandesvalores de n pode dar muito trabalho... ou pelomenos dava no século 18quando James Bernouilli e Abraham de Moivre estavam calculando sem um computador.
![Page 24: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/24.jpg)
Utilizando uma ferramentarecém-inventada, o Cálculo,De Moivre mostrou que parap=0,5, a distribuição normalera bem aproximada poruma função densidadecontínua que podia serdescrita de forma bem simples.
![Page 25: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/25.jpg)
Para ver como isto funciona, imagine a distribuição binomialcom p=0,5 e n muito grande - por exemplo, um milhão...
![Page 26: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/26.jpg)
Agora desloque ográfico de modo quea média seja zero.
Esprema a curva ao longo doeixo x até que o desvio padrãoseja 1 e estique no eixo y paraque a área continue sendo 1.
![Page 27: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/27.jpg)
Distribuição Normal Unitária O resultado ficou próximo a uma curva
suave, simétrica e com forma de sino que é descrita pela seguinte fórmula:
2
2
21)(
z
ezf
![Page 28: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/28.jpg)
Distribuição Normal É a distribuição mais comumente utilizada
na análise de dados. A soma de um grande número de
observações independentes de qualquer distribuição tem uma distribuição normal.
22 2/)(
21)( sm
s xexf x
![Page 29: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/29.jpg)
Distribuição Normal
![Page 30: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/30.jpg)
Transformação z
A transformação z
sm
xz
Muda uma variávelaleatória normal commédia m e desvio padrão s, numa distribuição normalunitária.
![Page 31: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/31.jpg)
Razões da Popularidade da Distribuição Normal
A soma de n variáveis normais independentes é uma variável normal.
A soma de um grande número de observações independentes de qualquer distribuição tende a uma distribuição normal: Teorema do limite central.
![Page 32: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/32.jpg)
Medidas de Tendência Central Média aritmética: obtida através da
soma de todas as observações e dividindo esta soma pelo número de observações da amostra.
Mediana: é obtida ordenando-se as observações em ordem crescente e tomando a observação que se encontra no meio da série.
Moda: é o escore ou categoria que, numa distribuição, ocorre com mais freqüência.
![Page 33: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/33.jpg)
Escolha da Medida de Tendência Central
Média: muito afetada por valores extremos
(outliers) dá o mesmo peso a cada observação propriedade linear: média da soma é a
soma das médias. Mediana:
exige uma ordenação
![Page 34: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/34.jpg)
Escolha da Medida de Tendência Central
Moda: pode ser obtida para qualquer conjunto de
dados.
![Page 35: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/35.jpg)
Relacionamentos entre as Medidas de Tendência Central
![Page 36: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/36.jpg)
Seleção da Medida de Tendência Central
Os dadossão categorias? Use moda
Não
Sim
Temosinteresse no total? Use média
Não
Sim
A distribuiçãoé espalhada? Use mediana
Não
Sim
Use média
![Page 37: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/37.jpg)
Exemplos Recurso mais utilizado do sistema:
recursos são categorias, portanto deve-se utilizar a moda.
Intervalo entre chegadas: o tempo total é de interesse, portanto
deve-se utilizar a média. Carga de um computador:
É preferível usar a mediana devido ao espalhamento da distribuição.
![Page 38: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/38.jpg)
Mau Uso das Médias Usar a média de valores
significativamente diferentes: não é muito útil dizer que o tempo médio
de CPU por transação é 505 mseg quando as duas medidas observadas foram 10 e 1000 mseg!
![Page 39: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/39.jpg)
Mau Uso das Médias Usar a média sem levar em conta o
espalhamento da distribuição:
Sistema A Sistema B10 59 5
11 510 410 31
Soma 50 50Média 10 10Típico 10 5
![Page 40: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/40.jpg)
Mau Uso das Médias Multiplicar as médias para obter a Média
de um produto: Se x e y forem correlacionadas,
Efetuar a média de frações com bases diferentes.
)()()( yExExyE
![Page 41: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/41.jpg)
Média Geométrica A média geométrica é utilizada se o
produto das observações for uma quantidade de interesse.
Calculada através de:nn
iixx
/1
1
![Page 42: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/42.jpg)
Exemplo 12.2: Os melhoramentos de desempenho na última versão
das sete camadas de um novo protocolo de rede foram medidos separadamente para cada uma das camadas:
Calcule o melhoramento médio por camada.
Camada Melhoramento do Protocolo do Desempenho (%)
7 186 135 114 83 102 281 5
![Page 43: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/43.jpg)
Exemplo 12.2: Melhoramento médio por camada
= {(1,18)(1,13)(1,11)(1,08)(1,10)(1,28)(1,05)}1/7 -1
= 0,13 Portanto, o melhoramento médio por
camada é de 13%.
![Page 44: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/44.jpg)
Média Geométrica Outras medidas que trabalham de forma
multiplicativa: taxa de acertos de cache em diversos
níveis de cache taxas de insucesso de cache Percentual de melhora de desempenho
entre versões sucessivas Taxa média de erro por etapa em um
caminho de múltiplas etapas numa rede
![Page 45: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/45.jpg)
Função Média Geométrica Função gm(), que mapeia um conjunto de
respostas {x1, x2,..., xn} em um único número.
Propriedade multiplicativa:)/,,/,/(
1),,,(),,,(
,,,221121
21
2
2
1
1
nnn
n
n
n
xyxyxygmyyygmxxxgm
yx
yx
yx
gm
![Page 46: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/46.jpg)
Média Harmônica A média harmônica deve ser utilizada
sempre que possa ser justificada uma média aritmética para 1/xi.
Calculada através de:
nxxxnx
/1/1/1 21
![Page 47: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/47.jpg)
Exemplo Suponha que foram efetuadas medidas
repetidas do tempo gasto com a execução de uma benchmark em um dado processador.
Na i-ésima repetição, o tempo gasto é ti
Suponha ainda que a benchmark possua m milhões de instruções.
Então, a taxa de execução de instruções em MIPS é dada por:
ii t
mx
![Page 48: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/48.jpg)
Exemplo Os xi’s podem ser resumidos através da
média harmônica dado que a soma dos 1/xi’s tem um significado físico.
A taxa média de MIPS do processador seria:
ntmtmtm
nx
/1
/1
/1
21
))(/1( 21 ntttnm
![Page 49: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/49.jpg)
Média de uma Fração (1) Se tomarmos a soma dos numeradores e
a soma dos denominadores e ambas tiverem um significado físico, então, a média das frações é a fração das médias.
Por exemplo:
n
n
n
n
bbbaaa
ba
ba
ba
21
21
2
2
1
1 ,,,Média
ba
bn
an
b
an
i i
n
i in
i i
n
i i
1
1
1
1
)/1(
)/1(
![Page 50: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/50.jpg)
Exemplo 12.3: A utilização da CPU de um sistema medida
em cinco intervalos diferentes resultou em:
Duração Ocupaçãoda Medição da CPU (%)
1 451 451 451 45
100 20
Soma 200%Média 200/5 ou 40%
A utilização média não é 40% pois as bases (denomina-dores) das frações (tempos totais) não são comparáveis.
![Page 51: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/51.jpg)
Exemplo 12.3: A utilização média é obtida através do
cálculo do tempo total em que a CPU esteve ocupada e do tempo total e da divisão dos dois:
medições das duração da somaCPU da ocupado tempo tosomaCPU da Média Utilização
%211001111
2045,045,045,045,0
![Page 52: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/52.jpg)
Média de uma Fração (1a) Se o denominador for constante, de modo
que a fração foi calculada em relação a uma base que é constante em todas as observações, e a soma dos numeradores tem um significado físico, então podemos utilizar a média aritmética das frações:
nba
n
n
i i
1n21n21
ba
ba
ba1
ba,,
ba,
baMédia
![Page 53: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/53.jpg)
Média de uma Fração (1b) Se a soma dos denominadores tiver um
significado físico e os numeradores forem constantes, então deve ser utilizada a média harmônica das frações, para resumi-las:
n
i in bna
abababn
121n21 ///ba,,
ba,
baMédia
![Page 54: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/54.jpg)
Média de uma Fração (2) Se o numerador e o denominador
possuem uma relação multiplicativa entre eles, tal como ai=cbi, onde c é aproximadamente uma constante que está sendo estimada, então c pode ser estimada pela média geométrica de ai/bi
![Page 55: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/55.jpg)
Estudo de Caso 12.1 Diversas benchmarks foram submetidas a um
otimizador de programa. O comprimento estático do programa foi medido antes e depois da otimização como mostrado abaixo:
Tamanho do códigoPrograma Antes Depois FraçãoBubbleP 119 89 0,75IntmmP 158 134 0,85PermP 142 121 0,85PuzzleP 8612 7579 0,88QueenP 7133 7062 0,99QuickP 184 112 0,61SieveP 2908 2879 0,99TowersP 433 307 0,71
Média geométrica 0,82
![Page 56: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/56.jpg)
MEDIDAS DE VARIABILIDADE
“Havia um homem que morreu afogado atravessando um riacho com uma profundidade média de 6 polegadas.”
- W.I.E.Gates
![Page 57: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/57.jpg)
Variabilidade Tempos de resposta para dois sistemas
com mesma média (2 segundos):
Qual deles você prefere?
![Page 58: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/58.jpg)
Medidas de Variabilidade Ou “Índices de Dispersão”:
Amplitude total Variância ou Desvio Padrão Postos percentil 10 e 90 Metade da distância interquartílica Desvio Médio absoluto
![Page 59: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/59.jpg)
Amplitude total É a diferença entre o maior e o menor
escore da distribuição. É simples mas extremamente
dependente dos valores extremos: o mínimo pode ser zero e o máximo um
ponto atípico, fora da curva É útil apenas se houver uma boa razão
para acreditar que a variável seja limitada.
![Page 60: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/60.jpg)
Variância A variância de uma amostra de n
observações é calculada da seguinte forma:
O desvio padrão de uma amostra é a raiz quadrada da variância da amostra.
n
ii
n
ii x
nxxx
ns
11
22 1 onde )(1
1
![Page 61: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/61.jpg)
Postos percentil 10 e 90 Semelhante à Amplitude Total, mas
funciona mesmo que a variável não seja limitada.
![Page 62: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/62.jpg)
Metade da distância interquartílica A distância interquartílica é a diferença
entre o terceiro e o primeiro quartil. SIQR (Semi-Interquartil Range):
22SIQR 25,075,013 xxQQ
![Page 63: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/63.jpg)
Desvio Médio absoluto Calculada através de:
Vantagem principal sobre o desvio padrão: não faz produtos nem extrai raiz quadrada.
n
ii xx
n 1
1absoluto médio Desvio
![Page 64: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/64.jpg)
Exemplo 12.4 Em um experimento, repetido 32 vezes, os
tempos medidos de CPU foram:{3,1; 4,2; 2,8; 5,1; 2,8; 4,4; 5,6; 3,9; 3,9; 2,7;
4,1; 3,6; 3,1; 4,5; 3,8; 2,9; 3,4; 3,3; 2,8; 4,5; 4,9; 5,3; 1,9; 3,7; 3,2; 4,1; 5,1; 3,2; 3,9; 4,8; 5,9; 4,2}
O conjunto ordenado é:{1,9; 2,7; 2,8; 2,8; 2,8; 2,9; 3,1; 3,1; 3,2; 3,2;
3,3; 3,4; 3,6; 3,7; 3,8; 3,9; 3,9; 3,9; 4,1; 4,1; 4,2 ; 4,2; 4,4; 4,5; 4,5; 4,8; 4,9; 5,1; 5,1; 5,3; 5,6; 5,9}
![Page 65: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/65.jpg)
Exemplo 12.4 O conjunto ordenado é:
{1,9; 2,7; 2,8; 2,8; 2,8; 2,9; 3,1; 3,1; 3,2; 3,2; 3,3; 3,4; 3,6; 3,7; 3,8; 3,9; 3,9; 3,9; 4,1; 4,1; 4,2 ; 4,2; 4,4; 4,5; 4,5; 4,8; 4,9; 5,1; 5,1; 5,3; 5,6; 5,9}
O posto percentil 10 é dado por [1+(31)(0,10)]= 4o. Elemento = 2,8
O posto percentil 90 é dado por [1+(31)(0,90)]= 29o. Elemento = 5,1
Q1 é dado por [1+(31)(0,25)]=9o. Elemento= 3,2 Q3 é dado por [1+(31)(0,75)]=24o. Elemento=
4,5 Portanto, 65,0
22,35,4
2SIQR 13
![Page 66: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/66.jpg)
Seleção da Medida de Variabilidade
A distribuiçãoé limitada? Use Amplitude Total
Não
Sim
A distribuiçãoé simétrica e
unimodal?Use C.O. V.
Não
Sim
Use postos percentisou SIQR
![Page 67: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/67.jpg)
Determinação da Distribuição dos Dados
O modo mais fácil é fazer um gráfico com o histograma das observações.
Usando, por exemplo, a ferramenta de análise de dados- histograma do Excel!
O maior problema é determinar o tamanho de cada classe (célula). Se qualquer classe tiver menos do que 5
observações, deve-se aumentar o tamanho das classes ou usar um histograma com classes de tamanhos variáveis.
![Page 68: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/68.jpg)
Gráfico Quantil-Quantil Para pequenas amostras o melhor é fazer
um gráfico dos quantis observados em relação ao quantil teórico.
Se a distribuição da amostra corresponder à distribuição teórica, o gráfico quantil-quantil deve ser linear.
Os quantis da distribuição teórica são obtidos através de transformação inversa da CDF:
)(1ii qFx
![Page 69: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/69.jpg)
Inversa das CDFs
Distribuição CDF F(x) InversaExponencial axe /1 )ln(ua
Valor Extremo baxee/)(
1 )ln(ln uba
Geométrica xp)1(1
)1ln(
)ln(p
u
Logística bxe /)(111 m
11ln
ubm
Pareto ax 1 au /1/1Weibull baxe )/(1 bua /1)(ln
![Page 70: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/70.jpg)
Inversa da Distribuição Normal Para a distribuição normal unitária N(0,1)
utiliza-se freqüentemente a seguinte aproximação:
14,014,0 )1(91,4 iii qqx
![Page 71: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/71.jpg)
Exemplo 12.5 O erro de modelagem (diferença entre
valores medidos e valores previstos por um modelo) para 8 predições de um modelo foram os seguintes:-0,04; -0,19; 0,14; -0,09; -0,14; 0,19; 0,04 e
0,09.
![Page 72: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/72.jpg)
Exemplo 12.5
i qi=(i-0,5)/n yi xi1 0,0625 -0,19 -1,5352 0,1875 -0,14 -0,8853 0,3125 -0,09 -0,4874 0,4375 -0,04 -0,1575 0,5625 0,04 0,1576 0,6875 0,09 0,4877 0,8125 0,14 0,8858 0,9375 0,19 1,535
![Page 73: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/73.jpg)
Exemplo 12.5
Os errosaparentamserdistribuídosnormalmente.
![Page 74: Revisão de Probabilidade e Estatística](https://reader030.vdocuments.site/reader030/viewer/2022033019/568161f7550346895dd224da/html5/thumbnails/74.jpg)
Desvios da Distribuição Normal
Quantis da Normal
Quantis Observados
Normal
Quantis da Normal
Quantis Observados
Caudas longas
Quantis da Normal
Quantis Observados
Caudas curtas
Quantis da Normal
Quantis Observados
Assimétrica