Dados discretosExemplo 1
Vamos supor que um professor só lança notas inteiras para a disciplina de matemática na escalade 0 a 10. O professor apresentou uma lista de todos os alunos e notas para todas as turmas emque leciona num determinado colégio. Construa o histograma com as frequencias de notas atribuídas por este professor.
Aluno Nota Valor Máximo 7.00 A1 5.00 Valor Mínimo 2.00 A2 4.00 A3 4.00 Bloco FrequenciaA4 5.00 2 1A5 5.00 3 9 aqui utilizamos uma funçao A6 4.00 4 29 estatística de contagem.A7 4.00 5 45 e ao lado poderíamos traçarA8 7.00 6 30 um gráfico de barras.A9 4.00 7 6
A10 5.00 120A11 4.00 A12 6.00 A13 5.00 A14 5.00 A15 6.00 A16 5.00 A17 4.00 A18 5.00 A19 5.00 A20 3.00 De uma forma mais fácil e automática podemos utilizar a ferramenta HISTOGRAMA.A21 5.00 A22 6.00 Acesso: Menu Ferramentas/Análise de Dados/HistogramaA23 2.00 A24 6.00 A25 6.00 Bloco FreqüênciaA26 7.00 2 1A27 6.00 3 9A28 4.00 4 29A29 5.00 5 45A30 4.00 6 30A31 5.00 7 6A32 4.00 Mais 0A33 6.00 A34 6.00 A35 5.00 A36 7.00 A37 4.00 A38 6.00 A39 4.00 A40 3.00
2 3 4 5 6 70
204060
Histograma
Freqüência
2
Freq
üênc
ia
2 3 4 5 6 7 Mais0
20
40
60
Histograma
Freqüência
Bloco
Freq
üênc
ia
A41 5.00 A42 5.00 A43 4.00 A44 5.00 A45 5.00 Veja na figura abaixo como é o cadastramento dos parâmetros para a geraçaoA46 6.00 do HISTOGRAMA:A47 6.00 A48 6.00 A49 6.00 A50 5.00 A51 5.00 A52 7.00 A53 5.00 A54 5.00 A55 7.00 A56 5.00 A57 5.00 A58 5.00 A59 6.00 A60 6.00 A61 6.00 A62 5.00 A63 6.00 A64 5.00 A65 3.00 A66 6.00 A67 4.00 A68 4.00 A69 5.00 A70 3.00 A71 4.00 Ou ainda, podemos utilizar a função FREQUENCIA:A72 3.00 A73 5.00 Bloco FrequenciaA74 5.00 2 1A75 6.00 3 9A76 7.00 4 29A77 3.00 5 45A78 4.00 6 30A79 6.00 7 6A80 6.00 Total 120A81 4.00 A82 5.00 A83 6.00 Regra para utilizar a função FREQUENCIA:A84 6.00 A85 6.00 1) Primeiro escreva o vetor coluna com o bloco de frequências. A86 4.00 2) Depois marque uma coluna do lado, de mesmo tamanho, ondeA87 5.00 a função irá gerar as frequências automaticamente.A88 5.00 3) Na primeira célula da coluna onde irá aparecer o vetor de frequênciasA89 5.00 coloca-se a fórmula da frequência. Depois de preenchida a fórmulaA90 4.00 aperte as teclas CTRL + SHIFT + ENTER simultâneamente.A91 5.00
2 3 4 5 6 7 Mais0
20
40
60
Histograma
Freqüência
Bloco
Freq
üênc
ia
A92 4.00 A93 5.00 A94 4.00 A95 6.00 A96 5.00 A97 4.00 A98 4.00 A99 5.00
A100 3.00 A101 4.00 A102 4.00 A103 5.00 A104 4.00 A105 4.00 A106 5.00 A107 5.00 A108 5.00 A109 6.00 A110 6.00 A111 5.00 A112 3.00 A113 6.00 A114 5.00 A115 5.00 A116 3.00 A117 4.00 A118 5.00 A119 6.00 A120 6.00
Dados ContínuosConsidere que se tenha uma coleção de retornos mensais de um determinado fundo de investimento.Naturalmente que os retornos são valores reais (números do conjunto dos Reais) e podem não
admitir sequer frequencia conforme o exemplo anterior do caso discreto.
Retornos1.64% 1.44% 1.75% 1.96% 1.94% 2.05% 1.26% 1.65%1.56% 1.36% 1.33% 1.50% 1.55% 1.28% 1.59% 1.62%1.63% 1.63% 1.97% 1.68% 1.66% 1.60% 2.09% 1.87%2.03% 1.38% 1.81% 1.88% 2.08% 1.68% 1.60% 1.84%1.41% 1.53% 1.40% 1.63% 1.69% 1.71% 1.64% 2.14%1.18% 1.99% 1.44% 1.57% 1.85% 1.79% 1.87% 1.82%1.84% 1.76% 1.51% 1.65% 1.73% 1.81% 1.73% 1.52%1.71% 1.87% 1.87% 1.57% 1.52% 1.92% 1.46% 1.39%2.14% 1.99% 1.96% 1.72% 1.70% 1.79% 1.69% 1.49%1.79% 1.82% 1.74% 1.49% 1.95% 1.64% 1.53% 1.54%
Vamos dividir os números em classes. Não tem um jeito único e ótimo de fazer isso. Temos uma heurística queadotaremos neste caso:
a) resolvendo de forma artesanal
número de classes = 10.00 (raiz do total de elementos, limitado a 15).
menor valor 1.18% Determinaçao das Classesmaior valor 2.18% Limite Limite
Inferior SuperiorIntervalo de 1.18% 1.29%Variaçao 1.00% 1.29% 1.40%
1.40% 1.50%amplitude de 1.50% 1.60%classe 0.10% adotado 0.11% 1.60% 1.70%
1.70% 1.80%1.80% 1.90%1.90% 2.00%2.00% 2.10%2.10% 2.20%
Poderíamos representar o histograma utilizando no eixo horizontalo limite inferior, o superior ou mesmo o ponto médio.Vamos utilizar o limite superior
Retorno Frequencia1.23% 3.00 1.35% 7.00 1.45% 10.00 1.55% 15.00 1.65% 19.00 1.75% 13.00
1.85% 16.00 1.95% 9.00 2.05% 5.00 2.15% 3.00
b) resolvendo com a ferramenta HISTOGRAMA
Bloco Freqüência Veja a imagem da FERRAMENTA HISTOGRAMA abaixo:1.23% 11.35% 31.45% 101.55% 141.65% 201.75% 141.85% 151.95% 102.05% 72.15% 5
Mais 1Total 100
Ou ainda, podemos utilizar a função FREQUÊNCIA:
Retorno Frequencia1.23% 11.35% 31.45% 101.55% 141.65% 201.75% 141.85% 151.95% 102.05% 7
aqui utilizamos uma funçao estatística de contagem.e ao lado poderíamos traçarum gráfico de barras.
De uma forma mais fácil e automática podemos utilizar a ferramenta HISTOGRAMA.
1 2 3 4 5 60
10
20
30
40
50
frequencia
frequencia
notas
2 3 4 5 6 70
204060
Histograma
Freqüência
2
Freq
üênc
ia
2 3 4 5 6 7 Mais0
20
40
60
Histograma
Freqüência
Bloco
Freq
üênc
ia
Veja na figura abaixo como é o cadastramento dos parâmetros para a geraçao
3) Na primeira célula da coluna onde irá aparecer o vetor de frequências coloca-se a fórmula da frequência. Depois de preenchida a fórmula
2 3 4 5 6 7 Mais0
20
40
60
Histograma
Freqüência
Bloco
Freq
üênc
ia
1.92% 1.48%1.73% 1.63%2.18% 1.57%1.62% 1.85%1.35% 1.55%1.43% 1.48%2.08% 1.80%1.84% 1.83%1.35% 1.87%1.61% 1.61%
Vamos dividir os números em classes. Não tem um jeito único e ótimo de fazer isso. Temos uma heurística que
Frequencia Acumulada Frequencia absoluta 3.00 3.00 10.00 7.00 20.00 10.00 35.00 15.00 54.00 19.00 67.00 13.00 83.00 16.00 92.00 9.00 97.00 5.00 100.00 3.00
Total 100.00
Poderíamos representar o histograma utilizando no eixo horizontalo limite inferior, o superior ou mesmo o ponto médio.
1.23%
1.35%
1.45%
1.55%
1.65%
1.75%
1.85%
1.95%
2.05%
2.15%
-
5.00
10.00
15.00
20.00
Frequencia de Retornos
retornos
Veja a imagem da FERRAMENTA HISTOGRAMA abaixo:
1.23%
1.35%
1.45%
1.55%
1.65%
1.75%
1.85%
1.95%
2.05%
2.15%
-
5.00
10.00
15.00
20.00
Frequencia de Retornos
retornos
1 2 3 4 5 60
10
20
30
40
50
frequencia
frequencia
notas
2 3 4 5 6 7 Mais0
20
40
60
Histograma
Freqüência
Bloco
Freq
üênc
ia
1.23%
1.35%
1.45%
1.55%
1.65%
1.75%
1.85%
1.95%
2.05%
2.15%
-
5.00
10.00
15.00
20.00
Frequencia de Retornos
retornos
1.23%
1.35%
1.45%
1.55%
1.65%
1.75%
1.85%
1.95%
2.05%
2.15%
-
5.00
10.00
15.00
20.00
Frequencia de Retornos
retornos
Medidas de Posiçao e Ordenamento
Percentil Depois de ordenar uma série de dados, associamos os números naturais de 1 a N a todos eles. Associamos 0% à primeira posiçao e 100% à última. Em seguidainterpolamos para encontrar o percentil p correspondente ao valor x da série.
onde n é a ordem, p é o percentil e x é o valor correspondente ao percentil
Exemplo: Vamos considerar um jogo de roleta num parque de diversões. Dividiu-se um círculoem 12 setores conforme abaixo:
Setor Time Bônus Custo da jogada Lucro1 cruzeiro 5.00 3.00 2.00 2 atlético 4.00 3.00 1.00 3 flamengo 3.50 3.00 0.50 4 botafogo 3.00 3.00 - 5 palmeiras 2.50 3.00 (0.50)6 são paulo 2.00 3.00 (1.00)7 Brasiliense 1.50 3.00 (1.50)8 Gama 1.00 3.00 (2.00)9 Bahia 0.50 3.00 (2.50)
10 Santa Cruz - 3.00 (3.00)11 Sport Recife - 3.00 (3.00)12 Goiás - 3.00 (3.00)
O custo de cada jogada é de R$ 3.
Vamos calcular o nonagésimo-quinto percentil: n x
p (10-1)/100% = (x-1)/95% ===> Como o nono valor corresponde a 33,33% temos que o correspondente a
9,55 será
ou pode ser calculado de manieira mais fácil pela fórmula:
n−1100%−0%
=x−1p−0
Vamos também calcular o quinto percentil: quinto percentil --->
Poderíamos interpretar da seguinte maneira: O pior retorno com 95% de confiança (5% de chance de estarmos errados) é igual a -92,50%O melhor retorno com 95% de confiança é igual a 51,67%.
E, antes de introduzirmos o assunto, vamos falar na média como sendo o RETORNO ESPERADO.
Cálculo do Retorno médio
Retornos Ordenados66.67%33.33%16.67%
0.00%-16.67%-33.33%-50.00%-66.67%-83.33%
-100.00%
Note que utilizamos uma fórmula para o cálculo da média de dados agrupados conforme abaixo:
a fórmula acima é para dados não-agrupados (não é o caso do exemplo acima)
onde f é frequencia relativa e p a probabilidade de x.esta é a fórmula adequada para calcularmos a média do problema acima.
Média É uma medida de posiçao ou tendencia central calculável por uma fórmula fácil.É muito sujeita a valores extremos (falha no seu propósito de, por um único número, bem representar toda a série de dados).
Média= X−
=∑i=1
n
x i
n
Média=∑i=1
n
xi. f i=∑i=1
n
x i. p( x i)
Mediana É também uma medida de tendência central. Divide a distribuiçao de frequenciasrelativas (ou probabilidades) em duas partes iguais. Corresponde ao quinquagésimopercentil.
Vamos logo a um exemplo:
Obervando os últimos 60 meses de retorno de uma ação compomos a tabela abaixo: Retorno Frequencia Freq. Rel coluna auxiliar0.50% 29 48.33% 0.00 0.55% 15 25.00% 0.00 0.60% 9 15.00% 0.00 0.65% 6 10.00% 0.00
70.00% 1 1.67% 0.01 60 100.00%
Média 1.70%Mediana ?
Como calcular a mediana ?
Para dados não-agrupados: ordenamos os dados. Se o número de elementos (n) for ímpar pegamos o elemento central,se for para pegamos a média dos dois elementos centrais.
No caso acima podemos "desagrupar" os dados e ordená-los. Teríamos 60 elementos. A mediana seria a média dos elementosda trigésima e da trigésima-primeira posições.
Mediana 0.55% Note que a mediana é bem menor do que a média. Ele foi menos sensibilizadapelo valor extremo de 70%
utilizando fórmula do EXCEL para calcular a MEDIANA de dados não-agrupados.
ordem Série1 0.50%2 0.50%3 0.50%4 0.50%5 0.50%6 0.50%7 0.50%8 0.50%9 0.50%
10 0.50%11 0.50%12 0.50%13 0.50%14 0.50%15 0.50%16 0.50%17 0.50%
18 0.50%19 0.50%20 0.50%21 0.50%22 0.50%23 0.50%24 0.50%25 0.50%26 0.50%27 0.50%28 0.50%29 0.50%30 0.55% Mediana = 0.55%31 0.55%32 0.55% ou33 0.55%34 0.55% Mediana = 0.55%35 0.55%36 0.55%37 0.55%38 0.55%39 0.55%40 0.55%41 0.55%42 0.55%43 0.55%44 0.55%45 0.60%46 0.60%47 0.60%48 0.60%49 0.60%50 0.60%51 0.60%52 0.60%53 0.60%54 0.65%55 0.65%56 0.65%57 0.65%58 0.65%59 0.65%60 70.00%
Curiosidade A distribuição de retornos de ações é mais simétrrica do que a distribuição de retornosde crédito. Diz-se que a distribuição de retorno de crédito tem cauda gorda.
Exemplo: imaginem operaçoes de R$ 1.000,00 cada, à taxa de 40% ao ano,com vencimento único ao final do prazo.
Custo deQtde Taxa de Juros oportunid Custo fixo índice de perda
800 40.00% 12.50% 40.00 0.00%120 40.00% 12.50% 40.00 3.00%
50 40.00% 12.50% 40.00 5.00%20 40.00% 12.50% 40.00 30.00%10 40.00% 12.50% 40.00 100.00%
total 1000
Retorno Probabilidade20.89% 80.00%17.16% 12.00%14.67% 5.00%-16.44% 2.00%
-103.56% 1.00% 100.00%
Retorno Esperado
Pior Retorno com 95% de confiança =
Cálculo exato
20.89%17.16%14.67%-16.44%-103.56%0.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
Probabilidade
Probabilidade
retorno
Exemplo de Retorno com ações
-2.00% 1.00%-1.69% 3.00%-0.63% 8.00%-0.37% 12.00%0.49% 17.00%2.11% 19.00%2.34% 17.00%3.66% 12.00%4.19% 8.00%4.37% 3.00%7.44% 1.00%
100.00%
MODA para dados discretos é o valor mais frequente. Para dados contínuos falamos em classe modal como sendoa classe mais frequente.
Imaginando que os dados acima, embora contínuos, foram colocados numa forma contável,temos que a moda é a rentabilidade de 2.11%
Curra Normal Já adiantando o capitulo de distribuições de probabilidades, queremos mostrar aqui o "jeitão" da distribuição de frequencias (ou probabilidades)de um fenômeno que segue ou que pode ser aproximado pela famosa distribuição normal ou de gauss. Esta é uma distribuição legada sobretudo pelos físicos e astrônomos. Muitos dos fenômenos da natureza podem ser aproximados por uma curva normal. Uma curva normal,como se verá mais à frente, fica perfeitamente definida por dois parâmetros: média e desvio-padrão.
Vamos tomar as alturas dos alunos de uma Universidade e traçar um histograma ou distribuição de frequencias desta população de alturas
Alturas
1.62 1.52 1.67 1.78 1.77 1.58 1.48 1.47 1.55 1.57 1.62 1.61 1.78 1.64 1.63 1.82 1.49 1.70 1.74 1.84 1.51 1.57 1.50 1.61 1.65 1.39 1.79 1.52 1.58 1.73 1.72 1.68 1.56 1.63 1.66 1.66 1.73 1.74 1.59 1.56 1.87 1.79 1.78 1.66 1.65
-2.00
%-1.
69%
-0.63
%-0.
37%
0.49%
2.11%
2.34%
3.66%
4.19%
4.37%
7.44%
0.00%2.00%4.00%6.00%8.00%
10.00%12.00%14.00%16.00%18.00%20.00%
Probabilidade
Probabilidade
retorno
1.69 1.71 1.67 1.55 1.77 1.60 1.73 1.70 1.59 1.78 1.60 1.73 1.73 1.70 1.72 1.75 1.66 1.76 1.64 1.57 1.61 1.51 1.85 1.59 1.66 1.67 1.70 1.63 1.53 1.78 1.69 1.59 1.72 1.70 1.76 1.79 1.82 1.67 1.66 1.84 1.69 1.80 1.64 1.55 1.50 1.68 1.80 1.66 1.54 1.51 1.63 1.62 1.63 1.61 1.57 1.67 1.67 1.65 1.53 1.67 1.66 1.74 1.83 1.52 1.53 1.67 1.69 1.55 1.56 1.70 1.75 1.81 1.58 1.63 1.66 1.59 1.55 1.77 1.74 1.48 1.70 1.74 1.64 1.64 1.67 1.71 1.55 1.74 1.79 1.58 1.43 1.70 1.70 1.77 1.55 1.55 1.80 1.53 1.61 1.52 1.64 1.55 1.59 1.73 1.74 1.59 1.74 1.57 1.64 1.63 1.51 1.43 1.71 1.62 1.69 1.64 1.66 1.82 1.60 1.57 1.81 1.58 1.66 1.57 1.72 1.65 1.75 1.55 1.73 1.77 1.75 1.66 1.57 1.71 1.70 1.61 1.67 1.83 1.41 1.65 1.73 1.69 1.72 1.70 1.64 1.48 1.69 1.67 1.72 1.63 1.63 1.58 1.72 1.88 1.78 1.62 1.71 1.52 1.70 1.75 1.67 1.61 1.70 1.81 1.63 1.57 1.75 1.67 1.69 1.91 1.76 1.52 1.61 1.51 1.54 1.79 1.65 1.63 1.65 1.46 1.54 1.77 1.90 1.74 1.64 1.62 1.68 1.73 1.67 1.49 1.57 1.68 1.59 1.86 1.63 1.66 1.68 1.74 1.44 1.58 1.73 1.52 1.60 1.62 1.56 1.72 1.57 1.68 1.52 1.88 1.61 1.68 1.58 1.71 1.63 1.74 1.53 1.52 1.63 1.63 1.57 1.58 1.62 1.70 1.48 1.80 1.67 1.78 1.76 1.69 1.56 1.44 1.64 1.75 1.74 1.49 1.80 1.81 1.58 1.78 1.77 1.49 1.56 1.95 1.61 1.74 1.74 1.62 1.69 1.83 1.81 1.94 1.47 1.66 1.82
1.57 1.55 1.53 1.40 1.53 1.46 1.60 1.61 1.75 1.59 1.68 1.63 1.69 1.60 1.73 1.66 1.75 1.56 1.66 1.63 1.81 1.85 1.74 1.85 1.64 1.65 1.79 1.68 1.66 1.57 1.77 1.76 1.74 1.71 1.73 1.84 1.65 1.80 1.58 1.82 1.71 1.55 1.50 1.48 1.61 1.76 1.72 1.64 1.63 1.56 1.73 1.80 1.68 1.58 1.63 1.53 1.67 1.73 1.48 1.61 1.55 1.56 1.61 1.84 1.47 1.68 1.55 1.69 1.72 1.56 1.64 1.70 1.68 1.88 1.56 1.61 1.59 1.61 1.73 1.64 1.63 1.49 1.57 1.59 1.57 1.64 1.74 1.63 1.90 1.41 1.62 1.52 1.61 1.57 1.77 1.66 1.65 1.64 1.54 1.66 1.72 1.70 1.55 1.76 1.52 1.74 1.68 1.50 1.48 1.74 1.53 1.57 1.69 1.55 1.84 1.78 1.49 1.48 1.60 1.63 1.52 1.78 1.67 1.53 1.85 1.58 1.76 1.62 1.78 1.56 1.83 1.89 1.61 1.66 1.54 1.59 1.55 1.61 1.74 1.49 1.82 1.51 1.72 1.72 1.74 1.60 1.57 1.67 1.87 1.84 1.72 1.71 1.71 1.67 1.44 1.59 1.71 1.56 1.64 1.87 1.58 1.63 1.53 1.57 1.86 1.59 1.57 1.82 1.52 1.66 1.79 1.57 1.62 1.81 1.76 1.72 1.56 1.64 1.52 1.52 1.60 1.79 1.66 1.73 1.51 1.51 1.65 1.45 1.46 1.82 1.66 1.62 1.48 1.75 1.65 1.59 1.43 1.67 1.55 1.63
Bloco Freqüência1.373055 11.430907 71.488759 511.546611 911.604463 1801.662315 2131.720166 190
1.373
0552
2533
134
1.430
9070
9191
747
1.488
7589
5850
36
1.546
6108
2508
974
1.604
4626
9167
587
1.662
3145
5826
201
1.720
1664
2484
814
1.778
0182
9143
427
1.835
8701
5802
041
1.893
7220
2460
654
Mais0
50
100
150
200
250
Histograma
Freqüência
Bloco
Freq
üênc
ia
1.778018 1531.83587 79
1.893722 28Mais 7
Geramos o gráfico acima pela ferramenta HISTOGRAMA (ferramentas/análise de dados/histograma) sem definir as classes. O excel definiu automaticamente
Vamos calcular algumas estatísticas da populaçÃO
MÉDIA 1.65 MODA 1.66 se utilizar a função MODO pode gerar erro pois a distribuição é contínua. Aqui observamos a classe mais frequenteMEDIANA 1.65
Note que a Média e a Mediana são praticamente idênticas sinalizando pela simetria da distribuição de frequências.
1.373
0552
2533
134
1.430
9070
9191
747
1.488
7589
5850
36
1.546
6108
2508
974
1.604
4626
9167
587
1.662
3145
5826
201
1.720
1664
2484
814
1.778
0182
9143
427
1.835
8701
5802
041
1.893
7220
2460
654
Mais0
50
100
150
200
250
Histograma
Freqüência
Bloco
Freq
üênc
ia
Depois de ordenar uma série de dados, associamos os números naturais de 1 a N
onde n é a ordem, p é o percentil e x é o valor correspondente ao percentil
Vamos considerar um jogo de roleta num parque de diversões. Dividiu-se um círculo
Retorno Retornos Ordenados Probab Prob acum66.67% 66.67% 10.00% 100.00%33.33% 33.33% 10.00% 90.00%16.67% 16.67% 10.00% 80.00%
0.00% 0.00% 10.00% 70.00%-16.67% -16.67% 10.00% 60.00%-33.33% -33.33% 10.00% 50.00%-50.00% -50.00% 10.00% 40.00%-66.67% -66.67% 10.00% 30.00%-83.33% -83.33% 10.00% 20.00%
-100.00% -100.00% 10.00% 10.00%-100.00% -100.00%
10?
95%
(10-1)/100% = (x-1)/95% ===> x = 9.55
Como o nono valor corresponde a 33,33% temos que o correspondente a51.67% 51.67%
ou pode ser calculado de manieira mais fácil pela fórmula: PERCENTIL(J24:J33;95%)
n−1100%−0%
=x−1p−0
-92.50%
O pior retorno com 95% de confiança (5% de chance de estarmos errados) é igual a -92,50%O melhor retorno com 95% de confiança é igual a 51,67%.
E, antes de introduzirmos o assunto, vamos falar na média como sendo o RETORNO ESPERADO.
Cálculo do Retorno médio
Probab Coluna auxiliar10.00% 6.67% Retorno Esperado -23.33%10.00% 3.33%10.00% 1.67% Você gostaria de entrar num investimento cujo 10.00% 0.00% retorno esperado é negativo e o pior retorno possível,10.00% -1.67% com 95% de confiança, é igual a -92,50%?10.00% -3.33%10.00% -5.00% Não parece ser um bom negócio.10.00% -6.67%10.00% -8.33%10.00% -10.00%
Média -23.33%
Note que utilizamos uma fórmula para o cálculo da média de dados agrupados conforme abaixo:
a fórmula acima é para dados não-agrupados (não é o caso do exemplo acima)
onde f é frequencia relativa e p a probabilidade de x.esta é a fórmula adequada para calcularmos a média do problema acima.
Média= X−
=∑i=1
n
x i
n
Média=∑i=1
n
xi. f i=∑i=1
n
x i. p( x i)
relativas (ou probabilidades) em duas partes iguais. Corresponde ao quinquagésimo
Obervando os últimos 60 meses de retorno de uma ação compomos a tabela abaixo:
Para dados não-agrupados: ordenamos os dados. Se o número de elementos (n) for ímpar pegamos o elemento central,se for para pegamos a média dos dois elementos centrais.
No caso acima podemos "desagrupar" os dados e ordená-los. Teríamos 60 elementos. A mediana seria a média dos elementos
Note que a mediana é bem menor do que a média. Ele foi menos sensibilizada
Fórmula MEDdo excel
A distribuição de retornos de ações é mais simétrrica do que a distribuição de retornos
MargemFinanceira por oper. Retorno 235.00 20.89% 193.00 17.16% 165.00 14.67% (185.00) -16.44% (1,165.00) -103.56%
auxiliar Prob. Acumulada16.71% 80.00%
2.06% 92.00%0.73% 97.00%
-0.33% 99.00%-1.04% 100.00%
18.14%
Pior Retorno com 95% de confiança = entre 14,67% e 17,16%
= 15.66%mais uma fórmula do excel: PREVISAOUtilizada para realizar uma interpolaçao linear entre dois pares ordenados.
20.89%17.16%14.67%-16.44%-103.56%0.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
Probabilidade
Probabilidade
retorno
para dados discretos é o valor mais frequente. Para dados contínuos falamos em classe modal como sendo
Imaginando que os dados acima, embora contínuos, foram colocados numa forma contável,
Já adiantando o capitulo de distribuições de probabilidades, queremos mostrar aqui o "jeitão" da distribuição de frequencias (ou probabilidades)de um fenômeno que segue ou que pode ser aproximado pela famosa distribuição normal ou de gauss. Esta é uma distribuição legada sobretudo pelos físicos e astrônomos. Muitos dos fenômenos da natureza podem ser aproximados por uma curva normal. Uma curva normal,como se verá mais à frente, fica perfeitamente definida por dois parâmetros: média e desvio-padrão.
Vamos tomar as alturas dos alunos de uma Universidade e traçar um histograma ou distribuição de frequencias desta população de alturas
1.82 1.43 1.63 1.76 1.54 1.44 1.59 1.61 1.66 1.61 1.60 1.85 1.74 1.89 1.58 1.64 1.60 1.72 1.61 1.73 1.65 1.62 1.87 1.48 1.58 1.70 1.74 1.71 1.51 1.54 1.71 1.66 1.56 1.84 1.70 1.76 1.53 1.49 1.72 1.71 1.70 1.65 1.54 1.47 1.73
-2.00
%-1.
69%
-0.63
%-0.
37%
0.49%
2.11%
2.34%
3.66%
4.19%
4.37%
7.44%
0.00%2.00%4.00%6.00%8.00%
10.00%12.00%14.00%16.00%18.00%20.00%
Probabilidade
Probabilidade
retorno
1.62 1.57 1.57 1.61 1.60 1.47 1.71 1.64 1.65 1.58 1.81 1.68 1.71 1.84 1.62 1.76 1.59 1.70 1.70 1.62 1.63 1.93 1.78 1.74 1.78 1.62 1.52 1.73 1.73 1.69 1.37 1.70 1.80 1.48 1.65 1.65 1.58 1.74 1.65 1.75 1.39 1.66 1.68 1.65 1.67 1.67 1.75 1.50 1.59 1.70 1.71 1.66 1.78 1.68 1.66 1.66 1.73 1.58 1.71 1.67 1.71 1.77 1.56 1.44 1.56 1.66 1.60 1.66 1.56 1.56 1.83 1.71 1.82 1.67 1.81 1.78 1.63 1.54 1.46 1.57 1.61 1.74 1.60 1.88 1.72 1.62 1.52 1.79 1.75 1.67 1.77 1.59 1.58 1.48 1.79 1.81 1.65 1.68 1.75 1.84 1.70 1.50 1.51 1.64 1.59 1.80 1.52 1.56 1.63 1.54 1.45 1.77 1.46 1.60 1.55 1.58 1.71 1.78 1.51 1.75 1.67 1.65 1.55 1.62 1.72 1.53 1.69 1.47 1.66 1.75 1.72 1.56 1.71 1.81 1.67 1.64 1.75 1.77 1.81 1.47 1.82 1.70 1.65 1.65 1.64 1.73 1.78 1.84 1.52 1.71 1.67 1.60 1.63 1.54 1.66 1.56 1.69 1.70 1.75 1.63 1.55 1.56 1.72 1.81 1.59 1.59 1.57 1.77 1.62 1.51 1.71 1.66 1.48 1.85 1.67 1.58 1.79 1.67 1.61 1.59 1.56 1.64 1.62 1.61 1.74 1.65 1.72 1.63 1.49 1.49 1.74 1.77 1.60 1.47 1.56 1.67 1.66 1.64 1.63 1.80 1.63 1.66 1.55 1.73 1.63 1.73 1.54 1.80 1.62 1.51 1.70 1.46 1.54 1.80 1.67 1.75 1.75 1.62 1.70 1.75 1.77 1.84 1.65 1.52 1.65 1.57 1.61 1.78 1.70 1.72 1.60 1.58 1.68 1.54 1.70 1.72 1.74 1.54 1.78 1.61 1.61 1.72 1.62 1.48 1.65 1.69 1.66 1.60 1.68 1.65 1.75 1.67 1.77 1.75 1.64
1.72 1.73 1.77 1.61 1.52 1.75 1.68 1.74 1.76 1.71 1.64 1.58 1.57 1.83 1.69 1.70 1.83 1.61 1.80 1.71 1.65 1.80 1.58 1.67 1.54 1.46 1.59 1.49 1.76 1.65 1.68 1.64 1.62 1.58 1.64 1.52 1.69 1.70 1.54 1.90 1.49 1.52 1.47 1.58 1.62 1.78 1.75 1.59 1.82 1.55 1.72 1.46 1.57 1.68 1.61 1.57 1.69 1.63 1.60 1.67 1.64 1.69 1.68 1.81 1.48 1.63 1.60 1.52 1.69 1.69 1.69 1.44 1.64 1.75 1.56 1.83 1.61 1.53 1.71 1.64 1.52 1.64 1.76 1.58 1.64 1.65 1.58 1.64 1.78 1.69 1.60 1.61 1.65 1.59 1.76 1.63 1.53 1.58 1.71 1.76 1.72 1.50 1.76 1.80 1.68 1.76 1.68 1.61 1.56 1.59 1.72 1.63 1.61 1.60 1.69 1.81 1.63 1.67 1.56 1.58 1.49 1.81 1.51 1.55 1.59 1.60 1.69 1.47 1.70 1.72 1.65 1.43 1.51 1.64 1.58 1.72 1.64 1.60 1.62 1.54 1.72 1.75 1.56 1.84 1.73 1.73 1.76 1.49 1.70 1.57 1.64 1.56 1.51 1.54 1.57 1.60 1.66 1.74 1.73 1.64 1.67 1.59 1.70 1.74 1.64 1.78 1.60 1.67 1.76 1.66 1.69 1.59 1.75 1.78 1.58 1.55 1.55 1.76 1.56 1.66 1.68 1.56 1.76 1.54 1.69 1.59 1.70 1.70 1.85 1.66 1.65 1.58 1.61 1.65 1.52 1.68 1.62 1.70 1.71 1.68
1.373
0552
2533
134
1.430
9070
9191
747
1.488
7589
5850
36
1.546
6108
2508
974
1.604
4626
9167
587
1.662
3145
5826
201
1.720
1664
2484
814
1.778
0182
9143
427
1.835
8701
5802
041
1.893
7220
2460
654
Mais0
50
100
150
200
250
Histograma
Freqüência
Bloco
Freq
üênc
ia
Geramos o gráfico acima pela ferramenta HISTOGRAMA (ferramentas/análise de dados/histograma) sem definir as classes. O excel definiu
se utilizar a função MODO pode gerar erro pois a distribuição é contínua. Aqui observamos a classe mais frequente
Note que a Média e a Mediana são praticamente idênticas sinalizando pela simetria da distribuição de frequências.
1.373
0552
2533
134
1.430
9070
9191
747
1.488
7589
5850
36
1.546
6108
2508
974
1.604
4626
9167
587
1.662
3145
5826
201
1.720
1664
2484
814
1.778
0182
9143
427
1.835
8701
5802
041
1.893
7220
2460
654
Mais0
50
100
150
200
250
Histograma
Freqüência
Bloco
Freq
üênc
ia
Variância e Desvio-PadrãoA forma mais simples de se medir disperão é a distância linear. Entretanto a existência de simetria na amostra ou populaçãopode levar a situações em que a distância linear não reflete bem a dispersão. Vamos logo a um exemplo:
Aluno Nota distancia linear distancia quadrática1 3 0.40 0.16 2 3 0.40 0.16 3 4 1.40 1.96 4 2 (0.60) 0.36 5 2 (0.60) 0.36 6 2 (0.60) 0.36 7 2 (0.60) 0.36 8 3 0.40 0.16 9 3 0.40 0.16
10 4 1.40 1.96 11 4 1.40 1.96 12 4 1.40 1.96 13 1 (1.60) 2.56 14 1 (1.60) 2.56 15 1 (1.60) 2.56 16 1 (1.60) 2.56 17 1 (1.60) 2.56 18 1 (1.60) 2.56 19 2 (0.60) 0.36 20 8 5.40 29.16
média 2.6 Soma Dist. Linear -
Soma dist. Quadraticas 54.80
E para que serve isso. Vamos a um exemplo pois vale muito mais do que muita teoria.
Vamos supor que temos duas ações 1 e 2 cujos retornos têm distribuição normal de probabilidades (as frequencias dos retornos ou classes deretornos formam um desenho muito parecido com o sino de gauss) com a mesma média 2,00% e com desvio-padrão de 1,00% e 5,00%, respectivamente. Vamos simular 100 retornos para cada uma delas com o objetivo de se verificar o pior retorno com 95% de confiança
através da utilizaçao do percentil e do desvio-padrão.
mês Retorno Açao 1 Retorno Açao 21 1.54% 11.50%2 2.20% 9.66%3 2.64% 1.66%4 2.96% 2.15%5 1.20% -4.14%6 0.46% 4.81%7 0.56% 3.27%8 4.42% 4.55%9 1.94% -4.46%
10 0.37% 1.35%11 3.07% -0.01%12 2.09% 1.27%13 1.45% 1.18%14 2.41% -2.63%15 1.60% 2.36%16 1.78% -9.64%17 2.37% 3.91%18 2.25% 8.66%19 2.64% 6.89%20 3.91% 5.01%21 2.02% -2.95%22 3.30% 4.18%23 2.46% 6.47%24 1.87% 2.80%25 2.39% 4.40%26 1.32% 9.51%27 1.57% 4.63%28 0.91% -0.34%29 0.26% 6.30%30 3.39% 1.97%31 1.10% 9.65%32 0.93% 4.38%33 3.39% 8.96%34 1.69% -0.50%35 1.58% 6.26%36 2.78% 10.79%37 1.89% -3.05%38 1.97% -0.81%39 2.12% -5.62%40 2.28% 5.54%41 0.54% 1.81%42 1.59% 4.37%43 2.87% -6.44%44 0.31% 0.66%45 1.61% 3.33%46 2.53% 11.88%47 2.29% -7.01%48 2.42% -0.70%
49 2.21% 6.84%50 0.73% 7.88%51 2.86% 1.03%52 0.52% -1.82%53 3.81% 3.30%54 2.12% 1.38%55 0.41% 1.76%56 1.84% 2.57%57 1.69% 5.36%58 3.03% 7.17%59 -1.74% -2.30%60 2.35% 0.38%61 2.94% -1.51%62 2.17% 6.14%63 3.76% -6.11%64 -0.15% 6.61%65 1.95% 1.97%66 2.30% -1.83%67 1.52% -2.45%68 2.80% -2.19%69 1.63% 10.92%70 1.91% -2.63%71 1.95% 6.08%72 0.40% 0.62%73 2.30% -4.68%74 3.55% 2.09%75 2.09% -1.92%76 1.87% -2.07%77 2.00% 0.59%78 2.61% -0.06%79 1.88% 3.55%80 1.76% -8.76%81 3.09% 4.44%82 1.83% 8.68%83 3.64% 3.87%84 0.39% 0.63%85 1.63% -0.92%86 1.40% 5.28%87 -0.49% 10.15%88 2.65% -4.14%89 1.30% -4.23%90 1.87% 5.64%91 3.68% -5.98%92 1.06% -1.85%93 2.84% 3.47%94 0.37% -0.44%95 1.23% 0.88%96 1.10% 2.36%97 1.70% 1.72%98 2.50% 3.55%99 2.51% -6.52%
100 0.90% -1.78%média 1.92% 1.91%desvio-padrão 1.04% 4.77%Percentil 95 3.64% 9.69%Percentil 5 0.37% -6.13%
Dados Agrupados Assim como tínhamos fórmulas específicas para calcular a média para os dados agrupados (tabelados na forma valor ou classe x frequencia ou probabilidade)temos fórmulas específicas para calcularmos a variância e o desvio-padrão destes dados.
Vamos a um exemplo:
Perdas do Crédito Probabilidade coluna auxiliar 10.00% 60.00% 0.00%
20.00% 20.00% 4.00%30.00% 9.00% 2.70%50.00% 6.00% 3.00%70.00% 3.00% 2.10%
100.00% 2.00% 2.00%100.00%
Perda Esperada (média) 13.80%Soma auxiliar 2VariânciaDesvio-padrão
Já que demos um exemplo com o crédito vamos continuar (porque todos somos bancários) e calcular uma métrica famosa,criada em meados da década de 90, sob o patrocínio do Banco JP Morgan. O VAR - Valor em Risco (ou VALUE AT RISK).
Suponha que tenhamos emprestado um montante total de 100 milhoes de reais, com vencimento único no final do prazode um ano. A taxa ao cliente foi de 40,00% ao ano e o custo de oportunidade é de 12,5% ao ano. Calcule o VALUE AT RISK (VAR) desta carteira de crédito.
Montante Nominal 140,000,000.00
Perda Esperada 19,320,000.00 Montante Líquido Esperado 120,680,000.00 Valor da Captação 112,500,000.00 Margem Esperada 8,180,000.00 Spread Esperado -7.27%Pior Perda com 95% conf. 70,000,000.00 VAR - VALUE AT RISK 50,680,000.00
RAROC 16.14%
Medida de Dispersão Uma medida importante e muito utiizada para mensurar a dispersão relativa é o coeficiente de variaçãoRelativa
Note que colocamos uma fórmula para o caso de população e uma para o caso de amostra.Aliás, utilizaremos essa taxionomia daqui para frente. Sigma é a letra grega utilizada paraindicar o desvio-padrão de uma população. S para designar o desvio-padrão de uma amotra.A letra grega "Mi" para a média de uma populaçao e a letra X com um traço em cima paradesignar a média da amostra.
Note que o RAROC definido na literatura de finanças é uma métrica de dispersão relativa também.
CV POP =σ XμX
CV amost = ¿ ¿S X ¿
¿X−
A forma mais simples de se medir disperão é a distância linear. Entretanto a existência de simetria na amostra ou populaçãopode levar a situações em que a distância linear não reflete bem a dispersão. Vamos logo a um exemplo:
Não mediu bem a dispersão linear, apresentando resultado zero. Aliás, estaé uma propriedade da média. A soma das distancias lineares de todos oselementos (da amostra ou da população) em relação à média vale zero.A média é uma espécie de centro de gravidade.
Para PopulaçãoVariância 2.74 ou utilizando fórmulas do EXCEL:
desvio-padrão 1.66
se as informações acima fossem relativas a uma amostra e não a uma população teríamos que retirar um grau de liberdade do cálculo. OU seja,utilizaráimos (n-1), no caso, 19, e não n no denominador.
Para Amostra
Variância 2.88 ou utilizando fórmulas do EXCEL:
desvio-padrão 1.70
Vamos supor que temos duas ações 1 e 2 cujos retornos têm distribuição normal de probabilidades (as frequencias dos retornos ou classes deretornos formam um desenho muito parecido com o sino de gauss) com a mesma média 2,00% e com desvio-padrão de 1,00% e 5,00%, respectivamente. Vamos simular 100 retornos para cada uma delas com o objetivo de se verificar o pior retorno com 95% de confiança
Note que a açao de maior desvio-padrão apresenta maior RISCO. O pior retorno possívelcom 95% de confiança é de -6,13% para a açao 2 enquanto para a açao 1 o pior retornoé de apenas 0,37%. Parece que investir na açao 1 é mamata. Na média rende 1,92% aomês e o pior retorno com 95% de confiança é de apenas 0,37%.O desvio-padrão foi a métrica adotada pela MODERNA TEORIA FINANCEIRA para mediro RISCO total e individual dos ativos. Outras métricas foram utilizadas para medir outrostipos de risco, como o risco sistemático, medido pelo coeficiente beta.
Assim como tínhamos fórmulas específicas para calcular a média para os dados agrupados (tabelados na forma valor ou classe x frequencia ou probabilidade)temos fórmulas específicas para calcularmos a variância e o desvio-padrão destes dados.
coluna auxiliar 2 Note que aqui tratamos como se fosse uma populaçao. - 0.01 Se você duvidar você poode fazer uma conferência. Desagrupe os dados 0.01 de forma que se tenha 100 perdas, começando em 0,00% e terminando 0.02 em 100,00%. 0.01 0.02 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
0.00% 0.00% 0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
0.07 0.00% 0.00% 0.00% 0.00% 0.00% 0.00% 0.04676 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
21.62% 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%20.00% 20.00% 20.00% 20.00% 20.00% 20.00%20.00% 20.00% 20.00% 20.00% 20.00% 20.00%30.00% 30.00% 30.00% 30.00% 30.00% 30.00%
mesmos valores 50.00% 50.00% 50.00% 50.00% 50.00% 50.00%70.00% 70.00% 70.00%
100.00% 100.00%
variância 0.04676 desvio-padrão 21.62%
Já que demos um exemplo com o crédito vamos continuar (porque todos somos bancários) e calcular uma métrica famosa,criada em meados da década de 90, sob o patrocínio do Banco JP Morgan. O VAR - Valor em Risco (ou VALUE AT RISK).
Suponha que tenhamos emprestado um montante total de 100 milhoes de reais, com vencimento único no final do prazode um ano. A taxa ao cliente foi de 40,00% ao ano e o custo de oportunidade é de 12,5% ao ano. Calcule o VALUE AT
observações:
1 a pior perda corresponde ao nonagésimo-quinto percentil da distribuiçao de perdas;2 O VAR correponde à diferença entre a pior perda e a perda esperada. Aqui, o entendimento
é de que a perda média está precificada na taxa de crédito. E o VAR é uma medida deperda inesperada que deverá ser absorvida, caso aconteça, com capital próprio. Diz-se,
ao ano portanto, que o VAR é uma medida de CAPITAL para fazer frente ao RISCO.3 RAROC é a sigla de RISK ADJUSTED RETURN ON CAPITAL ou, em português,
retorno ajustado ao risco. Então se formarmos a razão entre a margem esperada e o valor em risco teremos o RAROC. Tal valor deveria ser comparado com o custo
ao ano de oportunidade dos acionistas. No caso presente, se os acionistas exigem umretorno de 25,00% ao ano, esta carteira de crédito não está legal. Precisa ser melhortrabalhada, selecionar melhor os clientes ou mesmo tentar reprecificar a taxa.Se o mercado for muito competitivo não haverá muito espaço para isso. É precisoconcentrar-se na melhoria da eficiência.
Uma medida importante e muito utiizada para mensurar a dispersão relativa é o coeficiente de variação
Note que colocamos uma fórmula para o caso de população e uma para o caso de amostra.Aliás, utilizaremos essa taxionomia daqui para frente. Sigma é a letra grega utilizada paraindicar o desvio-padrão de uma população. S para designar o desvio-padrão de uma amotra.A letra grega "Mi" para a média de uma populaçao e a letra X com um traço em cima para
Note que o RAROC definido na literatura de finanças é uma métrica de dispersão relativa
CV amost = ¿ ¿S X ¿
¿ X−
0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00%0.00% 0.00% 0.00% 0.00%
20.00% 20.00% 20.00% 20.00%20.00% 20.00% 20.00% 20.00%30.00% 30.00% 30.00%
a pior perda corresponde ao nonagésimo-quinto percentil da distribuiçao de perdas;O VAR correponde à diferença entre a pior perda e a perda esperada. Aqui, o entendimentoé de que a perda média está precificada na taxa de crédito. E o VAR é uma medida deperda inesperada que deverá ser absorvida, caso aconteça, com capital próprio. Diz-se,portanto, que o VAR é uma medida de CAPITAL para fazer frente ao RISCO.RAROC é a sigla de RISK ADJUSTED RETURN ON CAPITAL ou, em português,retorno ajustado ao risco. Então se formarmos a razão entre a margem esperada e o valor em risco teremos o RAROC. Tal valor deveria ser comparado com o custode oportunidade dos acionistas. No caso presente, se os acionistas exigem umretorno de 25,00% ao ano, esta carteira de crédito não está legal. Precisa ser melhortrabalhada, selecionar melhor os clientes ou mesmo tentar reprecificar a taxa.Se o mercado for muito competitivo não haverá muito espaço para isso. É preciso
Medida de Assimetria
onde
μ é a média da populaçãoσ é o desvio-padrão da população
O retorno de uma ação tem distribuição normal de probabilidades com média igual a 1,40% ao mês e desvio-padrão de 5,90%.Veja a amostra abaixo e calcule a assimetria da mesma:
Mês Amostra 1 Mês Retorno1 -0.37% 16.05% Assimetria da Amostra 1 = 2 -6.14% 1.98%3 2.84% -3.80% Assimetria da Amostra 2 =4 8.93% -3.27%5 8.47% -3.39% Note que para uma amostra maior o coeficiente de assimetria já se aproxima mais6 11.63% 1.90% do coeficiente de assimetria da população que é igual a zero.7 -11.48% 2.59%8 0.02% -8.60% Como utilizar e interpretar este tal COEFICIENTE DE ASSIMETRIA?9 7.86% -1.30%
10 -5.01% 1.58% Ora, quando a assimetria for próxima de zero, você já fica sabendo que a distribuição de frequencias11 -2.67% -2.63% da variável aleatória é simétrica e que a média está próxima da mediana. Você sabe que existe uma12 -8.57% 1.68% igual possibilidade de encontrar retornos à esquerda ou à direita da média. No caso contrário você13 -9.50% 3.28% já espera por caudas gordas à esquerda (assimetria menor do que zero) ou à direita (assimetria 14 -4.37% 14.83% maior do que zero).15 -3.16% -9.90%16 -11.10% 1.21% Veja os exemplos de distribuições assimétricas abaixo.17 -1.95% 12.67%18 -0.98% 3.56%19 2.20% 3.10%20 -0.76% -3.98%21 -0.53% -2.51%22 -0.78% 2.47%23 9.32% 9.73%24 0.90% 4.95%25 0.30% 11.59%26 -1.63% -3.41%27 13.04% 0.86%28 6.51% 3.81%29 15.42% 5.55%30 -2.46% -3.92%31 11.20% 8.23%32 -8.11% 11.84%33 4.58% 1.80%
Assimetria da População =3( μ−med )
σ
Assimetria da Amostra=3( X
−
−med )s
34 6.72% 9.97%35 12.72% -2.31%36 0.90% 3.86%37 -1.69% 3.97%38 5.38% -2.33%39 -0.85% 1.61%40 5.87% 1.56%41 -7.12% -3.52%42 -3.60% 6.65%43 -7.58% -2.91%44 -0.74% 6.09%45 1.21% 1.13%46 1.57% 0.72%47 -0.50% 1.04%48 14.35% 5.33%49 -8.88% 11.70%50 -2.95% 3.61%
X (media) 0.77% 9.31%dp amostra 6.86% 5.64%Mediana -0.52% 9.44%
8.41%2.46%3.97%1.83%
-7.51%8.26%
-0.99%-2.51%-7.24%-8.49%-6.63%6.84%
-1.71%2.64%6.18%7.73%1.05%
13.44%0.61%1.06%1.51%
-1.69%-10.03%
5.56%3.56%6.30%
-2.31%2.03%5.48%
-3.35%-0.57%-0.01%16.25%
9.80%-3.63%-2.17%3.09%
3.03%9.77%1.79%
-2.78%2.07%5.03%
-8.09%-0.47%-2.84%2.48%
-5.64%0.05%1.56%1.39%0.77%9.45%5.18%3.26%2.19%1.68%
-0.94%-3.04%0.11%
-4.90%-2.62%-8.52%7.12%7.47%
-0.09%-1.91%1.59%
-5.45%-6.68%-0.72%10.39%
7.63%-5.65%9.21%0.39%5.99%2.88%
-5.14%-1.52%4.65%0.26%
12.71%1.17%
-2.39%-5.56%-5.55%1.25%0.73%
-2.43%1.00%
-1.75%8.55%
-9.10%
-18.05%7.06%6.21%
-3.36%2.44%3.01%5.88%
-10.95%5.86%
-0.46%1.28%
-1.92%-1.92%-3.65%-8.41%-1.24%5.54%7.27%0.28%6.67%6.90%
10.16%4.14%
-1.86%-3.34%4.95%
-3.03%0.69%1.46%
10.93%12.75%
8.20%2.79%2.34%2.61%
-1.04%-1.15%10.79%
3.81%-0.12%0.57%
-2.24%-5.19%-0.63%-3.66%3.15%3.10%
-0.77%8.52%3.46%
-11.49%2.32%4.01%
X (media) 1.61%dp amostra 5.63%Mediana 1.56%
Considere a seguinte distribuição de perdas de crédito dada pela distribuição de frequência abaixo:
Perda Frequencia P x F P2 x F A classe que contém a mediana é logo a primeira classe, pois o seu valor já 0.00% 38.00% 0.00% - supera 50,00%. Entâo a mediana é 0,00%.5.00% 23.00% 1.15% 0.00058
10.00% 10.00% 1.00% 0.00100 Mediana 0.00%20.00% 7.00% 1.40% 0.00280 30.00% 6.00% 1.80% 0.00540 40.00% 5.00% 2.00% 0.00800 Assimetria 2.06 cauda gorda à direita.50.00% 4.00% 2.00% 0.01000 60.00% 3.00% 1.80% 0.01080 70.00% 2.00% 1.40% 0.00980 80.00% 1.00% 0.80% 0.00640 90.00% 0.50% 0.45% 0.00405
100.00% 0.50% 0.50% 0.00500 Total 100.00%
Média 14.30%Variância 0.04338 DP 20.83%
0.00%5.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
90.00%
100.00%0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
30.00%
35.00%
40.00%
Column B
O retorno de uma ação tem distribuição normal de probabilidades com média igual a 1,40% ao mês e desvio-padrão de 5,90%.
0.561756
0.028485
Note que para uma amostra maior o coeficiente de assimetria já se aproxima maisdo coeficiente de assimetria da população que é igual a zero.
Como utilizar e interpretar este tal COEFICIENTE DE ASSIMETRIA?
Ora, quando a assimetria for próxima de zero, você já fica sabendo que a distribuição de frequenciasda variável aleatória é simétrica e que a média está próxima da mediana. Você sabe que existe umaigual possibilidade de encontrar retornos à esquerda ou à direita da média. No caso contrário vocêjá espera por caudas gordas à esquerda (assimetria menor do que zero) ou à direita (assimetria
Veja os exemplos de distribuições assimétricas abaixo.
Assimetria da População =3( μ−med )
σ