aula2 cap 02
TRANSCRIPT
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Aula 2 – Cap 02
Estatística Descritiva
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
estudaremos formas de organizar e descrever conjuntos de dados. O objetivo
é tornar os dados mais compreensíveis de modo a enxergar neles tendências,
médias e variações.
Neste capítulo...
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Dados etários da população de Akhiok-Alasca
6356555453525150504948474645424139363433333232313130292828272726252524232221211717161615131212111111101010988776666555444332221110
Sem uma maneira de organizar estes dados é difícil enxergar padrões.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Distribuição de freqüência e seus gráficosDistribuição de freqüências é uma tabela que mostra classes ou intervalo de entrada de dados com um número total de entradas em cada classe. A freqüência f de uma classe é o número de entrada de dados na classe.
As classes possuem amplitudes iguais e cada classe possui um limite inferior da classe, que é menor número que pode pertencer à classe, e o limite superior que é o maior número que pode pertencer a classe.426-30
521-25816-20611-1586-1051-5
Frequência, fClasse
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Amplitude das classes: Distância entre os limites inferiores (ou superiores) de classes consecutivas.
Amplitude total:
426-30521-25816-20611-1586-1051-5
Frequência,fClasse
O número de classes deve estar entre 5 e 20.
Diferença entre o máximo e o mínimo das entradas.
Amplitude total:
30 - 1 = 29
Amplitude das classes:
6 - 1 = 5
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
102 124 108 86 103 8271 104 112 118 87 95
103 116 85 122 87 100105 97 107 67 78 125109 99 105 99 101 92
Faça uma tabela de distribuição de freqüência com5 classes.
Minutos/mês gastos na internet para 30 assinantes
Valores-chave: Valor mínimo =Valor máximo =
67125
Exemplo:
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher4. Marque um risco | em cada entrada de dado na classe apropriada.
1. Decida o número de classes, que deve ficar entre 5 e 20.
2. Calcule a amplitude das classes.
3. Calcule os limites das classes.
(Para este problema use 5.)
Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12)
O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe.
Quando todos os valores estiverem marcados, conte os riscos em cadaclasse para determinar a freqüência dessa classe.
Como construir uma distribuição de frequências
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Mínimo = 67, Máximo = 125Número de classes = 5Amplitude de classe = 12
5| | | |115 - 1269| | | | | | | |103 - 1138| | | | | | | 91 - 1025| | | |79 - 903| | |67 - 78
FreqüênciaRiscosClasse
Dica: Faça primeiro todos os limites inferiores.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da soma entre os limites inferior e superior da classe
(limite inferior + limite superior) / 2
Freqüência relativa de uma classe: é a porção ou porcentagem dos dados que entra nessa classe.
frel = (freqüência da classe) / (tamanho da amostra n)
Freqüência cumulativa de uma classe: é a soma da frequencia daquelaclasse com a de todas as classes anteriores. A frequencia cumulativa da última classe é igual ao tamanho da amostra n.
Definições importantes
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher0,17
0,30
0,27
(5 / 30) = 0,17
(3 / 30) = 0,10
Freqüência relativa ( f / n)
120,5
108
96,5
84,5
72,5
Ponto médio(67 + 78)/2
5
9
8
5
3
f
30115-126
25103-113
1691-102
879-90
367-78
Freqüência cumulativa
Classe
Definições importantes
Tabela: possibilidade de identificar padrões
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Gráficos das distribuiçõesde freqüência
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Histograma de freqüênciaé um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Um histograma possui as seguintes propriedades:
1 – A escala horizontal é quantitativa2 – A escala vertical mede as freqüências das classes3 – Barras consecutivas devem estar encostadas umas as outras
Como as barras de freqüência devem se encostar elas começam e terminam na fronteira das classes, e não nos limites das classes.
Fronteira das classes são os números que separam as classes sem deixaruma falha entre elas.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
126,5114,5102,590,578,566,5
9
8
7
6
5
4
3
2
1
0
5
98
5
3
Tempo na internet
minutos
5
9
8
5
3
f
114,5–126,5115-126
102,5–114,5103-113
90,5–102,591-102
78,5–90,579-90
66,5–78,567-78
FronteirasClasse
Para determinar a fronteira de classe encontre a média do valor entre o limite inferior da segunda classe e o limite superior da primeira classe.
Subtraia este valor da fronteira inferior da primeira classe e some ao valor superior da primeira classe e assim sucessivamente para as outras classes.
(79 – 78) / 2 = 0,5
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos.
98
7654
3210
5
98
5
3
Tempo na internet
minutos72,5 84,5 96,5 108,5 120,5
Polígono de freqüênciaé um gráfico em forma de linha que enfatiza a mudança contínua nas freqüências.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Apresenta em sua escala vertical as freqüências relativas.
Tempo na internet
minutos
Freq
üênc
iare
lativ
a
0,30
0,20
0,10 0,10
0,17
0,270,30
0,17
66,5 78,5 90,5 102,5 114,5 126,50
Histograma de freqüência relativa
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x.
03
8
16
25
30
66,5 78,5 90,5 102,5 114,5 126,50
10
20
30
Freq
üênc
iacu
mul
ativ
a
minutos
Tempo na internet
Gráfico de freqüência cumulativa
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Mais gráficos e representações
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
102 124 108 86 103 8271 104 112 118 87 95103 116 85 122 87 100105 97 107 67 78 125109 99 105 99 101 92
Diagrama de tronco e folhasé similar ao histograma, mas com a vantagem de que o gráfico aindacontém os valores dos dados originais.
Se o valor mais baixo é 67 e o mais alto é 125, o tronco vai de 6 a 12.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
102 124 108 82 103 8571 104 112 118 86 95103 116 87 122 87 100105 97 107 67 78 125109 99 105 99 101 92
Diagrama de tronco e folhas
6 | 77 | 1 88 | 2 5 6 7 79 | 2 5 7 9 910 | 0 1 2 3 3 4 5 5 7 8 911 | 2 6 812 | 2 4 5
Chave: 6|7 significa 67tronco
folhas
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
6 | 6 | 77 | 17 | 88 | 28 | 5 6 7 79 | 29 | 5 7 9 9
10 | 0 1 2 3 3 410 | 5 5 7 8 911 | 211 | 6 812 | 2 412 | 5
Chave: 6|7 significa 67
Dígitos da 1a linha 0 1 2 3 4
Dígitos da 2a linha 5 6 7 8 9
Dígitos da 1a linha 0 1 2 3 4
Dígitos da 2a linha 5 6 7 8 9
Diagrama de tronco e folhas – 2 linhas/tronco
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Plote de pontosEm um plote de pontos cada entrada é desenhada, usando um ponto ●sobre um eixo horizontal.
Um plote de pontos permite que se veja como os dados estão distribuídos e se determinem entradas específicas de dados.
66 76 86 96 106 116 126
minutos/mês na Internet
minutos
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Diagrama de Pizzatem a forma de um círculo que mostra as relações das partes como um todo.
Para encontrar o angulo central para uma entrada de dados multiplique3600 pela frequência relativa da entrada de dados.
O orçamento da Nasa (em bilhões de dólares) dividido emtrês categorias
Construa um diagrama de pizza para esses dados.
Vôo espacial humano 5,7Tecnologia 5,9Apoio às missões 2,7
Bilhões de US$
Exemplo
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher Orçamento da Nasa(em bilhões de dólares)
Vôo espacialhumano
40%
Total
Bilhões de US$
Vôo espacial humano 5,7Tecnologia 5,9Apoio às missões 2,7
14,3
Graus
14314968
360Apoio àsmissões
19%
Tecnologia41%
5,7
14,35,9
14,3
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Diagrama de Paretoé um gráfico de dados qualitativos no qual a altura de cada barra representa a freqüência ou a freqüência relativa. É frequentementeusado no contexto de negócios.
Exemplo: Recentemente uma industria varejista perdeu 45 milhões de dólares de seus ativos. Os dados das perdas são mostrados na tabela abaixo:
2,9fraudes nas
vendas
14,7assaltos a lojas
15,6furtos de
funcionários
7,8administrativas
Valores (em milhões) Causas
Se você fosse o varejista qual causaescolheria para atacar primeiro?
02468
1012141618
administrativas furtos defuncionários
assaltos alojas
fraudes nasvendas
Causas
Milh
ões
de d
ólar
es
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Gráficos de conjuntos de dadosemparelhados
Se dois conjuntos de dados têm o mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo, eles sãochamados de conjuntos de dados emparelhados.
Uma maneira de fazer o gráfico de dados emparelhados é usar um mapa de dispersão.
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a vertical o eixo y.
Exemplo:Na tabela abaixo temos a duração do vínculo empregatício e o salário anual correspondente de dez trabalhadores
280003
451009
392256
416507
4300010
250002
273504
400008
325004
320005
Salário (R$)Permanência no emprego (anos)
Mapa de Dispersão
2 4 6 8 10
25000
30000
35000
40000
45000
sala
rio (e
m re
ais)
Permanência no emprego (anos)
Estatística e Probabilidade
Prof. Dr. Alysson Steimacher
Prof. Dr. Alysson Steimacher
Gráfico da série temporal
Exemplo: Na tabela ao lado, número de assinantes de telefones celulares em milhões e o valor médio da conta mensal local.
41.24861999
39.4369.21998
42.7855.31997
47.7441996
5133.81995
56.2124.11994
61.48161993
68.68111992
72.747.61991
80.95.31990
89.33.51989
98.022.11988
96.831.21987
Conta média(em reais)
Assinantes (em milhões)Ano
é um plote de um conjunto de entradas de dados tomadas a intervalos regulares durante um período de tempo.
1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 20000
20
40
60
80
100
Ass
inan
tes (
em m
ilhoe
s)
Anos