estatística – unidade 2. educação a distância – ead professor: flávio brustoloni...
TRANSCRIPT
Estatística – Unidade 2
Educação a Distância – EaD
Professor: Flávio Brustoloni
Estatística
Cronograma: Turma EMD 0119
Estatística
Data Atividade
24/042º Encontro
1ª Avaliação Disciplina
10/04 1º Encontro
08/053º Encontro
2ª Avaliação Disciplina
15/054º Encontro
3ª Avaliação Disciplina (FINAL)
17/04 Atividades Acadêmicas
Unidade 2
DESCRIÇÃO DE DADOS – MEDIDAS DE POSIÇÃO
Objetivos da Unidade:• Dominar a terminologia, os símbolos usuais e conceitos básicos
habitualmente encontrados na literatura especializada de estatística de forma a ler com proveito trabalhos técnicos;
• Efetuar cálculos pertinentes e necessários à obtenção dos chamados dados estatísticos;
• Delinear ações de coleta de dados, resumir, relatar, organizar e interpretar informações sob o aspecto estatístico;
• Efetuar cálculos de medidas de tendência central e dispersão de dados;
• Reconhecer e calcular separatrizes;
TUTORIAL
2/45
Tópico 1
03
Indicação do Tópico
Página da apostila
Numeração do slide
Unid. 1
TÓPICO 1
1/62
Distribuição de Frequência
2 Distribuição de Frequência
É um tipo de tabela que condensa uma coleção de dados conforme as
frequências (repetições de seus valores).
2/62
Tópico 1
81
Unid. 2
2 Distribuição de Frequência
Tabela Primitiva ou Dados brutos: são os dados coletados em campo e trazidos
para o local de análise na forma como foram coletados.
3/62
Tópico 1
81
Unid. 2
8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5 4 6 5 3 6 5 4 2 5 3 6
2 Distribuição de Frequência
ROL: é a tabela obtida após a ordenação dos dados (crescente ou
decrescente).
4/62
Tópico 1
82
Unid. 2
2 2 2 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 8
3 Tipos de Distribuição de Frequência3.1 Distribuição de Frequência sem Intervalos de Classe
5/62
Tópico 1
83
Unid. 2
Tabela 27 – NOTA EM ESTATÍSTICA - 2000
i Informação Frequência (fi)
1 2 3
2 3 3
3 4 4
4 5 9
5 6 6
6 7 2
7 8 1
Total 28
FONTE: Dados hipotéticos (fictícios)
Na 1ª linha (i=1) temos que os alunos tiraram nota 2 em Estatística (x1 = 2) foram 3 (fi = 3).
3 Tipos de Distribuição de Frequência3.2 Distribuição de Frequência com Intervalos de Classe
5/62
Tópico 1
84
Unid. 2
Quando o tamanho da amostra é elevado, é mais racional efetuar o
agrupamento dos valores em vários intervalos de classe.
3 Tipos de Distribuição de Frequência3.2 Distribuição de Frequência com Intervalos de Classe
6/62
Tópico 1
84
Unid. 2
Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
4 Elementos de Distribuição de Frequência
6/62
Tópico 1
85
Unid. 2
a) Classe: são os intervalos de variação da variável. É simbolizada por i e o número total de classes é
simbolizado por k.
4 Elementos de Distribuição de Frequência
7/62
Tópico 1
85
Unid. 2Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
k = 4 (4 linhas); a primeira classe (i = 1) apresenta que os alunos tiraram notas entre 2 e menores que 4 (02 |- 04)
foram 6 (f1 = 6).
4 Elementos de Distribuição de Frequência
8/62
Tópico 1
85
Unid. 2
b) Limites de Classe: são os extremos de cada classe. O menor
número é o limite inferior de classe (li) e o maior número, o limite superior da
classe (Ls).
4 Elementos de Distribuição de Frequência
9/62
Tópico 1
86
Unid. 2Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
Temos a classe 06 |- 08, onde li = 6 e Ls = 8, lembrando que o valor 8 não pertence à esta classe.
4 Elementos de Distribuição de Frequência
10/62
Tópico 1
86
Unid. 2
c) Amplitude do Intervalo de Classe: é obtida através da diferença
entre o limite superior e inferior da classe e é simbolizada por hi = Ls – li.
4 Elementos de Distribuição de Frequência
11/62
Tópico 1
86
Unid. 2Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
h1 = 4 – 2 = 2. Em distribuição de frequências com intervalo de classes o hi será igual em todas as classes.
4 Elementos de Distribuição de Frequência
12/62
Tópico 1
86
Unid. 2
d) Amplitude total da distribuição: é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe.
AT = L(max) – l(min).
4 Elementos de Distribuição de Frequência
13/62
Tópico 1
86
Unid. 2Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
AT = L(max) – l(min) = 10 – 2 = 8
4 Elementos de Distribuição de Frequência
14/62
Tópico 1
86
Unid. 2
e) Amplitude total da amostra (ROL): é a diferença entre o valor
máximo e o valor mínimo da amostra (ROL), onde AA = Xmax – Xmin.
2 2 2 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 8
AA = 8 – 2 = 6
4 Elementos de Distribuição de Frequência
15/62
Tópico 1
86
Unid. 2
f) Ponto médio da classe: é o ponto que divide o intervalo de classe em
duas partes iguais.
4 Elementos de Distribuição de Frequência
16/62
Tópico 1
86
Unid. 2Tabela 28 – NOTAS EM ESTATÍSTICA - 2002
Classes Frequências (fi)
02 |- 04 6
04 |- 06 8
06 |- 08 13
08 |- 10 1
Total 28
FONTE: Dados hipotéticos (fictícios)
Em 06 |- 08 o ponto médio xi = (6 + 8)/2 = 7.
4 Elementos de Distribuição de Frequência4.1 Método Prático para construção de uma distribuição de frequência com intervalos de classe
17/62
Tópico 1
87
Unid. 2
Exemplo 1: Uma prefeitura coletou dados sobre a renda mensal dos
indivíduos de uma comunidade para traçar um perfil socioeconômico e a
partir disto elaborar um projeto social na comunidade.
4 Elementos de Distribuição de Frequência4.1 Método Prático para construção de uma distribuição de frequência com intervalos de classe
18/62
Tópico 1
89
Unid. 2
Tabela 30 – SALÁRIO DOS MORADORES DA COMUNIDADE
i Classes Frequências (fi)
1 628,90 |- 810,90 8
2 810,90 |- 1042,90 17
3 1042,90 |- 1274,90 6
4 1274,90 |- 1506,90 5
5 1506,90 |- 1738,90 3
6 1738,90 |- 1970,90 7
7 1970,90 |- 2202,90 4
Total 50
FONTE: Dados hipotéticos (fictícios)
TÓPICO 2
19/62
Representações Gráficas das Distribuições de Frequência
2 Tipos de Gráficos de uma Distribuição de Frequência
20/62
Tópico 2
95
Unid. 2
Histograma: os histogramas são formados por um conjunto de
retângulos, com as bases sobre o eixo x, sendo o centro de cada
retângulo o ponto médio da classe por ele representada.
2 Tipos de Gráficos de uma Distribuição de Frequência
21/62
Tópico 2
96
Unid. 2
Tabela 32 – ALTURA DOS ALUNOS DA TURMA A - 2004
Classe de altura Altura (cm) fi Nº Estudantes
A 150 |- 158 5
B 158 |- 166 18
C 166 |- 174 42
D 174 |- 182 27
E 182 |- 190 8
FONTE: Dados hipotéticos (fictícios)
2 Tipos de Gráficos de uma Distribuição de Frequência
22/62
Tópico 2
97
Unid. 2
GRÁFICO 7 – ALTURA DOS ALUNOS DA TURMA A DE 2004FONTE: Dados fictícios
TÓPICO 3
23/62
Medidas de Posição – Tendência Central
2 Média Aritmética (X)2.1 Dados Não Agrupados
24/62
Tópico 3
102
Unid. 2
Exemplo: Um gerente de supermercado que deseja estudar a movimentação de
pessoas em seu estabelecimento, constata que entraram em sua loja nos últimos 5 dias: 295, 1002, 941, 768 e 1283 pessoas. Descobrir o número médio de pessoas que entraram no estabelecimento nesses cinco dias.
2 Média Aritmética (X)2.1 Dados Não Agrupados
25/62
Tópico 3
102
Unid. 2
X = 295 + 1002 + 941 + 768 + 1283858 pessoas=
5
O número médio de pessoas que entraram no estabelecimento nos últimos 5 dias foi de 858
pessoas por dia.
2 Média Aritmética (X)2.2 Dados Agrupados em Distribuição de Frequência Simples
26/62
Tópico 3
102
Unid. 2
Tabela 34 – DISTRIBUIÇÃO DE FREQUÊNCIA
Classe ( i ) Dados Frequência ( fi )
1 1 2
2 3 4
3 9 2
4 15 3
5 27 1
k = 5 Total 12
FONTE: Dados hipotéticos (fictícios)
x
x
x
x
x
= 2
= 12
= 18
= 45
= 27
+
104
104 / 12 = 8,67
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
27/62
Tópico 3
104
Unid. 2
i Classes fi Fai Xi Xi . fi
1 100 |- 200 15 15
2 200 |- 300 19 34
3 300 |- 400 16 50
Totais 50 -
a) Frequência Acumulada (Fai)
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
28/62
Tópico 3
104
Unid. 2
i Classes fi Fai Xi Xi . fi
1 100 |- 200 15 15 150
2 200 |- 300 19 34 250
3 300 |- 400 16 50 350
Totais 50 - -
b) Ponto Médio (Xi)
2
2
2
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
29/62
Tópico 3
105
Unid. 2
i Classes fi Fai Xi Xi . fi
1 100 |- 200 15 15 150 2250
2 200 |- 300 19 34 250 4750
3 300 |- 400 16 50 350 5600
Totais 50 - - 12600
c) Coluna (Xi . fi)
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
30/62
Tópico 3
105
Unid. 2
d) Média
= 12600 / 50 = 252
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
31/62
Tópico 3
105
Unid. 2
i Classes fi Fai Xi Xi . fi
1 100 |- 200 15 15 150 2250 -102
2 200 |- 300 19 34 250 4750 -2
3 300 |- 400 16 50 350 5600 98
Totais 50 - - 12600 -
e) Coluna ( )
-252
-252
-252
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
32/62
Tópico 3
106
Unid. 2
i Classes fi Fai Xi Xi . fi
1 100 |- 200 15 15 150 2250 -102 156060
2 200 |- 300 19 34 250 4750 -2 76
3 300 |- 400 16 50 350 5600 98 153664
Totais 50 - - 12600 - 309800
f) Coluna ( )
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
33/62
Tópico 3
107
Unid. 2
Veremos agora outro exemplo de média:
Suponha que estamos interessados na vida média de um lote de 40 mil
lâmpadas. É óbvio que não temos como testar todas. Tomamos então uma
amostra, calculamos sua média e com este valor estimamos a média
populacional (µ).
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
34/62
Tópico 3
107
Unid. 2
Se n = 5 e as lâmpadas da amostra duram: 967, 949, 940, 952 e 922
horas, temos:
µ = 946 horas
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
35/62
Tópico 3
108
Unid. 2
Vejamos outro exemplo que mostra como a média está sujeita a valores
extremos:
As idades de seis alunos, que participaram de uma excursão com
finalidade ecológica são 18, 19, 20, 17, 19, 18. A idade do instrutor que foi com
eles é 50.
2 Média Aritmética (X)2.3 Dados Agrupados em Distribuições com Intervalos de Classes
36/62
Tópico 3
108
Unid. 2
A informação de que a idade média do grupo é de 23 anos não fecha
com a realidade. Neste caso o mais correto é o uso da mediana ou
moda.
3 Moda (M0)3.1 Dados Não Agrupados
37/62
Tópico 3
109
Unid. 2
Moda é o valor da variável ou observação com maior frequência ou
que ocorre mais vezes.
Para Dados Não Agrupados basta colocar os valores no ROL e depois
verificar qual valor ocorreu com maior frequência. Esse valor será a moda da
distribuição.
3 Moda (M0)3.2 Dados Agrupados em Frequência Simples
38/62
Tópico 3
109
Unid. 2
A moda será o valor com maior frequência. Basta olhar a linha em que fi
é maior.
A moda da distribuição a seguir é o valor 3 (coluna dados) pois é a que tem
maior frequência.
3 Moda (M0)3.2 Dados Agrupados em Frequência Simples
39/62
Tópico 3
109
Unid. 2
Classe ( i ) Dados Frequência ( fi )
1 1 2
2 3 4
3 9 2
4 15 3
5 27 1
k = 5 Total 12
3 Moda (M0)3.3 Dados Agrupados em Classe
40/62
Tópico 3
110
Unid. 2
Quando os dados estiverem agrupados em intervalos de classe,
encontra-se a classe modal e calcula-se a moda pela seguinte fórmula:
3 Moda (M0)3.3 Dados Agrupados em Classe
41/62
Tópico 3
110
Unid. 2
3 Moda (M0)3.3 Dados Agrupados em Classe
42/62
Tópico 3
110
Unid. 2
Classe ( i ) Classes Frequência ( fi ) Xi Fai
1 1 |- 3 2 2 2
2 3 |- 5 4 4 6
3 5 |- 7 8 6 14
4 7 |- 9 3 8 18
5 9 |- 11 3 10 20
Totais 20
TABELA 37 – CONJUNTO DE DADOS ALEATÓRIOS
FONTE: Dados fictícios
d1 = f3 – f2 = 8 – 4 = 4
d2 = f3 – f4 = 8 – 3 = 5
3 Moda (M0)3.3 Dados Agrupados em Classe
43/62
Tópico 3
110
Unid. 2
A classe modal é a terceira classe (i3) da distribuição, pois ali é onde está a maior
frequência (8).
3 Moda (M0)3.3 Dados Agrupados em Classe
44/62
Tópico 3
111
Unid. 2
4 Mediana (Md)4.1 Dados Não Agrupados
45/62
Tópico 3
112
Unid. 2
Quando todas as observações estão ordenadas (em rol), a mediana é o
valor da observação central. A mediana não é calculada como a média. Ao
invés disso, para determinar a mediana, calculamos a sua posição, o valor que estiver naquela posição será
a mediana.
4 Mediana (Md)4.1 Dados Não Agrupados
46/62
Tópico 3
112
Unid. 2
Para o cálculo da mediana fazemos (n+1)/2, sendo n o número de dados
da distribuição.
Exemplo1: Qual a mediana dos dados a seguir?
4 7 8
4 Mediana (Md)4.1 Dados Não Agrupados
47/62
Tópico 3
112
Unid. 2
(n + 1)/2 -> (3 + 1)/2 = 4/2 = 2
A mediana é o dado da 2ª posição, ou seja, Md = 7.
4 7 8
4 Mediana (Md)4.1 Dados Não Agrupados
48/62
Tópico 3
112
Unid. 2
Exemplo2: Qual a mediana dos dados a seguir?
3 5 9 16
4 Mediana (Md)4.1 Dados Não Agrupados
49/62
Tópico 3
113
Unid. 2
(n + 1)/2 -> (4 + 1)/2 = 5/2 = 2,5 que representa a posição entre o 2º e o 3º dado. Neste caso calcularemos a
média entre o 2º (5) e o 3º (9):
(5+9)/2 = 14/2 = 7
4 Mediana (Md)4.2 Frequência Simples
50/62
Tópico 3
114
Unid. 2
Classe ( i ) Xi Frequência ( fi ) Fai
1 0 2 2
2 1 7 9
3 2 21 30
4 3 18 48
5 4 9 62
6 5 4 61
Total 61
TABELA 38 – NÚMERO DE FILHOS DAS FAMÍLIAS NO AMAPÁ - 2000
FONTE: Dados fictícios
4 Mediana (Md)4.2 Frequência Simples
51/62
Tópico 3
115
Unid. 2
1º. Posição: (n+1)/2 -> (61 + 1)/2 = 62/2 = 31
2º. Mediana: Md= 3
4 Mediana (Md)4.3 Dados Agrupados
52/62
Tópico 3
115
Unid. 2
Classe ( i ) Pontos fi Xi Fai
1 1 |- 3 2 2 2
2 3 |- 5 4 4 16
3 5 |- 7 8 6 14
4 7 |- 9 4 8 18
5 9 |- 11 2 10 20
Total 20
TABELA 39 – PONTUAÇÃO AFERIDA PELAS EQUIPES NO CAMPEONATO DE VOLEIBOL - 2006
FONTE: Dados fictícios
5 Simetria e Assimetria
53/62
Tópico 3
117
Unid. 2
Classe ( i ) Notas fi Fai
1 6 5 5
2 7 9 14
3 8 20 34
4 9 9 43
5 10 5 48
k = 5 Total 48
TABELA 40 – DISTRIBUIÇÃO DE NOTAS ESTATÍSTICA – NFD 2111
FONTE: Dados fictícios
Posição = (48+1)/2 = 49/2 = 24,5
Md = 8
14
14
5 Simetria e Assimetria
54/62
Tópico 3
118
Unid. 2
Sendo assim, devemos observar que:
a) Quando uma distribuição é simétrica, as três medidas coincidem:
X = Md = M0
5 Simetria e Assimetria
55/62
Tópico 3
118
Unid. 2
b) Quando a assimetria as torna diferentes, temos:
M0 < Md < X (curva assimétrica positiva ou à direita)
X < Md < M0 (curva assimétrica negativa ou à esquerda)
TÓPICO 4
56/62
Separatrizes
1 Introdução
57/62
Tópico 4
123
Unid. 2
As separatrizes são medidas, como o nome já sugere, que separam a
distribuição em grupos. A mediana é uma separatriz, embora separe ao meio e por isso pode também ser
classificada como medida de tendência central.
2 Cálculo da Separatriz
58/62
Tópico 4
123
Unid. 2
Onde k representa a porcentagem que você quer fazer na divisão da distribuição.
2 Cálculo da Separatriz
59/62
Tópico 4
124
Unid. 2
Classe ( i ) Pontos fi xi Fai
1 1 |- 3 2 2 2
2 3 |- 5 4 4 6
3 5 |- 7 8 6 14
4 7 |- 9 4 8 18
5 9 |- 11 2 10 20
Total 20
TABELA 39 – PONTUAÇÃO AFERIDA PELAS EQUIPES NO CAMPEONATO DE VOLEIBOL - 2006
FONTE: Dados fictícios
a) Qual o valor que separa a distribuição 15% abaixo e 85% acima?
2 Cálculo da Separatriz
60/62
Tópico 4
124
Unid. 2TABELA 39 – PONTUAÇÃO AFERIDA PELAS EQUIPES NO
CAMPEONATO DE VOLEIBOL - 2006
1
a) Qual o valor que separa a distribuição 15% abaixo e 85% acima?
2 5,511?
15% 85%
É como se dividíssemos a distribuição em 100 posições (11 posições = 100%)
Logo, queremos encontrar a posição 15 (15% ou k = 15 ou C15).
2 Cálculo da Separatriz
61/62
Tópico 4
124
Unid. 2
Classe ( i ) Pontos fi xi Fai
1 1 |- 3 2 2 2
2 3 |- 5 4 4 6
3 5 |- 7 8 6 14
4 7 |- 9 4 8 18
5 9 |- 11 2 10 20
Total 20
TABELA 39 – PONTUAÇÃO AFERIDA PELAS EQUIPES NO CAMPEONATO DE VOLEIBOL - 2006
FONTE: Dados fictícios
Dados: k = 15; Ʃfi = 20; i = 2; Fai (anterior) = 2
2 Cálculo da Separatriz
62/62
Tópico 4
124
Unid. 2
C15 = 3,5
Ou seja, 15% dos dados são menores ou iguais que 3,5 e
85% dos dados são maiores ou iguais a 3,5.
12 5,5
11
C15 = 3,5
15% 85%
Parabéns!!! Terminamos a Unidade.
PRÓXIMA AULA:
Estatística
3º Encontro da Disciplina2ª Avaliação da Disciplina
(10 questões sem consulta)