medidas de tendência central: média moda mediana
TRANSCRIPT
1
CMIP- Centro de Metrologia e Inovação em ProcessosUFSC- UNIVERSIDADE FEDERAL DE SANTA CATARINA
Profª Andréa
Medidas de Tendência Central:
Média
Moda
Mediana
2
Média Aritmética ou Média Amostral
A média aritmética é a mais usada das três medidas de
posição (média, moda, mediana), por ser a mais comum e
compreensível delas, bem como pela relativa simplicidade
do seu cálculo, além de prestar-se bem ao tratamento
algébrico.
3
Média Aritmética ou Média Amostral
A média aritmética simples de um conjunto de
valores nada mais é do que a soma desses
valores dividida pela quantidade de valores.
1 1 2
n
i
i n
XX X X
Xn n
= + + += =
Tamanho da Amostra
1 1 2
N
i
i N
XX X X
N N = + + += =
Tamanho da População
4
1º Caso – Dados brutos ou o rol
Basta aplicarmos a equação:
n
X
X
n
1i
i==
5
Exemplo 1 :
Para calcular a média das idades, do número
de filhos e do salário dos funcionários da
empresa X, podemos utilizar os dados brutos
da Tabela ou o Rol
Solução:
O total de observações é n = 40.
6
Ordem
Idade
Ordem
Idade
Ordem
Idade
Ordem
Idade
Ordem
Idade
1ª18
11ª27
21ª37
31ª40
36ª45
2ª21
12ª27
22ª37
32ª42
37ª45
3ª23
13ª28
23ª37
33ª42
38ª46
4ª23
14ª28
24ª37
34ª42
39ª48
5ª23
15ª29
25ª37
35ª43
40ª49
6ª24
16ª32
26ª38
7ª25
17ª32
27ª38
8ª25
18ª33
28ª39
9ª26
19ª35
29ª39
10ª26
20ª36
30ª40
ROL -
Idade
7
Os 40 funcionários juntos viveram 1362 anos.
n
X
X
n
1i
i==
34,05 40
1362
40
X
X
40
1i
i
IDADE ====
anos
1362 =
18 +21 +23 +23 +23 + ...+48 +49
Não arredondar!
8
1 0
2 1
3 1
4 2
5 2
6 3
7 1
8 2
9 4
10 3
Nº de
filhos
Nº
11 0
12 0
13 0
14 2
15 2
16 3
17 2
18 0
19 2
20 2
Nº de
filhos
Nº
21 1
22 0
23 3
24 0
25 4
26 0
27 0
28 3
29 2
30 2
Nº de
filhos
Nº
31 1
32 1
33 1
34 2
35 4
Nº de
filhos
Nº
36 1
37 2
38 0
39 4
40 0
Nº de
filhos
Nº
Número de Filhos
9
Se fôssemos fazer uma
festa somente para os
filhos dos funcionários,
convidaríamos 63
pessoas.
n
X
X
n
1i
i==
filhos
1,575 40
63
40
X
X
40
1i
i
FILHOSN ====
63 = 0 +1 +1 +2 +2 +3 + ... + 0 + 4 + 0
Não arredondar!
10
Interpretações:
Os valores das séries se
concentram em torno de:
5,02625 salários mínimos;
34,05 anos e
1,575 filhos.
11
2º Caso – Distribuição de frequência sem intervalos de classes
i Número de
Filhos
fi
1 0 11
2 1 8
3 2 12
4 3 5
5 4 4
40
Aula anterior:2 + 2 + 2 + 2 + 2 +
2 + 2 + 2 + 2 + 2 +
2 + 2 = 24 filhos
= 2 . 12
12
Então, quando conhecemos a distribuição de
frequência sem intervalos de classes devemos
calcular a média aritmética aplicando a equação:
n
.fX
X
n
1i
ii==
= ifnOnde:
13
i Número de
Filhos Xi
Funcionários
fi
1 0 11
2 1 8
3 2 12
4 3 5
5 4 4
40 63
=
n
1i
ii .fX
n
.fX
X
n
1i
ii==
14
i Número de
Filhos
Funcionários
fi
1 0 11 0.11 = 0
2 1 8 1. 8 = 8
3 2 12 2.12 = 24
4 3 5 3.5 = 15
5 4 4 4.4 =16
40 63
=
n
1i
ii .fX
filhos
1,575 40
63
40
X
X
40
1i
i
FILHOSN ====
Mesma calculada com dados brutos.
15
3º Caso – Distribuição de frequência com intervalos de classes
i Idades (anos) fi
1 18 24 5
2 24 30 10
3 30 36 4
4 36 42 12
5 42 48 7
6 48 54 2
40
Do ROL
obtivemos média
34,05 anos.
16
Quando agrupamos os dados em intervalos de
classes, passamos a trabalhar com os dados
sem conhecimento de seus valores
individuais, ou seja, perdemos informação e
precisão.
O desconhecimento dos
valores individuais dos
dados faz com que se utilize
os pontos médios de classe
para calcular a média
estimada da série.
17
Ordem
Idade
1ª18
2ª21
3ª23
4ª23
5ª23
6ª24
7ª25
8ª25
9ª26
10ª26
Isso equivale a supor que a
média da idade dos 5
funcionários da primeira classe é
21, quando de fato é 21,6 anos.
18
Ordem
Idade
Ordem
Idade
1ª18
11ª27
2ª21
12ª27
3ª23
13ª28
4ª23
14ª28
5ª23
15ª29
6ª24
16ª32
7ª25
17ª32
8ª25
18ª33
9ª26
19ª35
10ª26
20ª36
Que a média da idade dos
10 funcionários da
segunda classe é 27
quando de fato é 26,5 anos
e assim, sucessivamente.
O ponto médio é uma
estimativa não tendenciosa
mas não é um valor
verdadeiro.
19
Para calcular esta média estimada usa-se a
mesma equação anterior, porém, substituindo-se
os valores da variável pelos pontos médios de
cada classe.
n
.fX
X
n
1i
ii==
= ifnOnde:
20
i Idades (anos) fi Xi
1 18 24 5
2 24 30 10
3 30 36 4
4 36 42 12
5 42 48 7
6 48 54 2
40
Calculando os pontos
médios:
21
i Idades (anos) fi Xi
1 18 24 5 21
2 24 30 10 27
3 30 36 4 33
4 36 42 12 39
5 42 48 7 45
6 48 54 2 51
40
Calculando os pontos
médios:
22
i Idades (anos) fi Xi
1 18 24 5 21
2 24 30 10 27
3 30 36 4 33
4 36 42 12 39
5 42 48 7 45
6 48 54 2 51
40
Calculando Xifi :
=
n
1i
ii .fX
23
i Idades (anos) fi Xi
1 18 24 5 21 21.5 =105
2 24 30 10 27 27.10 = 270
3 30 36 4 33 33.4 = 132
4 36 42 12 39 39.12 = 468
5 42 48 7 45 45.7 = 315
6 48 54 2 51 51.2 = 102
40 1392
=
n
1i
ii .fX
Calculando Xifi :
24
n
.fX
X
n
1i
ii==
= ifnOnde:
34,8anos40
1392
n
.fX
X
n
1i
ii
====
Calculando usando dados brutos ou Rol, a
média seria 34,05 anos. A média verdadeira é
34,05 anos enquanto 34,8 anos é uma média
estimada.
25
Os cálculos feitos com base em distribuições
intervalares são imprecisos.
Por esta razão, utiliza-se a distribuição de
frequência com intervalos de classes apenas
para apresentar os dados, mas se faz os
cálculos utilizando-se os dados brutos ou rol
e softwares apropriados.
26
Média Aritmética Ponderada – Notação X
Na média aritmética ponderada, as
observações possuem importâncias diferentes
ou “pesos” diferentes, como ocorre quando
calculamos sua média.
27
Exemplo
Suponha que cada uma das suas duas médias
seja composta por um exercício obrigatório de
Peso 2 e uma prova de Peso 8.
Neste caso, a prova é 4 vezes mais importante
que o exercício, porque 8 : 2 = 4.
Vamos supor também que
você tenha merecido 9 no
exercício e 7 na prova. Sua
média será, então:
28
Peso Nota
E 2 9
P 8 7
7,57,4010
74M
10
5618
10
7.89.2M
===
+=
+=
notapeso
nota.pesoM ==
29
Propriedades da Média
• A média de um conjunto de números é
única e sempre pode ser calculada;
• A média é influenciada (afetada) por
todos os valores da série. Assim, se um
valor se modifica, a média também se
modifica;
30
• Se somarmos uma constante a cada
um dos dados, a média ficará aumentada do
valor desta constante. Analogamente ela
ficará diminuída, multiplicada e dividida;
31
Somando 2 a cada valor.
85
40
5
791086==
++++=X
105
50
5
91112108==
++++=X
8 + 2 = 10
32
• A soma dos
desvios dos dados
até a média é
sempre zero.
Valor Desvios
6 6 - 8 = -2
8 8 - 8 = 0
10 10 - 8 = 2
9 9 - 8 = 1
7 7- 8 = -1
Soma Zero
8=X
33
34
A moda é o valor ou atributo que ocorrecom maior frequência.
Ela não necessariamente existe e, se existir, pode não ser única.
Moda
35
Num conjunto de dados ou numa
distribuição de frequências podem existir
duas modas (diz-se que os
dados/distribuição é bimodal), três modas
(trimodais), quatro ou mais modas
(polimodais) e, se não houver moda, diz-
se que os dados/distribuição se
enquadram como amodal.
Moda
36
X: 2, 3, 8, 2, 7, 3, 5, 4, 3, 1, 0, 3
Mo = 3 unimodal
A:7, 8, 9, 10, 10, 10, 11, 12, 13, 15 – A moda é 10
B: 3, 5, 8, 10, 12, 13 – não apresenta moda (amodal)
Y: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 – temos duas modas: 4 e 7 (bimodal)
1º Caso – Dados brutos ou o rol
37
Neste caso, fica ainda mais simplesobservar porque as frequências simples jáestão indicadas na distribuição ebasta observar, na coluna da freqüênciasimples absoluta, qual a maior freqüência.O valor da variável de maior frequênciaserá a moda.
Distribuição de frequência
38
Xi fi0 11
1 8
2 12
3 5
4 4
Total 40
Xi – N. de filhos
fi - frequência s. a
Ex: Distribuição de
frequência do número de
filhos da empresa do X
Mo = 2
Distribuição de frequência
39
Mo = 8
Distribuição de frequência
40
A mediana é o elemento central deuma série.Ela separa a distribuição em duas partes iguais.
Em outras palavras, deixa à sua esquerda a mesma quantidade de elemento que deixa à sua direita.
Mediana – Notação Md
41
Para obter a mediana, é necessárioPrimeiramente construir o Rol.
Mediana – Notação Md
42
a)Se n é ímpar: neste caso, existe um termo central “puro” e único que ocupa aposição
1º Caso – Dados brutos ou o rol
2
1+n
O valor do elemento que ocupa estaposição é a mediana.
2
1+n
43
Determinar a mediana da série
X: 2; 23; 12; 15; 13; 8; 10.
Exemplo
O Rol é dado por X: 2; 8; 10; 12; 13; 15; 23.
Posição da mediana:
2
1+n
44
Interpretação: 12 é o termo central da série. A quantidade de termos maiores (ou iguais) a ele é igual à quantidade de termos menores (ou iguais) a ele.
Exemplo
45
Se n é par: neste caso, não existe umtermo central “puro” e único que ocupa aposição (n + 1)/2 .
O termo central é um vazio entre doistermos da série. Ao se calcular a posiçãousando (n + 1)/2 o resultado daráfracionário, a mediana é, por convenção, a média aritmética entre os valores dos dois termos centrais.
1º Caso – Dados brutos ou o rol
46
Determinar a mediana da série X: 2;23; 12; 15; 13; 8; 10; 13.
O Rol é dado por X: 2; 8; 10; 12; 13; 13; 15; 23.
Exemplo
Posição da mediana: 5,42
18
2
1=
+=
+n
Md = (12+13)/2 = 12,5
47
Exemplo
Interpretação: 12,5 é o termo central da série.A quantidade de termos à sua direita é igual à quantidade de termos à sua esquerda.
48
Exemplo
Interpretação: 12,5 é o termo central da série.A quantidade de termos à sua direita é igual à quantidade de termos à sua esquerda.
49
Se os dados estão ordenados na forma de
uma distribuição de frequência, basta
calcularmos a posição utilizando (n+1)/2
e verificarmos o valor da variável que
ocupa esta posição utilizando a coluna de
freqüências acumuladas.
Se n é par também utilizamos a média
dos termos centrais
Distribuição de frequência
50
Exemplo
Determinar a medianada distribuição aseguir:
162
131
2
1=
+=
+n
Md = 3
51
Exemplo
Determinar a mediana do número de filhos dos funcionários da empresa XLembre-se de que n = 40, logo, a mediana será a média aritmética entre os dois termoscentrais (20º e 21º).
Md = 2
52
Utilização das Medidas de Tendência Central
Escolha da média:
•quando a distribuição dos dados é aproximadamente
simétrica;
• quando for necessário obter posteriormente outros
parâmetros que podem depender da média, como por
exemplo a variância, o desvio padrão, etc.
Escolha da mediana
• quando há valores extremos;
• quando desejamos conhecer o ponto central da distribuição;
•quando a distribuição dos dados é muito assimétrica.
53
Escolha da moda
•quando a medida de interesse é o ponto mais típico ou
popular dos dados;
•quando precisamos apenas de uma rápida ideia sobre a
tendência central dos dados.
Utilização das Medidas de Tendência Central
54