estatÍstica decritiva
DESCRIPTION
ESTATÍSTICA DECRITIVA. CURSO DE SI FATEC/FUNCESI 2004-1. Questões. 1) Como obter dados confiáveis? 2) Como coletá-los? 3) Como tratá-los corretamente? 4) Qual a melhor forma de representação? 5) Qual conclusões eles nos proporcionam?. Estatística Descritiva. Compreende: - PowerPoint PPT PresentationTRANSCRIPT
ESTATÍSTICA DECRITIVA
CURSO DE SI
FATEC/FUNCESI 2004-1
Questões
1) Como obter dados confiáveis?
2) Como coletá-los?
3) Como tratá-los corretamente?
4) Qual a melhor forma de representação?
5) Qual conclusões eles nos proporcionam?
Estatística Descritiva
Compreende:
1) Descrição (questionário e relatórios)
2) Tabulação (planilhas e tabelas)
3) Representação em forma visual adequada (Gráficos)
4) Cálculo de medidas de tendência central e variabilidade
MEDIDAS DE TENDÊNCIA CENTRAL
1 - MÉDIA ARITMÉTICA SIMPLES
Somam-se todos os dados e divide-se o resultado pelo número dos dados.
FÓRMULA
n
x
n
x...xxxx
n
1ii
n321
0,49
9
441
9
464952596338385640
x
MEDIDAS DE TENDÊNCIA CENTRAL
2 - MEDIANAÉ o resultado que representa o ponto médio
de uma série de dados ordenados, isto é, metade estão acima e outra metade abaixo.
Procedimento:• Ordena-se o conjunto de dados• Se o conjunto for ímpar = dado do meio (metade
abaixo e metade acima)• Se for par = média aritmética dos dados centrais
MEDIDAS DE TENDÊNCIA CENTRAL
3 - MODA É o valor que ocorre com maior
freqüênciaProcedimento:Toma-se o conjunto de daos e verifica-
se o que mais se repete.
EXERCÍCIOS
1) Calcular a média aritmética, a mediana e a moda das idades,das alturas e dos pesos dos alunos desta turma
2) Qual melhor representa a realidade da turma? Por que?
3) Represente as 3 medidas numa reta ordenada e faça a comparação
MEDIDAS DE DISPERSÃODispersão = Grau de afastamento de um
conjunto de dados de sua média. Representa o grau de homogeneidade ou heterogeneidade do conjunto.
1 - AMPLITUDEDistância entre o dado de maior grandeza e
o de menor grandeza. Sensível a valores muito grandes ou muito pequenos.
Exercício: Calcular a amplitude entre as idades dos alunos desta sala
MEDIDAS DE DISPERSÃO
2 - INTERVALO INTERQUARTIL (IIQ)
Distância entre o dado do 3º quartil e do 1º quartil.
Exercícios: na folha à parte
MEDIDAS DE DISPERSÃO
3 - DESVIO MÉDIO ABSOLUTO
Média aritmética dos desvios absolutos entre todos os dados observados e a média aritmética desses dados.
Exercícios: na folha à parte
MEDIDAS DE DISPERSÃO
4 – DESVIO MÉDIO ABSOLUTODá a distância média de cada dado
em relação à média da amostra.Fórmula:
n
xx...xxxxxxD.M.A
n321
MEDIDAS DE DISPERSÃO
5 – VARIÂNCIAÉ mais conveniente que o D.M.A. É a soma
dos quadrados dos desvios de cada dados em relação à média, dividido por n.
Fórmula:
n
xx
n
xxxxxxxx
n
in
2
122
32
22
12
)()(...)()()(
MEDIDAS DE DISPERSÃO
6 - DESVIO PADRÃO
n
xx
n
xxxxxxxx
n
in
2
122
32
22
1
)()(...)()()(
MEDIDAS DE DISPERSÃO
VARIÂNCIA E DESVIO PADRÃO AMOSTRAL
n
i
in
n
xx
n
xxxxxxxxs
1
223
22
212
1
)(
1
)(...)()()(
n
i
in
n
xx
n
xxxxxxxxs
1
223
22
21
1
)(
1
)(...)()()(
MEDIDAS DE DISPERSÃO
7 – COEFICIENTE DE VARIAÇÃO
Fórmula:
xmédia
padrãodesvioiaçãovar.Coefic
REPRESENTAÇÃO DE DADOS
8 – TABELAS E QUADROSÉ a forma mais comum de apresentação de
relatórios técnicos. Segue normas metodológicas rígidas (Norma ABNT). Em monografias, por exemplo, os dados devem ficar em anexo e deve-se transcrever para o corpo do texto apenas as tabelas e quadros, fazendo –se referência à fonte e ao anexo para checagem do leitor.
REPRESENTAÇÃO DE DADOS
9 – GRÁFICOSO gráfico é um método de representação dos dados
que permite uma melhor comunicação com o leitor. Traduz a intenção do relator em realçar ou esconder determinado dado. A escolha da escala, da cor, da textura traduzem esta intenção. É uma forma elegante de representação e tecnicamente muito bem aceita.
REPRESENTAÇÃO DE DADOS
10 - PRINCIPAIS TIPOS DE GRÁFICOS:• Gráficos de barras• Gráficos de setores (pizza)• Gráficos de pontos• Gráficos de dispersão• Gráficos de linha• Pictogramas• Histogramas diagramas de freqüência
DADOS AGRUPADOS
11- Histogramas
Os gráficos, às vezes, não ficam bem quando tenho uma relação longa de dados. Para melhor visualização e precisão nas estatísticas, precisamos agrupá-los convenientemente. Existem softwares que fazem isso para nós: SAS, SPSS, Minitab.
PROCESSO DE AGRUPAMENTO
1) Decidir o número de classes de sua tabela (sugerido: entre 5 e 20 classes)
2) Determinar a amplitude de classe, divide-se a amplitude pelo numero de classes (arredonde para mais
3) Escolher como limite inferior da primeira classe o menor valor observado ou ligeiramente inferior
EXERCÍCIO 1: Fazer isso para os dados de idade de sua turma.
PROCESSO DE AGRUPAMENTO
4) Some a amplitude da classe ao menor valor e obtenha a segunda classe e assim sucessivamente até completar o número de classes escolhidas.
5) Faça uma coluna com esses limites de classe6) Conte os elementos agrupando-os em cada
intervalo de classe (use traços)7- Represente estas contagens num gráfico.EXERCÍCIO 2: Fazer os passos de 4 a 7 para os dados
anteriores.EXERCÍCIO 3: Repetir os passos de 1 a 7 para peso e
altura.
ESTATÍSTICAS DE DADOS AGRUPADOS
12- Média aritmética ponderada
n
xf
n
xfxfxfxfx
n
iii
nn
1332211 ...
nffffn ...321
ESTATÍSTICAS DE DADOS AGRUPADOS
13- Mediana
Onde:
xL= limite inferior da classe da medianaN = Total de elementos da amostra
nL = Número de elementos da classe abaixo da mediana
nm= número de elementos da classe medianaw = amplitude da classe da mediana
m
LL n
w)n2/N(xMediana
ESTATÍSTICAS DE DADOS AGRUPADOS
PERCENTIL
Pk = Percentil k (1 k 100)
xL= limite inferior da classe do percentilN = Total de elementos da amostra
nL = Número de elementos da classe abaixo do percentil
nm= número de elementos da classe percentilw = amplitude da classe do percentil
m
LLk n
w)nkN*01,0(xP
ESTATÍSTICAS DE DADOS AGRUPADOS
14 - Moda
É o ponto médio do intervalo de classe com maior freqüência.
Pode ser mais de uma como nos dados desagrupados
ESTATÍSTICAS DE DADOS AGRUPADOS
15 - Variância
2
11
2
11
2
11 )(
)(
n
xf
n
xf
n
xxfxVar
i
m
ii
m
ii
m
i
ESTATÍSTICAS DE DADOS AGRUPADOS
16 - Desvio Padrão
(raiz quadrada da variância)
2
11
2
11
2
11 )(
)(.
n
xf
n
xf
n
xxfxPadrãoD
i
m
ii
m
ii
m
i
ESTATÍSTICAS DE DADOS AGRUPADOS
17 – Variância e Desvio Padrão Amostral
1n
n
1n
)xx(s 2
n
1ii
1n
n
1n
)xx(s 2
n
1ii
2
ESTATÍSTICAS DE DADOS AGRUPADOS
18 – Polígono de FreqüênciaÉ um gráfico de linha que liga os
pontos médios das classes no histograma.
17 – OgivaÉ um gráfico feito com as freqüências
acumuladas. Representa os valores abaixo do limite superior da classe.