estatística ivonete melo de...
TRANSCRIPT
1
Estatística
Estatística Descritiva
Ivonete Melo de Carvalho
• Definições; Tabelas e Gráficos; Medidas de tendência central; Medidas de dispersão.
Conteúdo
Objetivos
• Diferenciar população e amostra.• Elaborar tabelas e gráficos.• Calcular média, moda e mediana.• Calcular amplitude total, variância,desvio padrão, coeficiente de variação e erro padrão da média.
O que é Estatística?Uma parte da matemática aplicada que fornecemétodos para: Coleta, Organização, Descrição,Análise, Interpretação de dados e a utilização dosmesmos na tomada de decisão.
Estatística pode ser:
Descritiva:Organização, Tabulação, Representação, Gráficos, Tabelas
Inferencial: Análise e Interpretação dados, Testes de Probabilidade
2
Para calcular o tamanho da amostra
Onde• n = tamanho da amostra• N = população• n0 = número índice• E = percentual de erro admitido
0
02
0 nNn*N
nee1
n
Amostragem poderá ser:
• Amostragem aleatória simples;• Amostragem sistemática;• Amostragem estratificada proporcional.
Definições• Dados são qualquer característica que possa ser
observada ou medida. Podem ser:• Primários quando as informações são colhidas
diretamente pelo pesquisador ou por seusauxiliares.
• Secundários quando os pesquisadores recorrema relatórios, revistas, livros oudados já coletados porinstituições especializadas.
3
Outras definições:
• Elementos são as entidades sobre as quais osdados são pesquisados, por meio de umavariável.
• Variável é um item do elemento da pesquisa eas respostas de todos os itens fornecerão osdados que representarão o grupo pesquisado.
Como trabalhar dados qualitativos
“O meio de transporte que você utiliza entre sua casa e o polo de ensino:
( ) Carro ( ) Motocicleta( ) Ônibus municipal( ) Ônibus intermunicipal
Meios de transporte
Meio de transporte Quantidade de alunosCarro 71
Moto 30Ônibus municipal 21
Ônibus intermunicipal 8Pesquisa realizada em 2007 com alunos do polo Rio Grande
4
Meios de transporte
Meio de transporte f fr f%Carro 71 0,546 54,62
Moto 30 0,231 23,08Ônibus municipal 21 0,162 16,15
Ônibus intermunicipal 8 0,062 6,15Pesquisa realizada em 2007 com alunos do polo Rio Grande
Tipos de gráficos
0
10
20
30
40
50
60
70
80
carr o moto ônibus mun ônibus int0 20 40 60 80
carro
moto
ônibus mun
ônibus int
carro
moto
ônibus mun
ônibus int
Análise de dados quantitativos
Ao perguntar para um grupo de acadêmicos:- Qual a sua altura?Obtivemos as seguintes respostas:
1,60 1,91 1,74 1,65 1,65 1,54 1,65
1,72 1,65 1,85 1,60 1,63 1,72
1,56 1,55 1,52 1,65 1,78 1,78
1,65 1,87 1,55 1,67 1,83 1,69 1,66
1,63 1,60 1,70 1,62 1,68 1,58 1,72
5
Obtidos os dados, vamos à técnica:
• O primeiro passo é construir o rol (dados brutos em ordem crescente ou decrescente).
• Sendo os dados quantitativos, o rol será construído em ordem numérica crescente.
1,55 1,60 1,65 1,66 1,72 1,78
1,56 1,62 1,65 1,67 1,72 1,83
1,52 1,58 1,63 1,65 1,68 1,72 1,85
1,54 1,60 1,63 1,65 1,69 1,74 1,87
1,55 1,60 1,65 1,65 1,70 1,78 1,91
Preparando a tabela:
Maior altura = 1,91Menor altura = 1,52Calcular a :
- amplitude total: 1,91 – 1,52 = 0,39
- quantidade de classes- amplitude da classe
Quantidade de classes
• Quantidade de classes é a raiz quadrada da quantidade de elementos da amostra (n ≤ 50).
• Caso a amostra seja maior que 50,para encontrar a quantidade declasse utilize a fórmula deSturges: k ≈ 1 +3,22 log n, sendo n o números de elementos da amostra.
91,535K
6
Amplitude da classe
07,0065,0639,0
AK
classesdequanttotalamplitudeAK
Construção da tabela:
• Antes de partir para a construção da tabela, é conveniente verificar se os cálculos necessitam de ajuste. Verifique se:
K * AK > AT
Neste exemplo:6 * 0,07 = 0,42 (>0,39)
Frequência Relativa e Percentual
Estaturas obtidas
Classe f* Fr** f%*** F
1,52 |--- 1,59 6 0,1714 17,14 6
1,59 |--- 1,66 12 0,3429 34,29 18
1,66 |--- 1,73 8 0,2286 22,86 26
1,73 |--- 1,80 3 0,0857 8,57 29
1,80 |--- 1,87 2 0,0571 5,71 31
1,87 |--- 1,94 2 0,0571 5,71 33
N Resp. 2 0,0571 5,71 35
Total 35 1,0000 100* Frequência ** Relativa *** percentual
7
Representação gráfica
0
2
4
6
8
10
12
14
1,52 |--- 1,59
1,59 |--- 1,66
1,66 |--- 1,73
1,73 |--- 1,80
1,80 |--- 1,87
1,87 |--- 1,94
NResp.
0
2
4
6
8
10
12
14
1,52 |---1,59
1,59 |---1,66
1,66 |---1,73
1,73 |---1,80
1,80 |---1,87
1,87 |---1,94
0
5
10
15
20
25
30
35
40
1,52 |--- 1,59
1,59 |--- 1,66
1,66 |--- 1,73
1,73 |--- 1,80
1,80 |--- 1,87
1,87 |--- 1,94
NResp.
• das frequências descrevem os dados originais,entretanto, as medidas de tendência centraltêm como objetivo representar resumidamentea informação da distribuição de frequência.
Principais medidas de tendência central:• Média aritmética média.• Média ponderada ou média geral.• Mediana.• Moda.
As representações gráficas
Média Aritmética Simples
• É a soma de todos os valores dividida o número de dados.
Onde:x = Média. = Somatório.xi = Variável.
nx
x
oun
x...xxx n21
8
Média Aritmética Simples
• É a soma de todos os valores dividida o número de dados.
Média aritmética ponderada
nx
xoun
x...xxx n21
i
ii
n
nn
fxf
MPou
fffxfxfxfMP
......
21
2211
Qual a média?
• Qual é a média aritmética entre os números 10, 20 e 30?
• A média é:
20360
3302010
x
Mediana
• É o valor do meio de uma série de dados em ordem (ROL). Quando n for ímpar, a mediana fica locada no item do meio. Quando n for par, a mediana é a média aritmética dos dois valores centrais.
Exemplos• Rol: 3, 5, 6, 9 e 10: med = 6• Rol: 3, 5, 6, 10, 12 e 14:
82
162106
med
9
• É o valor que apresenta em maior frequência (valor que mais se repete).
Uma distribuição pode ser:• AMODAL: não tem moda.
Ex.: 5, 12, 17, 18 (não tem moda).• UNIMODAL: possui uma moda.
Ex.: 5, 12, 12, 17 e 18 moda 12. • BIMODAL: possui duas modas.
Ex.: 5, 12, 12, 17, 18 e 18 modas: 12 e 18.
Moda
Amostras de diâmetros de parafusos (em milímetros) obtidas em três diferentes máquinas:
A: 120; 122; 118; 124; 121 – xA (média) = 121B: 121; 121; 121; 121; 121 – xB (média) = 121C: 116; 125; 124; 120; 120 – xC (média) = 121
Para evitar o possível erro na análise dos dados, utilizaremos as medidas de dispersão.
Se considerar a média
Amplitude total
No exemplo dos parafusos:Amostra A: 120; 122; 118; 124; 121Amostra B: 121; 121; 121; 121; 121Amostra C: 116; 125; 124; 120; 120
Amplitude totalA = 124 - 118 = 6B = 121 - 121 = 0C = 125 - 116 = 9
10
Desvio
• Diferença entre a média aritmética e os valoresobservados para a variável em estudo.
Variância• É a soma dos quadrados dos desvios em
relação à média, dividida pelonúmero de dados, para umapopulação e um número de dados,
menos a unidade para uma amostra.
1nsqd
σ2
Exemplo do cálculo de variânciaDada a amostra: 124, 118, 122, 120 e 121, vamos calcular o desvio dos elementos em relação à média que é igual a 121 e n = 5
124 – 121 = 3 x1
118 – 121 = -3 x2
120 – 121 = -1 x3
122 – 121 = 1 x4
121 – 121 = 0 x5
5420
401199
40)1()1(3)3(
2
2
222222
σ
σ
σ
Outra forma de calcular a variânciaConsideremos a amostra do exemplo anterior:124 118 122 120 121 com média = 121 e n = 5
x x2
124 15.376118 13.924122 14.884120 14.400121 14.641
Total: 605 73.225
515
732251n
x
2
5366025
2
n
2)x(22
11
Desvio Padrão
• é a raiz quadrada da variância.
• Para o exemplo dos parafusos, o desvio padrão será dado por:
23,2σ
5σ
Coeficiente de variação
É uma medida de dispersão relativa que expressa o desvio padrão em forma de porcentagem, ou seja, transforma a medida de dispersão absoluta em relativa.
médiaσ100
cv
cvσ%100média
Exemplo
• Suponhamos que em uma determinada sala de aula a média de notas na disciplina de estatística foi de 7,5, com um desvio padrão de 3,9, calcular o coeficiente de variação.
%52cv5,7
3905,7
9,3*100cv
média100
cv
σ
12
Erro padrão da média
• Medida indicadora da precisão em que a média foi estimada. É inversamente proporcional à raiz quadrada do número de observações, portanto, quanto maior for o n, menor será o erro.
• É mais utilizado para cálculo deintervalo de confiança, no qual a média mais o erro-padrão e a médiamenos o erro-padrão compreenderãoa verdadeira média da população.
n
σSx
Exemplo
• Seja n = 10 e σ = 14,37
31,4Sx10
37,14Sx
Estatística
Probabilidade
Conteúdo• Definições.• Probabilidade: regras e aplicações.
13
Objetivos• Utilizar a probabilidade como estimador de
valor.• Minimizar os riscos causados em investimentos,
negócios, vendas etc.• Compreender a importância do estudo da
probabilidade.• Analisar as distribuições de probabilidade.
Modelos• Determinísticos: quando somos capazes de
calcular com exatidão uma variável.• Probabilísticos: Quando se baseia em resultados
possíveis ou probabilidades.
Experimento aleatório• É aquele que poderá serrepetido indefinidamente e cujoresultado não pode ser previsto comcerteza, mas todos os resultados sãopossíveis.
Espaço amostral• É o conjunto de todos os possíveis resultados
de um experimento.Evento• É um subconjunto do espaço amostral.
Um evento pode ser:Certo;Composto;Dependente;Elementar;Mutuamente exclusivos;Impossível.
14
Evento certo e evento impossível
• Aprendemos que evento é um conjunto de resultados do experimento, isto é, um subconjunto S.
• Em particular, S (espaço amostral) e Φ (conjunto vazio) são eventos.
• Nestas condições:– S é dito o evento certo (evento que deve ocorrer;
tem probabilidade 1), e – Φ é o evento impossível (tem probabilidade 0)
Eventos mutuamente exclusivos
• São aqueles que não podem ocorrer simultaneamente. Portanto dois eventos A e B são mutuamente exclusivos se A ∩ B = Φ
• Ao jogar um dado, observamos que S = {1, 2, 3, 4, 5, 6}
• Então, sejam os eventos A = ocorrer número par e B = ocorrer números impar. Logo: A = {2, 4, 6}, B = {1, 3, 5}
• A e B são considerados mutuamente exclusivos pois A ∩ B = Φ
Evento elementar
• Evento que contém um único ponto amostral.
Evento composto• Evento que consiste de dois ou mais eventos
simples .
Eventos dependentes• Dois eventos são ditos dependentesse a probabilidade de um ocorreraltera a probabilidade do outro ocorrer,
isto é, P(A/B) = P(A).
15
Eventos independentes
• Dois eventos de um espaço amostral S, são denominados de independentes se a probabilidade de um deles ocorrer não afeta a probabilidade do outro ocorrer.
Probabilidade da ocorrência de um evento
NCT)A(NCF
)A(P
Onde:• P(A) = probabilidade de um
evento;• CNF(A) = número de casos
favoráveis ao evento A• NCT = número de casos totais
Exemplo• Em um lançamento de um dado, qual a probabilidade de sair a face 3?.• P(A) = 1/6 = 0,1667 = 16,67%
Probabilidade de evento
• Sempre será uma fração entre 0 e 1
• Probabilidade de evento. • Mutuamente exclusivos.• Probabilidade de evento não
mutuamente exclusivos.• Probabilidade de evento Complementar.• Probabilidade independente.
Regras da Probabilidade
16
Eventos mutuamente exclusivos• São tais que a ocorrência de um exclui a
possibilidade da ocorrência do outro.
)B(P)A(P)BA(P
Exemplo: No lançamento de um dado, qual a probabilidade de sair a face 3 ou um número par?
S: {1, 2, 3, 4, 5, 6}A = {3} e B = {2, 4, 6}P(A U B) = 1/6 + 3/6 = 4/6 P(A U B) = 66,67%
Probabilidade de evento não mutuamente exclusivos.
• A ocorrência de um evento particular qualquer não elimina a ocorrência de todos os outros possíveis. )BA(P)B(P)A(P)BA(P
ExemploNo lançamento de um dado, qual a probabilidade de sair a face 3 ou um número ímpar?
S: {1, 2, 3, 4, 5, 6}A = {3} e B = {1, 3, 5}P(A U B) = 1/6 + 3/6 - 1/6P(A U B) = 3/6 = 50%
Probabilidade de evento complementar• A regra para o evento complementar é:
)A(P1)A(P
• No lançamento de um dado, qual a probabilidade de não sair a face 3?
S: {1, 2, 3, 4, 5, 6}P(A) = 1 - 1/6 = 5/6P(A) = 83,33%
Exemplo
17
Probabilidade independente.
• Dois ou mais eventos são ditos independentes se a ocorrência de um deles não afetar a ocorrência dos outros.
)B(P*)A(P)BA(P
Exemplo• No lançamento de um dado 2 vezes,qual a probabilidade de sair a face 6em ambas as vezes?
P(A U B) = 1/6 x 1/6 = 1/36 P(A U B) = 2,77%
Os eventos independentes podem ser: com reposição
• Uma urna contém 7 bolas vermelhas, 4 amarelas e 3 azuis. Ao retirarmos duas bolas, qual a probabilidade de ambas as bolas serem vermelhas (com reposição)?
P(A U B)= P(A) x P(B)P(A U B)= 7/14 x 7/14P(A U B)= 49/196 = 25%
Os eventos independentes podem ser: sem reposição
Considerando o exemplo anterior sem reposição:P(A U B) = 7/14 x 6/13P(A U B) = 42/182 = 23,07%
Supondo agora, sem reposição, retirar duas bolas, qual a probabilidade de uma ser vermelha e outra azul?
P(A U B) = 7/14 x 3/13P(A U B) = 21/182 = 11,54%