apostila de probabilidade e estatística - 2006-1
TRANSCRIPT
APOSTILA DE
PROBABILIDADE E
ESTATÍSTICA
Prof. Welfane Kemil Tão
Versão 2006-1
1
Aplicações Usuais da Estatística
Índices econômicos; Taxas de natalidade; Eleições; Teste de QI; Aceitação de produto; Perfil de pessoas; Pesquisas de Opinião/Cursos Pesquisas de mercado
Obs: Softwares estatísticos: Statgraphics / Minitab / SPSS
Objetivo da Estatística
Conceito de EstatísticaEstatística é à parte da matemática que fornece métodos para
coleta, organização, descrição análise e interpretação de dados para tomada de decisões.
Ramos da Estatística:
1) Estatística Descritiva
É o ramo da estatística que procura descrever observações através de tabelas, gráficos e medidas para transformar dados em informações.
2
TOMADA DE DECISÕES
2) Estatística Inferencial
A Estatística Inferencial permite a interpretação e análise de resultados, possibilitando tirar conclusões.
A Estatística Inferencial possibilita que parâmetros populacionais sejam estimados através do estudo de parte desta população (amostragem). Por exemplo, para estimar o percentual de alunos de Administração que têm computador em casa (população), determina-se esse percentual em uma amostra dos alunos e com margens de segurança estabelecidas estima-se o percentual na população;
3) Probabilidade
Ramo da Estatística que envolve uma margem de risco ou incerteza num processo de generalização de fenômenos.
Exemplos: probabilidade de um produto ser vendido, probabilidade de chover, probabilidade de ocorrer acidente (empresa de seguros), resultados de moeda, baralho, dado e outros.
Estudo de Variável:
Variável é o conjunto de resultados possíveis de um fenômeno.
Exemplo:
Fenômeno: resultados possíveis: M/F Sexo
3
CADAFENÔMENO
UM Nº DE RESULTADOS POSSÍVEIS
Tipos de variáveis:
a) QualitativaQuando seus valores são expressos por atributos.
Tipos de Variáveis Qualitativas:
a1) NominalAssociada a uma relação de atributos que não possui ordenação.
Exemplo:Sexo, cor dos olhos, etc.
a2) OrdinalAssociada a uma relação de atributos que pode ser ordenada.
Exemplo:Classe econômica, grau de instrução, etc.
b) QuantitativaQuando seus valores são expressos por números.
Exemplo:Idade, salário, etc.
Tipos de Variáveis Quantitativas:
b1) DiscretaAssociada à contagem. A variável é discreta quando ela assume
valores inteiros.Exemplo:
Número de livros, número de pessoas, número de cadeiras, etc.
Se “x” é a variável número de livros, os valores que “x” pode assumir são:
b2) ContínuaAssociada à medição. A variável é contínua quando ela pode
assumir qualquer valor entre dois limites de um intervalo, ou seja, num intervalo, podem existir infinitos valores.Exemplo:
4
0 1 2 3 4 5
Altura, comprimento, temperatura, massa, etc.
Se “x” é a variável temperatura de uma pessoa, os valores que “x” pode assumir são:
População X Amostra
População É o conjunto de todos os elementos que apresentam pelo menos uma característica comum.
Tipos de população:
a) FinitaPossui um número limitado de elementos.
Exemplo:Número de alunos de uma sala.
b) InfinitaAssociada a processos contínuos, sendo o número de
observações considerado infinito.
Exemplo:Leitura de sensores para controle.Pesagem de materiais de um processo de produção.
AmostraSão subconjuntos não vazios da população em estudo,
excetuando-se a própria população. Deve ser representativa da população.
5
36ºC 37ºC
POPULAÇÃO AMOSTRA
Amostragem X Censo
Uma amostra envolve o estudo de uma parcela da população, enquanto que um censo requer o exame de todos os itens.
Situações em que a amostragem é mais vantajosa: A população pode ser infinita, com isto o censo seria
impossível; Se há necessidade de obter informação com rapidez o censo
pode consumir muito tempo e perder a utilidade; Quando os itens são destruídos durante a realização do
experimento para obtenção dos dados, o censo destruiria toda a população;
Os custos de um censo podem inviabilizar a realização da pesquisa.
Situações em que o censo é mais vantajoso: Quando a população é pequena; Se o tamanho da amostra é grande em relação ao da
população e o esforço adicional para realização do censo for pequeno;
Se houver exigência na precisão completa; Quando as informações completas sobre a população já estão
disponíveis.
AMOSTRAGEM
I) INTRODUÇÃO
Freqüentemente, são feitas pesquisas que estudam os elementos que compõem uma amostra extraída de uma população que será analisada. O conceito de população é intuitivo; trata-se do conjunto de indivíduos ou objetos que apresentam em comum determinadas características definidas para o estudo. Amostra é um subconjunto da população, sendo a parte efetivamente examinada.
Muitas aplicações da estatística envolvem amostras de dados de uma população sobre o qual se deseja fazer alguma inferência. Simplesmente amostrar não é suficiente, a amostra deve ser representativa da população, isto é, a amostra deve ter características similares às características da
6
população. Deve-se ter presente que, a única forma de conhecer o verdadeiro valor (valor exato) de uma variável da população é analisa-la por completo.
Uma amostra representativa apresenta as mesmas características que tem a população de onde foi retirada.
Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de oitocentas pessoas. Nesse caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos.
Se, no exemplo citado, referente à pesquisa sobre o nível de escolaridade de 800 pessoas, escolhermos apenas duas pessoas, corremos o risco de selecionar exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos concluir, de forma errada, que todos os elementos da população também o são.
Observe que, para qualquer tamanho da amostra, sempre corremos o risco de chegar a conclusões erradas, mas este risco diminui à medida que a quantidade de elementos a serem examinados aumenta.
Além de estabelecer um critério para quantidade de elementos que vão fazer parte de amostra, é importante estabelecer critérios de seleção desses elementos. Os métodos de escolha da amostra devem garantir a representatividade do grupo.
Na teoria da amostragem, são consideradas duas dimensões:a) Composição da amostra. b) Dimensionamento da amostra
II) COMPOSIÇÃO DA AMOSTRA:
Basicamente existem dois métodos para a composição da amostra: probabilístico e não-probabilístico:
A) MÉTODO PROBABILÍSTICO:
Este exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Este método garante cientificamente que a aplicação das técnicas estatísticas de inferências.
7
Obs: Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra.
Neste método, as principais formas de amostragem são: Aleatória Simples, Sistemática, Proporcional Estratificada e Por Conglomerados (ou agrupamentos).
A.1) AMOSTRAGEM ALEATÓRIA SIMPLES OU CASUAL.
Equivalente a um sorteio lotérico Geralmente utilizada em populações com menos de 50 elementos
Procedimento:
1º) Numera-se a população de 1 até n, ou seja, do primeiro ao último.2º) Sorteia-se por meio de um dispositivo aleatório qualquer (papéis, urna de bola ou por tabela de números aleatórios) a quantidade de elementos que irão compor a amostra. Obs.: Este passo pode ser omitido se for estipulada a quantidade de elementos que irão compor a amostra. 3º) Sorteia-se, da mesma forma, os elementos que irão compor a amostra.
Exemplo: Vamos compor uma amostra de 10 % da estatura de uma turma que contém 90 alunos.
1º) Numera-se a população de 01 até 90:População 01, 02, 03,.... 90
2º) Calcula-se a número de pessoas que irão fazer parte da amostra, ou seja, 10% de 90 é igual a 9 pessoas. Obs.: Normalmente o número de elementos que irão compor a amostra é determinado por cálculos estatísticos e pelo custo do processo de amostragem.
3º) Os elementos que irão compor a amostra serão sorteados, utilizando-se a tabela de números aleatórios.
Por exemplo, a amostra poderia ser formada pelos alunos de número:
87 07 19 20 35 50 90 61 13 (sorteados)
8
A.2) AMOSTRAGEM PROPORCIONAL ESTRATIFICADA
Utilizada quando a população apresenta comportamento heterogêneo, mas em subpopulações (estratos), o comportamento é homogêneo. Neste caso, a população é dividida em estratos e o sorteio dos elementos que irão compor a amostra leva em consideração esses estratos.
Exemplo:Numa população de 90 alunos, em que 54 são homens e 36 são mulheres,
obter uma amostra proporcional estratificada contendo 10% da população.
1º passo: Determinar o número de elementos da amostra
SEXO POPULAÇÃO 10% AMOSTRAM 54 ? ?F 36 ? ?
2º passo: Numera-se a população de mulheres de 01 até 36 e sorteia-se pela tabela de números aleatórios quais as mulheres que irão compor a amostra.___ ___ ___ ___ (quatro mulheres)
3º passo: Repita o 2º passo para os homens (de 37 até 90)___ ___ ___ ___ ___ (cinco homens)
A.3) AMOSTRAGEM SISTEMÁTICA
Utilizada quando os elementos se encontram ordenados. Neste tipo de amostragem os elementos da população que irão compor a amostra são determinados através de intervalos fixos, por exemplo, prontuários médicos, prédios de uma rua, linhas de produção, etc.
Exemplo: Numa rua existem N = 900 prédios, desejamos obter uma amostra de n = 50 prédios. Qual o procedimento, utilizando a amostragem sistemática?
1º passo: Determinar a relação (N/n = x): 900 = 18, ou seja, a cada x prédios, escolhe-se um prédio. No caso, x=18. 50
2º passo: Sortear o 1º prédio entre o primeiro e o x-ésimo prédio:01 02 03 04 05 06 07 08 09 10 ... 18Por exemplo, o prédio nº 04 foi sorteado, portanto:O primeiro prédio é o de nº 04
9
3º passo: Calcular os próximos prédios que irão formar a amostra (somando-se x ao número do prédio anterior), portanto:O segundo prédio é o de nº 22 ,ou seja, 04+18=22O terceiro prédio é o de nº 40 ,ou seja, 22+18=40... O último prédio é o de nº?
A.4) AMOSTRAGEM POR CONGLOMERADOS (OU AGRUPAMENTOS)
Algumas populações não permitem ou tornam extremamente difícil que se identifiquem seus elementos. Mas, em algumas condições é relativamente fácil identificar alguns subgrupos (conglomerados) da população. Em tais casos, uma amostra aleatória simples de tais subgrupos pode ser obtida e uma contagem completa deve ser feita para o conglomerado sorteado. Exemplos típicos deste processo são quarteirões, famílias, organizações, agências, edifícios e etc.
Assim, por exemplo, num levantamento da população de uma cidade podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra (aleatória) dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados.
B) MÉTODOS NÃO PROBABILÍSTICOS
São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população, com isto os resultados são considerados específicos para aquela amostra em estudo.
Neste método, as principais formas de amostragem são: Acidental, Intencional e Por Quotas.
10
B.1) AMOSTRAGEM ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.
B.2) AMOSTRAGEM INTENCIONAL
De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber opinião. Por exemplo, numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista pessoas que ali estão.
B.3) AMOSTRAGEM POR QUOTAS
Um dos meios de amostragem mais usados em levantamentos de mercado e em tempo de eleição é o método por quotas. Ele é dividido em três fases:
1ª) Classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada;
2ª) Determinação da proporção da população para cada característica, com base na constituição conhecida, presumida ou estimada, da população;
3ª) Fixação de quotas para cada entrevistador a quem vier sobre si a responsabilidade de selecionar entrevistados, de modo que a amostra total contenha a proporção de cada classe tal como determinada na 2ª fase.
Exemplo:
Admite-se que se deseja pesquisar o “trabalho das mulheres”. Provavelmente se terá interesse em considerar: a divisão cidade/campo, a habitação, o número de filhos, a idade dos filhos, a renda média, as faixas etárias...
A primeira tarefa é descobrir as proporções (porcentagens) dessas características na população. Imagine que haja 47% de homens e 53% de mulheres na população. Logo uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma “quota” para entrevistar 27 mulheres. A consideração de várias categorias exigirá uma composição amostral que atenda às proporções populacionais estipuladas.
11
III) DIMENSIONAMENTO DA AMOSTRA
Será abordado por pessoas que desejarem estudar mais profundamente a estatística.
Método Estatístico
É uma técnica utilizada para estruturar e organizar as fases que devem ser seguidas no estudo dos fenômenos estatísticos. As principais fases do método estatístico são: Definição do problema; Planejar a coleta dos dados; Coletar os dados; Apurar os dados; Apresentar os dados; Analisar e interpretar os resultados.
1ª LISTA DE EXERCÍCIOS:
1) Cite as fases do método estatístico.2) Quais os ramos da estatística?3) Classificar as variáveis como: qualitativa, quantitativa discreta e
quantitativa contínua.a) Cor dos olhos:b) Número de filhos:c) Diâmetro de peças:d) Produção de algodão:
4) Quando você utilizaria um processo de amostragem em comparação com um censo?
5) Explique o procedimento para obter uma amostra proporcional estratificada.
6) Em uma escola existem 250 alunos, sendo distribuídos nas séries a seguir:
12
Séries População de alunos
1ª 352ª 323ª 304ª 285ª 356ª 327ª 318ª 27
Calcule através do processo de amostragem proporcional estratificada quantos alunos de cada série irão compor a amostra que deve ter exatamente 40 alunos.7) Numa escola existem 280 meninos e 320 meninas. Escolha uma
amostra de 10% do total de alunos quantos são meninos e quantas são meninas.
8) Uma população está dividida em 3 estados com os tamanhos: M1 = 40, M2 = 100, M3 = 60. Sabendo que foi realizada uma amostragem proporcional estratificada, e que 9 elementos foram retirados do 3º estado, qual é o tamanho da amostra?
13
Gráficos Estatísticos
1) Gráfico em colunas
É a representação de uma série por meio de retângulos, dispostos verticalmente. São de bases iguais e com alturas proporcionais aos dados. Desta forma fica assegurada a proporcionalidade entre os dados e as áreas dos retângulos.
Exemplo1:
Representar os dados da série temporal abaixo, referente ao preço do computador na Grande Vitória, num gráfico em colunas.
Preço do computador na Grande Vitória de Janeiro – Junho/1998
MESES PREÇO (R$)Janeiro 1.050,00
Fevereiro 1.050,00Março 1.000,00Abril 1.000,00Maio 980,00
Junho 980,00Fonte: Dados fictícios
Obs.: A série temporal, também conhecida como Cronológica ou Histórica descreve os valores da variável em função do tempo.
2) Gráfico em barras
14
Semelhante ao anterior, porém os retângulos são horizontais. Neste caso, os retângulos têm a mesma altura e os comprimentos são proporcionais aos dados.
Exemplo 2: Representar os dados da série específica referente ao número de matrículas no ensino superior, num gráfico em barras.
Matrículas no 3º grau de ensino do Brasil – 1975
ARÉA DE ENSINO MATRÍCULASCiências Biológicas 32.109
Ciências Exatas e Tecnologia 65.949Ciências Agrárias 2.419
Ciências Humanas 148.842Letras 9.883Artes 7.464
Duas ou mais áreas 16.323Fonte: Serviço de Estatística, Educação e Cultura.
Obs: A Série Específica ou Categórica descreve os valores da variável em função de uma característica específica.
OBS. Sempre que os dizeres a serem escritos são extensos, devemos dar
preferência aos gráficos em barras (séries geográficas ou específicas). Porém, se ainda preferir o gráfico em colunas, os dizeres deverão ser expostos de baixo para cima;
Se a série for temporal sua disposição no gráfico deverá ser na ordem cronológica. Se a série for geográfica ou específica sua disposição no gráfico deverá ser em ordem decrescente;
15
À distância entre as colunas ou barras, por questões estéticas não deverá ser menor que a metade e maior que 2/3 da largura das colunas ou barras.
Exercício 1:Construir um gráfico para representar a Série Geográfica abaixo:
Duração Média dos Estudos Superiores na Europa – 1994
PAÍS Nº DE ALUNOSItália 7,5
Alemanha 7França 7
Holanda 5,9Inglaterra Menos de 4
Fonte: Revista Veja
Obs: A Série Geográfica, também conhecida como Territorial, Espacial ou de Localização descreve os valores da variável em função da região territorial (bairro, cidade, estado, etc...).
3) Gráfico em colunas ou barras múltiplasUsado para representar, simultaneamente, dois ou mais fenômenos
para comparação.
Exemplo 3:Fazer um gráfico em colunas dos dados abaixo:
Balança Comercial no Brasil (1989 –1991)
ESPECIFICAÇÕES VALOR (US$ 1.000.000)1989 1990 1991
EXPORTAÇÕES 34.383 31.414 31.620IMPORTAÇÕES 18.263 20.661 21.041
Fonte: Ministério da Fazenda
16
Exercício 2: Representar os dados abaixo num gráfico em colunas.
Terminais Telefônicos em Serviço no Brasil (1991 – 1993)
REGIÕES 1991 1992 1993Norte 343.000 376.000 403.000
Nordeste 1.288.000 1.379.000 1.487.000Sudeste 6.234.000 6.729.000 7.232.000
Sul 1.497.000 1.608.000 1.746.000Centro Oeste 713.000 779.000 885.000
Fonte: Ministério das Comunicações
No caso, a tabela acima é a conjugação da série geográfica com histórica.
4) Gráfico em Setores (Pizza/Torta)Este gráfico é construído com base em um círculo, sendo empregado
sempre que desejamos ressaltar a participação dos valores em relação ao total.
Só é recomendado a sua utilização quando há no máximo 7 dados.As áreas dos setores são proporcionais aos dados, portanto:
Total 360º 100%Parte x y
17
Exemplo 4: Representar os dados abaixo em um gráfico de setores:
RECEITA DO MUNICÍPIO X DE 1975 A 1977ANOS RECEITA
(Cr$1.000,00)% ÂNGULO NO
GRÁFICO1975 9001976 12001977 1500Total
Fonte: Município X
5) Gráficos em Linhas ou Curvas
Linha poligonal para representar séries estatísticas.
Exemplo 5: Construir um gráfico em linhas dos dados da Balança Comercial do Brasil (anterior)
18
1976 19771975
Representação de Dados e Distribuição de freqüências:
Conceitos
a) Dados brutosSão dados não organizados em ordem crescente ou decrescente de
grandeza, ou seja, estão na forma bruta que foram coletados.Exemplo: Altura dos alunos da sala (na forma em que foi coletada).
b) RolSão dados organizados em ordem crescente ou decrescente de
grandeza.
19
Exemplo: Altura dos alunos da sala (da menor para a maior).
c) Amplitude Total ou “Range” (R)R = maior valor – menor valor
Exemplo: 10, 11, 5, 3, 2, 1.
R = 11 – 1R = 10
d) Freqüência Absoluta (Fi)Número de vezes que o elemento ou classe de elementos aparece no
conjunto de dados em estudo.Exemplo:
2, 2, 2, 3, 1, 2, 4, 1.A freqüência absoluta do elemento 2 é: 4A freqüência absoluta do elemento 1 é: 2
e) Distribuição de FreqüênciaArranjo dos valores com sua respectiva freqüência.
Exemplo:
Alunos da Sala
Fi
1 102 203 204 55 10
Representação dos dados utilizando uma variável discreta
Exemplo:Construir uma distribuição de freqüência para representar os
números abaixo. Determine as freqüências simples (absoluta e relativa) e acumulada (absoluta e relativa).
xi: {1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4}.
Freqüências Simples Freqüências AcumuladasDados Absoluta Relativa Absoluta Relativa
20
xi Fi Fri Fac Facr
1234
Portanto os tipos de freqüências são:
Absoluta (Fi) Simples
Relativa (Fri)
Freqüência
Absoluta (Fac) Acumulada
Relativa (Facr)
Exercício:Com base nas idades dos alunos de uma turma, mostrada abaixo,10, 10, 10, 11, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13.Responda:a) Construa a distribuição de freqüência determinando: Fi, Fri, Fac, Facr.b) Quantos alunos têm:b.1) Até 11 anos?b.2) Mais de 11 anos?b.3) Entre 10 e 12 anos (incluindo os extremos)?c) Responda os itens anteriores na forma percentual.
Representação dos dados utilizando uma variável contínua e variável discreta com grande quantidade de elementos:Notação de classes:20 || 25: Compreende os valores de 20 a 25, incluindo os extremos.
21
20 | 25: Compreende os valores de 20 a 25, excluindo o 25. (Será usada esta notação)20 | 25: Compreende os valores de 20 a 25, excluindo o 20.
Exemplo: Distribuição de freqüência para uma variável contínua:CLASSES Fi Fri Fac Facr
2 | 4 104 | 6 206 | 8 20
8 | 10 10
1ª Classe: 2 | 42ª Classe: 4 | 63ª Classe: 6 | 8
Limite inferior da 1ª classe: 2Limite inferior da 2ª classe: 4Limite superior da 1ª classe: 4Limite superior da 2ª classe: 6
Ponto Médio das Classes (xi)
O ponto médio de uma classe é calculado através da média aritmética entre o limite inferior e o superior da respectiva classe. Por exemplo, no caso da
1ª classe o ponto médio é:
CLASSES xi
2 | 4 34 | 6 56 | 8 7
8 | 10 9
Amplitude das Classes (h) É a diferença entre o limite superior e o inferior da respectiva classe. 1ª classe: h = 4 – 2 = 22ª classe: h = 6 – 4 = 23ª classe: h = 8 – 6 = 2
Número de Classe (K)
22
Temos 4 classes na tabela do exemplo acima, portanto K=4.
PROCEDIMENTO PARA CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE VARIÁVEL CONTÍNUA:
1º) calcular a amplitude dos dados (R)____________________________________
2º) calcular o nº de classes (k)Não há fórmula exata para calcular o nº de classes. A regra prática que será utilizada é:
regra do quadrado: se n 25, k = 5
se n > 25,
Exemplo: se n=49, determine o nº de classes.
3º) calcular a amplitude das classes (h):
Obs: K e h devem ser aproximados para o maior inteiro.
4º) determinar os limites das classes, preferindo sempre que possíveis números inteiros.
Obs: O limite inferior da 1ª classe, muitas vezes, poderá ser o menor número do conjunto de dados em estudo.
5º) construir a tabela de freqüências determinando as freqüências de cada classe.Exemplo:Dado o rol de 50 notas de alunos, agrupar os dados em classes. Determinando: Fi, Fri, Fac e Facr.
33 35 35 39 41 41 42 45 47 4850 52 53 54 55 55 57 59 60 6061 64 65 65 65 66 66 66 67 6869 71 73 73 74 74 76 77 77 7880 81 84 85 85 88 89 91 94 97
23
Exercício:Os pesos de 40 alunos são:
69 57 72 54 93 68 72 58 64 6265 76 60 49 74 59 66 83 70 4560 81 71 67 63 64 53 73 81 5067 68 53 75 65 58 80 60 63 53
Agrupar os dados em classes, determinando Fi, Fri, Fac, Facr.Solução:O rol em colunas do exercício é:
45 53 58 60 63 65 68 71 74 8149 53 58 60 64 66 68 72 75 8150 54 59 62 64 67 69 72 76 8353 57 60 63 65 67 70 73 80 93
Representação Gráfica de uma Distribuição de Freqüência
1) Histograma de Freqüência Simples (Fi)
Utilizado para representar dados agrupados em classes. É a representação de uma distribuição por retângulos justapostos, onde as suas bases caracterizam a amplitude das classes e suas alturas são proporcionais as freqüências das classes.
Exemplo:Construir o histograma de freqüências simples dos dados abaixo:
CLASSE Fi Fac
2 | 4 3 34 | 6 5 86 | 8 10 18
8 | 10 6 2410 | 12 2 26
24
10Polígono de Freqüência Simples
Fi
2) Polígono de Freqüência Simples (Fi)
Representação de distribuição por meio de um polígono. Consiste em unir os pontos médios das bases superiores dos
retângulos do histograma através de retas.
Exemplo: Construir o polígono de freqüências simples do exemplo anterior
3) Histograma de Freqüência Acumulada (Fac)Semelhante ao histograma de freqüência simples, porém a freqüência
utilizada é a acumulada (Fac).
4) Polígono de Freqüência Acumulada ou Ogiva (Fac)Semelhante ao polígono de freqüência simples, porém a freqüência
utilizada é a acumulada (Fac).
Exemplo: Construir o histograma de Fac a Ogiva para os dados abaixo:CLASSE Fi Fac xi
2 | 4 2 2 34 | 6 3 5 56 | 8 5 10 7
8 | 10 2 12 910 | 12 4 16 11
25
16
12
10
5
2
Fac
F
Polígono de Freqüência Acumulada ( Ogiva )
Histograma de Freqüência Acumulada
1 2 3 4 5 6 7 8 9
6
5
32
Classes
Histograma de Freqüência Simples
EXERCÍCIOS:
1) Representar um gráfico polar dos dados:
Meses J F M A M J J A S O N D
Temperatura (ºC)
28 29 27 24 20 19 18 21 22 24 28 30
2) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando:
a) um gráfico de colunas;b) um gráfico de setores.
Oceano Antártico Ártico Atlântico Índico Pacífico
Área(milhões km2)
36,8 23,2 199,4 137,9 342,7
3) Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm):
151 – 152 – 154 – 155 – 158 – 159 – 159 – 160 – 161 – 161161 – 162 – 163 – 163 – 163 – 164 – 165 – 165 – 165 – 166166 – 166 – 166 – 167 – 167 – 167 – 167 – 167 – 168 – 168168 – 168 – 168 – 168 – 168 – 168 – 168 – 168 – 169 – 169169 – 169 – 169 – 169 – 169 – 170 – 170 – 170 – 170 – 170170 – 170 – 171 – 171 – 171 – 171 – 172 – 172 – 172 – 173
26
2 4 6 8 10 12
Classes
173 – 173 – 174 – 174 – 174 – 175 – 175 – 175 – 175 – 176176 – 176 – 176 – 177 – 177 – 177 – 177 – 178 – 178 – 178179 – 179 – 180 – 180 – 180 – 180 – 181 – 181 – 181 – 182182 – 182 – 183 – 184 – 185 – 186 – 187 – 188 – 190 – 190
Pede-se determinar:a) a amplitude amostral;b) o número de classes;c) a amplitude das classes;d) os limites das classes;e) as freqüências absolutas das classes;f) as freqüências relativas;g) os pontos médios das classes;h) a freqüência acumulada;i) o histograma – polígono de freqüência;j) os gráficos de freqüência acumulada.
Medidas de Posição ou de Tendência Central __
1) Média Aritmética ( X)
a) Para dados não agrupados:
Exemplo:Calcular a média dos números abaixo:1, 2, 3, 4, 6, 8, 10. __ X = ?
27
b) Para dados tabulados (média ponderada):
b.1) Sem intervalo de classes:
xi Fi xi. Fi2 23 44 35 46 2
__ X = ? b.2) Com intervalo de classes:
CLASSE Fi Xi xi. Fi2 | 4 24 | 6 36 | 8 4
8 | 10 5
__ X = ?
Exemplo: Um aluno tirou 9,0 em uma prova de peso 2 e 6,0 em um trabalho de peso 1. Qual a nota média do aluno?
Desvio em relação à média (di)
É a diferença entre o valor (xi) e a média, ou seja,
Exemplo: Calcule o desvio (di) dos valores abaixo:
a) x i: {2, 3, 4, 5}. xi
234
28
5b)
xi Fi xi . Fi
2 23 44 35 46 2
c)
CLASSES Fi xi xi . Fi
2 | 4 24 | 6 36 | 8 4
8 | 10 5
Moda
É o valor mais freqüente da distribuição.
Determine a Moda nos exemplos abaixo:
a) Para dados não tabulados:
X = {1, 1, 2, 2, 3, 4, 4, 4, 5}
b) Para dados tabulados
b.1) Não agrupados
xi Fi1 32 73 24 15 6
29
Mediana
Medida de tendência central que divide uma série ordenada (Rol) em duas partes iguais.
É também uma separatriz.
(__________Md__________)
a) Para dados não tabulados:
a.1) Para um número ímpar de valores:Exemplo:x = {1, 3, 5, 6, 8, 11, 13, 16, 17} n = 9 elementos.
Md = 8, a mediana é o elemento central.
posição do elemento central: = = 5 ,ou seja,
a mediana é o 5º elemento.a.2) Para número par de valores:
Exemplo:x = {1, 3, 5, 7, 9, 11, 13, 15} n = 8 elementos
posição dos elementos centrais: = = 4 (4º elemento) = 7
e = =5 (5º elemento) = 9
A mediana é a média aritmética dos elementos centrais:
Md = 7 + 9 = 8 2
b) Para dados tabulados:b.1) Dados discretos (Não agrupados em classes):
Exemplo: Determine a mediana
30
50%50%
xi Fi Fac2 54 106 158 12
10 512 3
Exercício: Calcular a Md dos dados abaixo:
xi Fi1 23 35 47 49 3
11 3
Medidas Separatrizes:
a) PERCENTIS (Pi):
Dividem os dados em 100 partes iguais. Cada parte contém 1% dos dados.
Procedimento do cálculo:
1º) Calcular o elemento do percentil:
onde:n é o número de dados;
i é o percentil desejado, por exemplo:
i = 1 para o cálculo do primeiro percentil;
31
i = 2 para o cálculo do segundo percentil, e assim por diante, até o último percentil, em que i = 99.
2º) Determinar a classe do percentil (de acordo com o elemento do percentil e com a frequência acumulada).
3º) Calcular o valor do percentil:
onde:Pi valor do percentil;EPi elemento do percentil;Li limite inferior da classe do percentil;h amplitude da classe do percentil;Fant.ac Freqüência anterior (acumulada) à classe do percentil;Fpi Freqüência absoluta (simples) da classe do percentil;
Exemplo: Para os dados abaixo, determine:
a) percentil 25;b) o 20º percentil;c) o valor que divide os dados em duas partes iguais (MEDIANA);d) o valor que divide separa os em 35% mais novos do restante;e) o valor que divide separa os em 65% mais velhos do restante;
IDADES(anos) Fi Fac2 | 4 3 34 | 6 5 86 | 8 7 15
8 | 10 4 1910 | 12 1 20
Exercício:Calcular a mediana
32
Classes Fi Fac1 | 3 5 53 | 5 10 155 | 7 5 207 | 9 10 30
9 | 10 5 35
Quartis (Qi)
Dividem os dados em 4 partes iguais. Cada parte contendo 25% dos dados.
25% 25% 25% 25% Q1 Q2 Q3
Portanto, 1º quartil é igual ao percentil 25; 2º quartil é igual ao percentil 50 (mediana); 3º quartil é igual ao percentil 75;
Exemplo: Determine o 2º Quartil:
Classe Fi Fac1 | 3 3 33 | 5 5 85 | 7 8 167 | 9 5 21
9 | 11 2 2311 | 13 3 26
Decis (Di)
Dividem os dados em 10 partes iguais:
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Portanto, 1º decil é igual ao percentil 10;
33
2º decil é igual ao percentil 20 e, assim por diante, até o último (9º) decil, ;
Exercício: Determine o 3º Decil da tabela anterior:
Obs.:
Exercício:Ao aplicar uma prova de estatística numa turma de 120 alunos, encontrou-se o resultado:
Nota dos Alunos Número de Alunos30 | 40 140 | 50 350 | 60 1160 | 70 2170 | 80 4380 | 90 32
90 | 100 9
Calcule:a) Os quartis.b) O grau mais baixo que poderia ser obtido pelos 25% melhores alunos da
turma.c) A nota que separa os 75% melhores alunos dos outros.d) A nota que separa os 70% melhores alunos dos outros.e) A nota que separa os 35% piores alunos dos outros.
34
P50 = D5 = Md = Q2
MEDIDAS de DISPERSÃO:
São medidas utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno da média.
(média)
Exemplo 46: Sejam as séries: a) 20, 20, 20 = 20 b) 15, 10, 20, 25, 30 = 20
Obs.: a série b possui maior dispersão do que a série a
I) Amplitude Total (R)
35
DISPERSÃO
R = maior valor – menor valor
Exemplo 1: Determine a amplitude dos dados abaixo:Idades de pessoas: {1, 3, 5, 7, 9, 11, 13}
R = 13 - 1R = 12
II) Variância
CONCEITO: É a média aritmética dos quadrados dos desvios calculados em relação à média.
É uma medida que caracteriza o grau de concentração ou de variabilidade dos dados em relação à média aritmética.
A variância possui a dimensão dos dados ao quadrado.
Lógica do Cálculo das medidas de dispersão:
Para compreender o conceito de variância e das outras medidas de dispersão, inicialmente vamos calcular os desvios das notas de dois alunos em relação à média das provas, de acordo com o exemplo a seguir:
Exemplo 2: Estude os desvios das notas dos alunos A e B
Nota 1 Nota 2 MédiaDesvio
da Nota 1
Desvio da
Nota 2
Soma dos Desvios
Aluno A 2 8 5 2-5= -3 8-5= 3 ZeroAluno B 4 6 5 4-5= -1 6-5= 1 Zero
Os desvios na tabela acima foram calculados da seguinte forma:
Cada desvio é a diferença entre o valor (xi) e a média ( ), ou seja,
Exemplo 3: Calcule os desvios (di) dos valores abaixo:
36
xi: {2, 4, 6, 8, 10, 12} estes números podem estar representando a idade de pessoas ou outra variável qualquer.
Solução:
1º) Calcular a média aritmética:
2º) Calcular o valor dos desvios (di), de acordo com a tabela:
xi
2468
1012
TOTAL
Exemplo 4: Calcule a variância, o desvio padrão e o coeficiente de variação dos dados do exemplo 49, da seguinte forma:
a) Cálculo da variância (VAR):
, ou seja,
b) Cálculo do Desvio Padrão (DP):
CONCEITO: É a raiz quadrada da variância, ou seja,
.
Obs.: O desvio padrão possui a mesma dimensão dos dados.
Portanto:
37
c) Cálculo do Coeficiente de Variação (CV):
CONCEITO: É a relação entre o desvio padrão e a média aritmética dos dados. É utilizado para comparação entre séries distintas de dados.
Obs.: É uma medida de dispersão relativa e sua representação é percentual.
Portanto:
A dispersão dos dados pode ser alta, média ou baixa de acordo com o valor de CV. E pela tabela a seguir, o percentual de 48,8% é considerado de alta dispersão, isto é, os dados do exemplo 49 apresentam alta dispersão.
Nível de Dispersão Valor do CVBaixa dispersãoMédia dispersãoAlta dispersão
Exemplo: Estude a dispersão das notas dos alunos A e B (apresentadas no exemplo 48)
Nota 1 Nota 2 MédiaAluno A
2 8 5
Aluno B
4 6 5
Solução:
Aluno A28
TOTAL
Aluno B46
38
TOTAL
NOTAÇÃO PARA AS MEDIDAS DE DISPERSÃO:
Variância Populacional 2
Variância Amostral S2
Desvio Padrão Populacional Desvio Padrão Amostral S
Coeficiente de Variação Amostral ou Populacional CV
QUADRO RESUMO DE FÓRMULAS PARA AS MEDIDAS DE DISPERSÃO:
POPULAÇÃO AMOSTRA
Variância
1n
xxS
2i2
Dados não Tabulados (sem Fi)
Dados Tabulados (com Fi)
Desvio Padrão( )
Coeficiente de Variação
CV = . 100
CV = S . 100
Exemplo: Verifique se os dados a seguir possuem alta, média ou baixa dispersão
39
a) x = {1, 3, 6, 8}
X
1368
b)
Classe Fi1 | 3 23 | 5 45 | 7 47 | 9 2
Exemplo:Com base na amostra de notas de uma turma, verifique o nível de dispersão da turma (alta, média ou baixa dispersão).
Notas Fi
2 | 4 14 | 6 36 | 8 5
8 | 10 310 | 12 1
40
PROBABILIDADE
1) Conceitos Básicos:
a) Espaço Amostral (S): É o conjunto de todos os resultados possíveis de um experimento aleatório. É conhecido como conjunto Universo.
Exemplo: Jogar um dado.O espaço amostral é: S: {1, 2, 3, 4, 5, 6}.
b) Eventos: São subconjuntos do espaço amostral. São os resultados de um experimento. Normalmente expressos por letras maiúsculas do alfabeto.
Exemplo: Jogar um dado.Um evento poderia ser: A: {Resultado par}: {2, 4, 6}.Outro evento poderia ser: B: {Resultado ímpar}: {1, 3, 5}.
c) Experimentos Aleatórios: São experimentos que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.
Exemplo: Jogar uma moeda 1 vez para o ar. Neste caso, teríamos:Espaço amostral S: {cara, coroa} ou S: {c, k}.Evento A: {O resultado será cara}Evento B: {O resultado será coroa}
d) Tipos de Eventos
d.1) Complementar: São todos os resultados possíveis do espaço amostral que não fazem parte do evento.Evento A·Complementar
S
Exemplo: Joga-se um dadoS: {1, 2, 3, 4, 5, 6}A: {par}
: {1, 3, 5}
41
A
d.2) Mutuamente excludentes: São eventos que não têm elementos em comum, ou seja, a ocorrência de um evento implica na não ocorrência do outro.
Exemplo: Joga-se um dadoS: {1, 2, 3, 4, 5, 6}A: {par}B: {2, 3, 4}C: {ímpar}
A e C são mutuamente excludentes {AC}= A e B não são mutuamente excludentesB e C não são mutuamente excludentes
Definição de probabilidade:
Dado um experimento aleatório E, e S o espaço amostral, a probabilidade de um evento A, denotada por P(A), é uma função definida em S que associa a cada evento um número real, satisfazendo aos axiomas:
I) 0 P(A) 1II) P(S) = 1III) Se A e B forem eventos mutuamente excludentes {AB}= , então P(AB) = P(A) + P(B)
Definição clássica de probabilidade (para eventos equiprováveis):
P (A) = nº de vezes que o evento A pode ocorrer u nº de vezes que o espaço amostral S ocorre
ou:
P (A) = NCF nº de casos favoráveis NCT nº de casos totais
Principais Teoremas:
1) Se é o complemento de P(A) + P( ) = 12) Se A e B são dois eventos quaisquer: P(AB) = P(A) + P(B) – P(AB)
Exemplo: Joga-se um dado.
42
Seja A o evento: {o resultado é par} B o evento: {2, 3}.
Determine:a) P(A)b) P( )c) P(B) d) P( )e) P(AB)f) P(AB)
LEMBRETE: A ou B A BA e B A B
TÉCNICAS DE CONTAGEM
Exercício:Em um lote existem 12 peças, 4 são defeituosas: 2 peças são retiradas aleatoriamente e sem reposição. Calcule a probabilidade de:A) ambas serem defeituosas;B) ambas não serem defeituosas;C) ao menos uma ser defeituosa.
2 serão retiradas sem reposição
43
4 D8 P
B) Diagrama de Árvore
Exemplo: Resolver o exercício anterior utilizando o diagrama de árvore.
P 7/11
4/11 8/12 P
D 8/11 P
4/12
D 3/11
D
Probabilidade Condicional
É a probabilidade de um evento ocorrer sabendo-se da ocorrência de outro evento.
Exemplo: Joga-se um dado. S: 1,2,3,4,5,6evento A: sair nº 3 P(A)=?evento B: sair nº ímpar P(B) = ?
evento AB: 3P(AB) = ?
A probabilidade de A ocorrer sabendo que B já ocorreu é:
P(A/B) = 1/3 NCF (A B) (S) NCF (B) (S)
O espaço amostral fica reduzido ao evento B: 1 3,5, então:
P (A/B) = P(A B) = 1/6 = 1 P(B) 3/6 3
44
Portanto: P (A/B) = P (A B)
P(B) P (B/A) = P (A B)
P(A)Ou seja,
P(AB) = P(A/B). P (B) P(AB) = P(B/A). P (A)
Lista de Exercícios de Probabilidade e Estatística
1) Um grupo de 15 elementos apresenta a seguinte composição:
Homens MulheresMenores 5 3Adultos 5 2
Um elemento é escolhido ao acaso. Pergunta-se:a) Qual a probabilidade de ser homem?b) Qual a probabilidade de ser adulto?c) Qual a probabilidade de ser menor e mulher?d) Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de
ser homem?e) Dado que a escolhida é mulher, qual a probabilidade de ser menor?
2) Determine a probabilidade de cada evento:a. pelo menos uma cara aparece no lançamento de 3 moedas;
3) Numa urna são misturadas dez bolas numeradas de 1 a 10. Duas bolas são retiradas (a,b) sem reposição. Qual a probabilidade de
a + b = 10?
4) Um lote é formado por 10 peças boas, 4 com defeitos e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que:
a. ela não tenha defeitos graves;b. ela não tenha defeitos;c. ela, ou seja boa, ou tenha defeitos graves.
45
5) Considere o mesmo lote do problema anterior. Retiram-se 2 peças ao acaso. Qual a probabilidade de que:a. ambas sejam perfeitas;b. pelo menos uma seja perfeita;c. nenhuma tenha defeito grave;d. nenhuma seja perfeita
6) Uma urna contém 5 bolas brancas e 6 pretas. Três bolas são retiradas. Calcular a probabilidade de:
a. todas pretas;b. exatamente uma branca;c. ao menos uma preta
8) Numa classe existem 5 alunos do 4º ano, 4 do 2º e 3 do 3º ano. Qual a probabilidade de serem sorteados, ao mesmo tempo, 2 alunos do 2º ano, 3 do 4º e 2 do 3º?
Exercícios – Série II – Capítulo 1
1) As probabilidades de 3 jogadores marcarem um penalty são
respectivamente . Se cada um “cobrar” uma única vez, qual a
probabilidade de:a. todos acertarem;b. apenas um acertar;c. todos errarem.
2) Numa bolsa temos 5 moedas de R$ 1,00 e 4 de R$ 0,50. Qual a probabilidade de, ao retirarmos duas moedas, obtermos R$ 1,50?
3) Uma urna contem 5 bolas pretas, 3 vermelhas e 2 brancas. Foram extraídas 3 bolas com reposição. Qual a probabilidade de:
a) terem sido duas bolas pretas e uma vermelha?b) todas serem da mesma cor?
4) A probabilidade de uma mulher estar viva daqui a 30 anos é e de seu
marido . Calcular a probabilidade de:
a. apenas o homem estar vivo;b. somente a mulher estar viva;
46
c. pelo menos um estar vivo;d. ambos estarem vivos.
Exercícios – Série III – Capítulo 1
1. Uma moeda é lançada três vezes. Ache a probabilidade de se obterem:
a) três caras;b) duas caras e uma coroa;c) uma cara;d) pelo menos uma coroa;e) nenhuma cara.
2. A probabilidade de o aluno X resolver esse problema é e a do aluno Y
é . Qual probabilidade de que o problema seja resolvido?
3. Um grupo de 100 pessoas apresenta, de acordo com o sexo e filiação partidária, a seguinte composição:
Partido X Partido Y
Homens 21 39Mulheres 14 26
Calcular:a. a probabilidade de um escolhido ser homem;b. a probabilidade de um escolhido ser mulher do partido Y;c. a porcentagem dos partidários do Y;d. a porcentagem dos homens filiados à X;e. se o sorteado for da X, qual a probabilidade de ser mulher;f. se o sorteado for homem, qual a probabilidade de ser do Y.
47