probabilidade e estatística - aula 02
TRANSCRIPT
1
Probabilidade e EstatísticaESTATÍSTICA DESCRITIVA
SÉRIES, TABELAS, GRÁFICOS E DISTRIBUIÇÃO DE FREQUÊNCIA
Aula 02
Prof.: Augusto Junior
2Aula 02
Prof.: Augusto Junior
Estatística Descritiva Parte da estatística que desenvolve e disponibiliza
métodos para resumo e apresentação dos dados coletados;
Objetivo: Facilitar a compreensão e a utilização da informação contida;
Em resumo: tem por finalidade a utilização de tabelas, gráficos, diagramas, distribuições de frequência e medidas descritivas para: Examinar o formato geral da distribuição dos dados; Verificar a ocorrência de valores atípicos; Identificar valores típicos que informem sobre o centro
da distribuição; Verificar o grau de variação presente nos dados.
3Aula 02
Prof.: Augusto Junior
IMPORTANTE
A validade do resumo dos dados está intimamente ligada à quantidade de informação disponível e à qualidade de obtenção dos dados.
Pode-se pensar que todo método descritivo possui uma entrada, os dados, e uma saída, que pode ser uma medida descritiva ou um gráfico.
Se a entrada é deficiente a saída também será de má qualidade.
4Aula 02
Prof.: Augusto Junior
Apresentação de dados:Séries Estatísticas A reunião, ou agrupamento, de dados estatísticos,
quando apresentados em tabelas ou em gráficos, para apreciação ou investigação.
Resumem um conjunto ordenado de observações através de três fatores fundamentais: Tempo: Referência à data, ou a época, em que o
fenômeno foi investigado; Espaço: Referência ao local, ou região, onde o fato
ocorreu; Espécie: Referência ao fato, ou fenômeno, que está
sendo investigado e cujos valores numéricos estão sendo apresentados.
As séries estatísticas são classificadas de acordo com o fato que estiver variando, podendo ser simples, mistas e por distribuição de frequências.
5Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Simples
São aquelas em que apenas um fator varia. Podem ser de três tipos:
Histórica; Geográfica; Especificativa.
Aula 02
Prof.: Augusto Junior
6Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Simples Séries Históricas (temporal, cronológica, evolutiva)
Onde varia o tempo, permanecendo fixos o espaço e a espécie do fenômeno estudado.
7Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Simples Séries Geográficas (territorial ou regional)
Onde varia o espaço, permanecendo fixos o tempo e a espécie do fenômeno estudado.
8Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Simples Séries Especificativas (qualitativa ou categórica)
Onde varia o espécie do fenômeno estudado, permanecendo fixos o tempo e o espaço.
9Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Mistas São aquelas em que mais de um fator varia, ou
um mesmo fator varia mais de uma vez. Exemplo 1: Série histórica geográfica (ou
geográfica histórica).
10
Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Mistas Exemplo 2: Especificativa geográfica (ou
geográfica especificativa)
11
Aula 02
Prof.: Augusto Junior
Séries Estatísticas - Mistas Exemplo 4: Especificativa histórica geográfica
12
Aula 02
Prof.: Augusto Junior
Séries Estatísticas – Distribuição de Frequências Ocorre quando nenhum dos fatores varia; Os dados são agrupados em classes (intervalos com
limites predeterminados)segundo suas respectivas frequências;
Podem ser de dois tipos: Por dados de enumeração; Por dados de mensuração.
Este tipo de série será melhor estudado nos próximos capítulos.
13
Aula 02
Prof.: Augusto Junior
Por dados de enumeração
14
Aula 02
Prof.: Augusto Junior
Por dados de mensuração
15
Aula 02
Prof.: Augusto Junior
Tabela É a forma, não discursiva, de apresentar informações,
das quais o dado numérico se destaca como informação central.
Tem como finalidade apresentar os dados de modo ordenado, simples e de fácil interpretação, fornecendo o máximo de informação num mínimo de espaço.
A construção de uma tabela deve, no entanto, obedecer uma série de normas técnicas.
Estas normas podem ser encontradas na publicação do IBGE intitulada “Normas de Apresentação Tabular”.
O objetivo dessas normas é orientar a apresentação racional e uniforme de dados estatísticos na forma tabular.
16
Aula 02
Prof.: Augusto Junior
Tabela – Normas IBGE Composta por elementos essenciais e complementares. Elementos essenciais:
Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas; Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas; Casa, ou célula: Espaço destinado a um só número; Título: Conjunto de informações, as mais completas possíveis, que
respondem as perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
Elementos Complementares: Deverão situar-se no rodapé da tabela, na mesma ordem em que foram escritos abaixo.
Fonte: Indicação da entidade responsável pelo fornecimento dos dados, ou elabora a tabela;
Notas: Informações de natureza geral, destinadas a esclarecer o conteúdo das tabelas;
Chamadas: Informações específicas a esclarecer ou conceituar dados numa parte da tabela. Deverão estar indicados no corpo da tabela, em números arábicos entre parênteses, à esquerda das casa e à direita da coluna indicadora.
17
Aula 02
Prof.: Augusto Junior
Tabela
18
Aula 02
Prof.: Augusto Junior
Número da tabela Uma tabela deve ter um número para identifica-la sempre que o
documento apresentar uma ou mais tabelas, permitindo, assim, sua localização.
A identificação deve ser feita em números arábicos, de modo crescente, precedidos pela palavra Tabela, podendo ou não ser subordinada a capítulos ou seções de um documento.
Exemplo: Tabela 5, Tabela 10.4. Apresentação de dados numéricos
Toda tabela deve ter dado numérico para informar a quantificação de um fato específico observado, oqual deve ser apresentado em números arábicos;
A parte inteira dos dados numéricos deve ser separada por pontos ou espaços de três em três algarismos, da direita para a esquerda.
Exemplo: 12.243.527 ou 12 243 527. A separação da parte inteira da decimal deve ser feita por vírgula.
Exemplo: 25,67.
Tabela – Normas IBGE
19
Aula 02
Prof.: Augusto Junior
Sinais convencionais Sempre que um dado numérico não puder ser apresentado, o
mesmo deve ser substituído por um sinal convencional. Conforme o caso, a substituição de um dados numérico deve ser
feita por dos sinais abaixo: - (traço): Indica dado numérico igual a zero não resultante de
arredondamento; .. (dois pontos): Indica que o dado numérico não se aplica; ... (três pontos): Indica dado numérico não disponível; X (xis): Indica dado numérico omitido a fim de evitar individualização
da informação; 0, 0,0, 0,00: Indica dado numérico igual a zero resultante de
arredondamento; ? (interrogação): Quando houver dúvida sobre a veracidade da
informação. Quando uma tabela contiver sinais convencionais, estes deverão
ser apresentados em nota geral com seus respectivos significados.
Tabela – Normas IBGE
20
Aula 02
Prof.: Augusto Junior
Arredondamento Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica
inalterado o último algarismo a permanecer. Exemplo: 48,32 48,3
Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8, ou 9, aumenta-se de uma unidade o último algarismo a permanecer.
Exemplo: 94,27 94,3 Unidade de medida
Uma tabela deve ter unidade de medida, inscrita no cabeçalho ou nas colunas indicadoras, sempre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica dos dados numéricos.
Esta indicação deve ser feita com símbolos ou palavras, entre parênteses.
Exemplos: (m) ou (metros), (t) ou (toneladas), (R$) ou (reais). Quando os dados numéricos forem divididos por uma constante, esta
deve ser indicada por algarismos arábicos, símbolos, ou palavras, entre parênteses, precedendo a unidade de medida, quando for o caso.
Exemplos: (1.000 t) – indica dados em toneladas dividas por mil; (1.000 R$) – indica dados em reais divididos por mil; (%) ou (percentual) – indica dados proporcionais a cem.
Tabela – Normas IBGE
21
Aula 02
Prof.: Augusto Junior
Classe de frequência É cada um dos intervalos não superpostos em que se divide uma
distribuição de frequências. Toda classe deve ser apresentada, sem ambiguidade, por extenso ou
com notação Toda classe que inclui o extremo inferior do intervalo (EI) e exclui o
extremo superior (ES), deve ser apresentada em uma destas formas:EI I– ES ou [EI; ES)
Apresentação de tempo Toda série histórica consecutiva deve ser apresentada por seus
pontos inicial e final, ligados por hífen (-). Exemplos: 1812-912: Quando varia o século; 1950-58: Quando variam os
anos dentro de um mesmo século; out 2013 – set 2014: Quando variam os meses dentro de anos.
Toda série histórica não consecutiva deve ser ligadapor seus pontos inicial e final por barra (/).
Exemplos: 1990/1997 – Indica dados não apresentados para, pelo menos, um ano do intervalo; abr 2000 / abr 2001 – Indica dados não apresentados para, pelo menos, um mês do intervalo.
Tabela – Normas IBGE
22
Aula 02
Prof.: Augusto Junior
Apresentação da tabela O corpo da tabela deve ser delimitado com, pelo menos,
três traços horizontais; Recomenda-se não delimitar as tabelas à direita e à
esquerda por traços verticais; É facultativo o uso de traços verticais para a separação de
colunas no corpo da tabela. Quando, por excessiva altura, a tabela tiver que ocupar
mais de uma página, não deve ser limitada inferiormente, repetindo-se o cabeçalho na página seguinte;
Deve-se usar no alto do cabeçalho a palavra “continuação” ou “conclusão”, conforme o caso.
Se possuir muitas linhas e poucas colunas, poderá ser apresentada em duas ou mais partes dispostas lado a lado e separadas por traço duplo;
A disposição da tabela deve estar na posição normal de leitura. Caso não seja possível, a apresentação será feita de forma que a rotação da página seja no sentido horário.
Tabela – Normas IBGE
23
Aula 02
Prof.: Augusto Junior
Tabela – Normas IBGE
24
Aula 02
Prof.: Augusto Junior
Gráficos É um outro modo de apresentar os dados
estatísticos encontrados sob uma forma ilustrada. Mais eficiente.
Essencialmente, é uma figura construída a partir de uma tabela;
Porém, gráficos e tabelas se prestam a objetivos distintos, de modo que a utilização e uma não exclui a outra Enquanto a tabela fornece uma idéia mais precisa e
organizada, possibilitando uma inspeção mais rigorosa dos dados;
Os gráficos são mais indicados para situações que visem proporcionar uma visualização mais rápida e maior facilidade de compreensão do comportamento do fenômeno em estudo.
25
Aula 02
Prof.: Augusto Junior
GráficosNormas para Representação Geralmente, são construídos num plano cartesiano ortogonal.
A variável independente é localizada no eixo horizontal (x); A variável dependente é localizada no eixo vertical (y);
Iguais intervalos para medida deverão corresponder a iguais intervalos para as escalas. Exemplo: Se, ao intervalo entre 10 e 15 Kg corresponde a 2 cm na
escala, ao intervalo entre 40 e 45 Kg também deverá ser de 2 cm, enquanto o intervalo entre 40 e 50 Kg corresponderá 4 cm.
Deverá possuir toda informação necessária à sua compreensão, para que não precise de auxílio de texto extra. Título, fontes, notas e legenda.
Deverá possuir formato aproximadamente quadrado. Evitar que problemas de escala interfiram na correta interpretação.
26
Tipos de gráficos Estereogramas
Gráficos onde as grandezas são representadas por volumes. Geralmente são construídos num sistemas de eixos bidimensional, mas podem
ser feitos num sistema tridimensional para ilustrar a relação entre três variáveis.
27
Tipos de gráficos Cartogramas
Representações em cartas geográficas (mapas)
28
Tipos de gráficos Pictogramas (Gráficos pictóricos)
Gráficos puramente ilustrativos, construídos de modo a ter apelo visual; Dirigido a um público grande e heterogêneo; Não deve ser utilizado em situações que exijam maior precisão.
29Tipos de gráficos
Diagramas Gráficos geométricos de duas dimensões, de fácil
elaboração e grande utilização; Subdivisões
Gráfico de colunas; Gráfico de barras; Gráfico de linhas, ou curvas; Gráfico de setores.
30
Gráfico de Colunas Grandezas comparadas através de retângulos, de mesma largura,
dispostos verticalmente e com alturas proporcionais às grandezas.
31Gráfico de Barras
Segue as mesmas instruções do gráfico de colunas, tendo a diferença de que os retângulos são dispostos horizontalmente.
Usado quando as inscrições dos retângulos forem maiores que a base dos mesmos.
32
Gráfico de Linhas, ou Curvas
Os pontos são postos no plano de acordo com as suas coordenadas, e a seguir são ligados por segmentos de reta.
Muito utilizado em situações em situações onde o tempo é a variável independente.
33
Gráfico em Setores Também chamado de gráfico de “Pizza”. Recomendado para situações em que se deseja evidenciar o
quanto cada informação representa do total. Consiste num círculo, que representa o 100%, subdividido
em quantas partes for necessário à representação.
34
Aula 02
Prof.: Augusto JuniorDistribuição de
frequênciasForma eficiente de resumir e apresentar uma grande quantidade de dados.Uma das formas mais comuns de resumir e apresentar os dados é através de tabelas de distribuição de frequências, que são de dois tipos:Classificação simples;Classificação cruzada.
35
Aula 02
Prof.: Augusto Junior
Tabelas de classificação simples
Tabelas de frequência relativa a uma variável. As características da tabela variam de acordo
com a variável de estudo. Variável discreta (ou categórica):
São obtidas as frequências de ocorrência de cada nível dessa variável;
Variável contínua Primeiro: obtém-se os intervalos de mesma
amplitude; Segundo: contagem dos valores que ocorrem em
cada intervalo.
36
Aula 02
Prof.: Augusto Junior
Construção da tabela – Variáveis discretas
Envolve apenas dois passos 1º Passo – Ordenar os níveis do fator.
Colocá-los em ordem crescente de grandeza (rol). O número de cada classe da distribuição será
representado por j, tal que j = 1, 2, ..., k. 2º Passo – Contar o número de vezes que o
dados daquela classe se repete
37
Aula 02
Prof.: Augusto Junior
Construção da tabela – Variáveis categóricasExemplo 1: Seja a variável em estudo o tamanho do macacão de trabalho, observado em 60 trabalhadores de uma determinada empresa. As observações foram:
P, M, G, M, P, M, P, M, P, G, M, M, G, M, M, M, GG, M, G, GG, G, GG, M, G, M, P, M, GG, M, M, G, P, GG, P, M, M, M, GG, M, G, P, P, G, M, M, P, G, M, M, G, G, G, P, M, G, M, M, P, M, G.
Podemos observar que trata-se de uma variável qualitativa ordinal (categórica). Quatro níveis (P, M, G e GG). Logo, o número de classes
(k) é igual a 4 (quatro).
38
Aula 02
Prof.: Augusto Junior
Construção da tabela – Variáveis categóricas 1º passo: ordenação dos níveis da variável.
2º passo: Contagem do tamanho dos macacões em cada nível, que chama-se frequências absolutas ().
A partir de podemos obter outras frequências de interesse nessa distribuição: Frequência absoluta acumulada (): Números de elementos acumulados até a
classe j; Frequência relativa (): Expressa a proporção de elementos na classe; Frequência relativa acumulada (): Proporção de elementos acumulados até a
classe j.
Número da classe (j)
Classe
1 P2 M3 G4 GG
39
Aula 02
Prof.: Augusto Junior
Construção da tabela – Variáveis categóricasTabela 1: Frequência do tamanho do macacão de trabalho utilizado pelos trabalhadores de uma determinada empresa.
j Classe
1 P 12 12 0,2 0,2
2 M 27 39 0,45 0,65
3 G 15 54 0,25 0,9
4 GG 6 60 0,1 1
Total (Σ) 60 - 1 -
40
Aula 02
Prof.: Augusto Junior
Construção da tabela – Variáveis discretasExemplo 2: Seja a variável em estudo o número de animais portadores de brucelose em 350 propriedades rurais. As observações foram:
2, 5, 6, 0, 4, 4, 3, 5, 1, 2, 1, 3, 4, 4, 2, 2, 3, 2, 1, 5, 6, 4, 2, 1, 3...
Podemos observar que trata-se de uma variável quantitativa discreta. De acordo com os dados observados, levando-se em
conta o total, foram detectados sete valores diferentes para esta variável.
Sete níveis (0, 1, 2, 3, 4, 5, 6). Logo, serão geradas 7 classes.
41
Aula 02
Prof.: Augusto Junior
1º passo: Ordenação dos níveis da variável
Construção da tabela – Variáveis discretas
Número da classe (j)
Classe
1 02 13 24 35 46 57 6
42
Aula 02
Prof.: Augusto Junior
2º passo: Determinação das frequências de cada classeTabela 2: Frequência do número de animais portadores de brucelose em 350 propriedades rurais. UFPel, 2001.
Construção da tabela – Variáveis discretas
j Classe
1 0 55 55 0,1571 0,15712 1 60 115 0,1714 0,32863 2 112 227 0,32 0,64864 3 82 309 0,2343 0,88295 4 31 340 0,0886 0,97146 5 8 348 0,0229 0,99437 6 2 350 0,0057 1,0000
Total (Σ) 350 - 1,0000 -
43
Aula 02
Prof.: Augusto Junior
Tão importante quanto saber construir uma tabela é saber interpretar os seus valores. significa que, das 350 propriedades rurais consultadas,
82 possuem três animais portadores de brucelose; significa que, das 350 propriedades rurais consultadas,
227 possuem menos de três animais portadores de brucelose;
significa que a proporção de propriedades rurais que possuem apenas um animal portador de brucelose é de 0,1714 (em percentual: 17,14%);
significa que a proporção de propriedades rurais com menos de quatro animais portadores de brucelose é de 0,9714 (em percentual: 97,14%).
Construção da tabela – Variáveis discretas
44
Aula 02
Prof.: Augusto Junior
Construção da tabela- Variáveis contínuas Ao contrário das variáveis discretas, essas assumem,
em geral, muitos valores e, em sua grande maioria, diferentes uns dos outros.
Para sanar problemas dessa natureza, as tabelas de distribuição de frequências para variáveis contínuas são construídas de modo que cada classe possua um intervalo de valores da variável.
Obs.: Devemos observar que, no entanto, em algumas situações pode acontecer de uma variável discreta também assumir vários valores diferentes.Nesses casos, também adotamos a formação de intervalos dos dados discretos para uma melhor visualização da tabela.
45
Aula 02
Prof.: Augusto Junior A construção da tabela de variáveis contínuas:
1º passo: ordenar o conjunto de dados, ou seja, colocar os dados brutos em sequência de grandeza (rol);
2º passo: determinar o número de classes da tabela. Modo geral: Regras de determinação:
Regra empírica:
Fórmula de Sturges:
Construção da tabela- Variáveis contínuas
46
Aula 02
Prof.: Augusto Junior
3º passo: determinar a amplitude do intervalo. Utilizaremos a seguinte expressão:
i = amplitude do intervalo; = ES – EI : amplitude total do conjunto de valores; k = número de classes.
Convencionamos, também, que o arredondamento do número de classes (k), ou na amplitude do intervalo (i) é sempre feito pra cima.
Construção da tabela- Variáveis contínuas
47
Aula 02
Prof.: Augusto Junior 4º passo: Construir os intervalos de classe.
O limite inferior sempre será o menor valor do conjunto de dados ();
O limite superior será o limite inferior acrescido do valor da amplitude do intervalo de classe (i);
Na sequência, o limite inferior da próxima classe será o limite superior da classe anterior e o limite superior será esse limite inferior acrescido da amplitude do intervalo.
Construção da tabela- Variáveis contínuas
Número da classe (j) Classe1 2 ... ...K
48
Aula 02
Prof.: Augusto Junior Em distribuições de frequência de variáveis contínuas,
geralmente existe o interesse em uma outra quantidade conhecida como o ponto médio ou o centro da classe ().
A obtenção desse valor dá-se pela expressão:
Onde:
Construção da tabela- Variáveis contínuas
49
Aula 02
Prof.: Augusto Junior
ExemploTomemos a seguinte variável:X = peso ao nascer (em Kg) de 60 bovinos machos, para qual os valores observados (e já ordenados) foram:16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39.
Construção da tabela- Variáveis contínuas
50
Aula 02
Prof.: Augusto Junior
Sendo o peso uma variável contínua, não podemos considerar cada valor sendo uma classe.
Este valor deverá ser determinado e, neste exemplo, usaremos a fórmula de Sturges.
Como o número de classe tem que ser um número inteiro, teremos que arredondar o valor encontrado de forma a obtermos . Arredondamento para cima, conforme convencionado
anteriormente.
Resolução do Exemplo
51
Aula 02
Prof.: Augusto Junior
Obtendo a amplitude dos intervalos:
Com isso, podemos calcular o (i):
Resolução do Exemplo
52
Aula 02
Prof.: Augusto Junior
Construção dos intervalos de classe: Sabendo-se que o menor valor do conjunto
de dados é , o número de classes é e a amplitude do intervalo é , temos assim a tabela:
Resolução do Exemplo
Número da classe (j)
Classes
1 16,0 19,32 19,3 22,63 22,6 25,94 25,9 29,25 29,2 32,56 32,5 35,87 35,8 39,1
53
Aula 02
Prof.: Augusto Junior
Tabela 3: Frequência do peso ao nascer (em Kg) de 60 bovinos machos.
Resolução do Exemplo
j Classes
1 16,0 19,3 7 7 0,1167 0,1167 17,65
2 19,3 22,6 9 16 0,15 0,2667 20,95
3 22,6 25,9 15 31 0,25 0,5167 24,25
4 25,9 29,2 12 43 0,2 0,7167 27,55
5 29,2 32,5 9 52 0,15 0,8667 30,85
6 32,5 35,8 6 58 0,1 0,9667 34,15
7 35,8 39,1 2 60 0,0333 1,0000 37,45
Total (Σ) 60 - 1,0000 - -
54
Aula 02
Prof.: Augusto Junior
Algumas interpretações dessa tabela: significa que 15 dos 60 bovinos nasceram com peso
entre 22,6 e 25,9 Kg (exclusive); significa que 52 dos 60 bovinos nasceram com peso
entre 16,0 e 32,5 Kg (exclusive); significa que a proporção de bovinos que nasceram com
peso entre 19,3 e 22,6 Kg (exclusive) é de 0,15 (em percentual: 15%);
significa que a proporção de bovinos com peso entre 16,0 e 35,8 Kg (exclusive) é de 0,9667 (em percentual: 96,67%).
Resolução do Exemplo
55
Aula 02
Prof.: Augusto Junior
EXERCÍCIOS PROPOSTOS1- Os dados a seguir se referem ao números de pães não vendidos em uma certa padaria até a hora do encerramento do expediente:
0 0 4 2 0 1 0 2 0 41 0 0 3 2 0 1 0 0 02 0 0 1 0 0 3 2 1 70 1 0 0 2 0 0 3 2 1
Construa a distribuição de frequência para esses dados, obedecendo todos os passos para a sua criação.
56
Aula 02
Prof.: Augusto Junior
EXERCÍCIOS PROPOSTOS2- Os dados abaixo, em rol, referem-se aos valores gastos (em reais) pelas primeiras 50 pessoas que entraram em um determinado supermercado, no dia 01/01/2000:
3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,3918,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,4724,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,3738,64 38,98 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34
1º - O que é rol?2º - Faça a distribuição de frequência desses dados.
57
Aula 02
Prof.: Augusto Junior
Distribuição de frequênciasRepresentação gráfica Duas formas distintas e exclusivas:
Histograma; Polígono de frequências.
Histograma Conjunto de retângulos contíguos cuja base é igual a
amplitude do intervalo e a altura proporcional à frequência das respectivas classes.
Quando as variáveis são numéricas discretas os retângulos dão lugar a retas.
Polígono de frequências Segmentos de reta que unem os pontos cujas coordenadas
são os ponto médio e a frequência de cada classe; É fechado porque usa uma classe anterior a primeira e uma
posterior a última (ambas possuem frequência igual a zero).
58
Aula 02
Prof.: Augusto Junior
Representação gráficaHistograma
59
Aula 02
Prof.: Augusto Junior
Representação gráficaHistograma
60
Aula 02
Prof.: Augusto Junior
Representação gráficaPolígono de frequência
61
Aula 02
Prof.: Augusto Junior
Representação gráficaPolígono de frequência
62
Aula 02
Prof.: Augusto Junior
EXERCÍCIO PROPOSTOFaça a representação
gráfica (histograma e polígono de frequências, quando for o caso) das distribuições de frequências construídas nos exercícios anteriores (1 e 2).
63
Aula 02
Prof.: Augusto Junior
Tabelas de classificação cruzada
Tabelas de frequência relativa a duas, ou mais, variáveis, seja ela numérica ou categórica. Distribuição conjunta de frequências.
Existe um número razoável de tipos de tabelas e gráficos para esses casos.
64Frequência cruzada de
variáveis categóricas Conhecida, também, como tabela de dupla entrada, tabela de
associação ou tabela de contingência. Mesmas regras das que foram utilizadas para a construção da
tabela simples. Única diferença: a tabela agora apresenta duas, ou mais, margens,
que são os fatores (variáveis).
Aula 02
Prof.: Augusto Junior
65Frequência cruzada de
variáveis categóricas
A representação gráfica pode ser feita através de dois gráficos: Gráficos bi-dimensionais (diagramas); Gráficos tri-dimensionais (Estereogramas).
Aula 02
Prof.: Augusto Junior
66
Aula 02
Prof.: Augusto Junior
Gráfico bidimensional(Diagrama)
67
Aula 02
Prof.: Augusto Junior
Gráfico tridimensional(Estereograma)
68
Aula 02
Prof.: Augusto Junior
Frequência cruzada de variáveis numéricas As tabelas, nesse caso, são chamadas de
tabelas de correlação. A idéia básica de montagem é semelhante à
vista anteriormente, para a tabela simples. Primeiramente, classificamos as observações de
uma variável e, em seguida, dentro de cada classe da primeira, classificamos a outra variável.
69
Aula 02
Prof.: Augusto Junior
Frequência cruzada de variáveis numéricas
Exemplo 1: Observamos a classificação dos 400 alunos do Colégio C, segundo duas variáveis distintas: Nota em Estatística e Nota em Matemática.
0 4 4 7 7 100 4 32 25 5 624 7 20 183 82 285
7 10 7 27 19 53Totais 59 235 106 400
EstatísticaMatemática
Totais
Tabela 4: Distribuição dos alunos do Colégio C, segundo suas notas em Estatística e Matemática.
70
Aula 02
Prof.: Augusto Junior
Frequência cruzada de variáveis numéricas
Gráfico que melhor representa a situação anterior: Histograma em três dimensões (Estereogramas). Retângulos tornam-se paralelogramos; É pouco utilizado em trabalhos
científicos pela dificuldade de execução e interpretação.
71
Aula 02
Prof.: Augusto Junior
Frequência cruzada de variáveis numéricas
Exemplo 2: Estudar a relação do peso dos pais e o peso dos alunos. Foi realizada a medição de dez pais e dez alunos do Colégio C
Tabela 5: Peso de 10 pais e o peso de seus respectivos filhos.Observação (i) 1 2 3 4 5 6 7 8 9 10
Peso dos pais (xi) 78 65 86 68 83 68 75 80 82 66Peso dos filhos (yi) 60 52 68 53 65 57 58 62 65 53
72Frequência cruzada de
variáveis numéricas Gráfico que melhor
representa a situação anterior: Diagrama de dispersão de pontos. Fornece uma indicação
do tipo de relacionamento entre as duas classes.
Nesta situação, a tendência é que seja criada uma linha reta. Regressão linear. 60 65 70 75 80 85 90
50
52
54
56
58
60
62
64
66
68
70
Gráfico 1: Relação do peso dos pais e seus respectivos filhos - Colégio C
Peso dos pais
PEso
dos
filh
os