conceitos e tratamento informação (hc. 2011)

31
Tratamento de informação Helena Carvalho, 2011 Medidas descritivas de análise de dados, quadros e gráficos

Upload: ligia-isabel-militao-olo

Post on 26-Jul-2015

95 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Conceitos e Tratamento Informação (HC. 2011)

Tratamento de informação

Tratamento de informação

Helena Carvalho, 2011

Medidas

descritivas de

análise de dados,

quadros e

gráficos

Page 2: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 2 - Tratamento de informação

20

11

Índice

Estatística: alguns conceitos ……………..…………………..……………………………………………. 3

Classificação de variáveis ……………………………………………………………….………………….. 5

Taxas de Variação ……………………………………………………………………………………………… 11

Medidas de Tendência Central…………………………………………………………………………….. 12

Medidas de Dispersão………………………………………………………………………………………… 12

Observações Outliers…………………………………………………………………………………….……. 14

Assimetria e Curtose……………………………………………………………………………………….….. 16

Glossário de algumas Medidas Descritivas Univariadas……………………………..…………. 18

Apresentação de resultados: Quadros………………………………………………………………… 20

Apresentação de resultados: Gráficos………………….................................................................... 22

Page 3: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 3 - Tratamento de informação

20

11

ESTATÍSTICA: ALGUNS CONCEITOS

Definição (possível): A Estatística é a ciência que estuda as características

comuns dos indivíduos de um conjunto. Compreende um leque de princípios e

métodos de observação, recolha, análise, interpretação e apresentação de dados

numéricos.

Dois ramos na Estatística: descritiva e indutiva

UTILIDADE DA ESTATÍSTICA DESCRITIVA

Apresentação sintetizada da informação;

Interpretação;

Identificação das relações mais importantes entre variáveis (atributos

ou características)

UTILIDADE DA INFERÊNCIA ESTATÍSTICA

Retirar conclusões sobre um grupo – uma população ou universo – a

partir dos dados recolhidos de uma amostra.

POPULAÇÃO OU UNIVERSO

Todos os elementos que pertencem ao mesmo conjunto.

ex.: toda a população portuguesa = 10 milhões

ex.: todos os alunos que estão a frequentar Cursos no ISCTE

AMOSTRA

Sub-conjunto da população (de menor dimensão que a dimensão da

população).

ex.: recolher um sub-conjunto de alunos de cada Curso.

SONDAGEM

Estudo que envolve um processo de amostragem para conhecer uma

população

ex.: sondagem eleitoral antes do fecho das urnas.

ex.: estudo de opinião sobre os hábitos de leitura dos portugueses

Page 4: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 4 - Tratamento de informação

20

11

Os INQUÉRITOS POR QUESTIONÁRIO podem ser aplicados

i. Sobre a totalidade do universo (ex.: Censos)

ii. Sobre uma amostra

1. Parciais: se não se pretende inferir para o universo

2. Sondagem: retirar conclusões sobre o universo através de

uma amostra do universo.

AMOSTRA

i. Aleatória: a escolha dos indivíduos é aleatória e através da teoria das

probabilidades é possível determinar a margem de erro cometida. Neste caso

a amostra é representativa do universo, permitindo fazer extrapolações

(inferências);

ii. Não-aleatória: a selecção não é aleatória; a margem de erro pode ser

calculada, mas o seu valor não é fiável

iii. Erro de Amostragem: 2 fontes possíveis

1. O próprio processo de amostragem

2. O processo de escolha e recolha dos dados

PERIODICIDADE DA RECOLHA

1. Contínua, automática, permanente

2. Periódica

3. Ocasional

CRÍTICA DOS DADOS

Tratamento inicial dos dados (primários e/ou secundários), eliminando ou

tratando casos estranhos e corrigindo possíveis erros que podem enviesar as

conclusões. Por ex.: respostas omissas, outliers…

Page 5: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 5 - Tratamento de informação

20

11

CLASSIFICAÇÃO DE VARIÁVEIS

O Conceito de “Variável”

representa uma característica ou atributo da população ou da amostra.

1. VARIÁVEIS QUALITATIVAS (ou dados não-métricos)

São usadas categorias para a classificação dos dados. As categorias são

exaustivas e mutuamente exclusivas. As variáveis qualitativas podem ser:

a) NOMINAIS

As variáveis são operacionalizadas através de categorias e não é

possível estabelecer nenhuma ordenação entre elas. São apenas nomes.

Exs.: Sexo, Estado Civil, Profissão, Concelho de residência, etc. Não se

pode dizer que solteiro é mais que casado ou vice-versa…

III.3 Profissão Measurement Level: Nominal Value Label 1 Agricultor/ pescador 2 Operário não especializado 3 Operário especializado 4 Empregado serviços 5 Funcionário público 6 Professor

O Professor não é 3 vezes mais que o operário não especializado…

b) ORDINAIS

As variáveis são operacionalizadas através de categorias e é possível

estabelecer uma ordem entre elas, segundo uma relação descritível

mas não quantificável.

Ex.: Habilitações literárias

Grau de escolaridade N %

Básico 34 5,4

Secundário 159 25,3

Profissional/ Médio 109 17,4

Superior 326 51,9

Total 628 100,0

Page 6: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 6 - Tratamento de informação

20

11

Qualquer escala de Likert é uma variável qualitativa ordinal

Exemplo de escalas de Likert

com 4 níveis

1.4. Para cada uma das seguintes frases indique-nos o seu grau de concordância:

Discordo totalment

e

Discordo em parte

Concordo em parte

Concordo totalment

e NS/NR

a) O Estado deve intervir para regular a actividade económica.

1 2 3 4 99

b) A actividade económica deve ser entregue às empresas e ao livre funcionamento do mercado

1 2 3 4 99

com 5 níveis:

14. Quando faz compras quais são normalmente os aspectos que mais influenciam a sua compra? Dê as suas respostas usando a seguinte escala: 1 = não importante 2 = pouco importante 3 = importante 4 = muito importante 5 = extremamente importante

a. Preço f. Imagem da loja

b. Necessidade do produto g. Características do produto

c. Conveniência da localização da loja h. Promoção especial

d. Qualidade do produto i. Imagem da marca

e. Imagem do produto j. Publicidade

2. VARIÁVEIS QUANTITATIVAS (ou dados métricos)

As suas escalas de medida permitem a ordenação e a quantificação. Podem

assumir valores discretos ou contínuos. Podem ser:

DADOS DISCRETOS E DADOS CONTÍNUOS

a) DISCRETOS

Podem tomar um número finito ou infinito numerável de valores. Normalmente

tomam apenas valores inteiros.

Ex.: – “Quantas vezes por mês vai ao cinema?”

– “Vou 2 a 3 vezes por mês”

Dificilmente alguém responderia «vou cerca de 2,48 vezes ao cinema por mês…»

Page 7: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 7 - Tratamento de informação

20

11

b) CONTÍNUOS

Podem tomar um número infinito não-numerável de valores. Se podem tomar

dois valores possíveis, a e b, teoricamente podem tomar também quaisquer

valores entre a e b.

Ex.: – “Quanto é que tiveste no exame de Estatística I?”

– “Tive 14,6”

VVaarriiáávveeiiss iinnddeeppeennddeenntteess vveerrssuuss vvaarriiáávveeiiss ddeeppeennddeenntteess

Variáveis independentes – as que explicam (X)

Variáveis dependentes – as que são explicadas (Y)

X tem efeito em Y:

X Y

Page 8: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 8 - Tratamento de informação

20

11

EXERCÍCIO: CLASSIFICAÇÃO DE VARIÁVEIS

P1. Na sua opinião, qual é o número de filhos ideal que uma família deve ter? _____

P2. Quantos irmãos tem (ou teve)? ____

P3. Indique, por favor, o seu estado civil:

(1) Casado (2) Viúvo (3) Divorciado (4) Separado (5) Nunca casou (9) Não responde

P4. Qual é a sua religião? (1) Protestante (2) Católico (3) Judeu (4) Ateu / nenhuma (5) Outra (9) Não responde

P5. Existem várias opiniões sobre o que leva uma pessoa a ser bem sucedida profissionalmente. Das seguintes afirmações indique aquela que mais se aproxima da sua maneira de pensar.

(1) O trabalho arduo e empenho pessoal são os factores mais importantes (2) O trabalho arduo e empenho pessoal, mas também a sorte (3) A sorte é o factor mais importante (9) Outros factores / não responde

1. Sexo

Feminino 1

Masculino 2

2. Idade ___________

3. Tem filhos?

Sim 1 Passe à q4.1

Não 2 Passe à q5

4.1 Se sim quantos? ________

5. Indique, por favor, qual a sua área de licenciatura (nome do curso) _________________

6. Em que ano terminou a licenciatura? _____________

7. Actualmente, com que frequência utiliza a análise quantitativa de dados na sua vida profissional / de investigação?

Nunca utilizo 1

Utilizo raramente 2

Utilizo com alguma frequência 3

Utilizo muito frequentemente 4

Page 9: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 9 - Tratamento de informação

20

11

B23: EM POLÍTICA É COSTUME FALAR-SE DE ESQUERDA E DIREITA. COMO É QUE SE POSICIONARIA

NESTA ESCALA, EM QUE 0 REPRESENTA A POSIÇÃO MAIS À ESQUERDA E 10 A POSIÇÃO MAIS À

DIREITA?

Esquerda Direita (Recusa) (NS)

00 01 02 03 04 05 06 07 08 09 10 77 88

C2: Com que frequência convive com amigos, familiares ou colegas de trabalho?

Nunca 01

Menos de uma vez por mês 02

Uma vez por mês 03

Várias vezes por mês 04

Uma vez por semana 05

Várias vezes por semana 06

Todos os dias 07

(Recusa) 77

(Não sabe) 88

C7: Com que frequência se preocupa com a possibilidade de a sua casa ser assaltada?

Sempre ou quase sempre 1

Algumas vezes 2 PERGUNTAR A C8

Só às vezes 3

Nunca 4 PASSAR PARA A C9 (Recusa) 7

(Não sabe) 8

… F1: Contando consigo, quantas pessoas – incluindo crianças – vivem habitualmente nesta casa?

ESCREVER O NÚMERO:

(Recusa) 77

(Não sabe) 88

F6: Qual o grau de escolaridade mais elevado que completou?

Nenhum 01 PASSA PARA A F7

1º ciclo do básico (4ª classe) 02

PASSA PARA A F6A 2º ciclo do básico (5º e 6º anos / preparatório) 03

3º ciclo do básico (9º ano / 5º ano dos liceus) 04

Secundário (12º ano / 7º ano dos liceus ou equivalente/Propedêutico / serviço cívico) 05

PASSA PARA A F6A

Superior politécnico 06

Superior universitário (licenciatura) 07

Pós-graduação (pelo menos 1 ano) 08

Mestrado 09

Doutoramento 10

(Recusa) 77

(Não sabe) 88 PASSA PARA A F7

Page 10: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 10 - Tratamento de informação

20

11

F7: Quantos anos completos de escolaridade terminou? _____________________

F20: Qual é/era o número base de horas contratadas por semana (no seu trabalho principal), sem contar com horas extraordinárias remuneradas ou não remuneradas?

NÚMERO DE HORAS:

(Recusa) 777

(Não sabe) 888

F23: Na sua profissão principal o que é que faz/fazia a maior parte do tempo? DESCREVER DETALHADAMENTE ________________________________________________________________________________________________________________________________________________________

1. Indique o grau de importância que atribui a cada uma das acções a seguir listadas. Utilize a seguinte escala de respostas:

nada importante 1 2 3 4 5 6 7 muito importante

2.1 contribuir para evitar o desperdício

2.2 Desenvolver acções que possam ajudar a modificar a sociedade

2.3 Ter sucesso

2.4 Respeitar as tradições

2.5 Realizar projectos pessoais

2.6 Participar nas decisões públicas

2.7 Ajudar os outros

2.9 Fazer bem uma tarefa de que foi incumbido

2.9 Ajudar a manter a ordem social

2.10 Partilhar recursos

2.11 Ter poder

2. Em igualdade de condições de risco e rendibilidade relativamente a outros Fundos, com que probabilidade optaria por investir num FIF (Assinale com um circulo o valor da sua escolha):

Nada provável 0.......10.......20.......30.......40.......50.......60.......70.......80.......90.......100% De certeza

3. A partir de que valores mínimos de expectativa da rendibilidade (valorização anual líquida) o levariam a investir no FIF?

4-4,99% 5-5,99% 6-6,99% 7-8,99% 9-12% +12%

4. Qual o rendimento mensal líquido do seu agregado familiar (em contos):

Menos de 100 100 a 199 200 a 399 400 a 599 600 ou mais

Page 11: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 11 - Tratamento de informação

20

11

TAXAS DE VARIAÇÃO

TAXA DE VARIAÇÃO:

1000

01

T

TT

em que inicial momento no valor

final momento no valor

0

1

-T

T

Substituindo

%116%8,115100 1,158481002423

2807100

2423

24235230

%17%9,16100 1694,0100208190

35268100

208190

208190243458

Page 12: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 12 - Tratamento de informação

20

11

MEDIDAS DE TENDÊNCIA CENTRAL

Média Aritmética ( (população); X (amostra))

Mediana (Me)

Moda (Mo)

Algumas Características mais importantes da Média

O valor da média pode ser enviesado por apenas alguns valores

extremos. Se a distribuição for altamente assimétrica, a média pode

deixar de ser representativa da distribuição;

Pode não corresponder a um valor concreto da variável;

2 Propriedades:

1. a média dos desvios em relação à média é nula;

2. a média do quadrado dos desvios em relação à média é mínima.

É a medida de tendência central mais eficiente para inferir sobre uma

população a partir dos dados de uma amostra;

Algumas Características mais importantes da Mediana

É determinada pelo número de observações e não pelo seu valor, logo,

os valores extremos não afectam a mediana;

Muito utilizada em distribuições fortemente assimétricas (porque não

é afectada por valores extremos);

Para inferência estatística não satisfaz as propriedades de um bom

estimador.

MEDIDAS DE DISPERSÃO

ALGUNS EXEMPLOS:

Intervalo de Variação (Iv);

Intervalo Interquartis (IQ)

Variância ( 2 ; 2S ) e Desvio-Padrão ( ; S ): medidas absolutas de

dispersão:

Coeficiente de Dispersão e Coeficiente de Variação (Cv): medidas

relativas de dispersão:

Page 13: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 13 - Tratamento de informação

20

11

Intervalo de Variação (Iv)

Corresponde à diferença entre os valores máximo e mínimo observados na

distribuição. A sua maior desvantagem é não ser sensível aos valores

intermédios.

Intervalo Interquartis (IQ)

É a diferença entre o 3º e o 1º quartis e corresponde a um intervalo com 50%

das observações centrais:

13QQIQ

Desvio-Padrão ( ; S )

O desvio-padrão é a raiz quadrada da variância: 2SS ; É a medida de

dispersão mais utilizada.

Coeficiente de Dispersão e Coeficiente de Variação (v

C )

Expressam o peso (absoluto e percentual) do desvio-padrão em relação à

média. Muito usados para comparar distribuições diferentes.

X

S Dispersão de eCoeficient 100 C

v

X

S

Page 14: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 14 - Tratamento de informação

20

11

OBSERVAÇÕES OUTLIERS

Os outliers são observações extremas que podem existir numa distribuição de

frequências, e classificam-se como severos ou moderados consoante o seu

afastamento em relação às outras observações seja mais ou menos pronunciado.

Outliers Moderados (representados no SPSS por um círculo: o)

Valores entre 1,5 e 3 IQ, abaixo do Q1 ou acima do Q3:

IQQxIQQIQQxIQQii

35,1 seou 5,133311

Outliers Severos (representados no SPSS por um asterisco: *)

Valores superiores a 3 IQ, abaixo do Q1 ou acima do Q3:

IQQxIQQxii

3 seou 331

Diagrama de Extremos e Quartis: “A Caixa de Bigodes” (Boxplot)

22 02N =

Nº de memb. agregado

14

12

10

8

6

4

2

0

22 1420 4719 4413 7312 9011 9690 671 541 9

24 4424 1618 9

20 6918 06

15 36

Valor máximo 6, mas sem os outliers

Valor mínimo.1

Q3=4

Q1=2

Me=3

Outlier severo com resposta no valor 12

Outliers moderados com resposta nos valores 7, 8 e 9

Page 15: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 15 - Tratamento de informação

20

11

Um exemplo:

Nos diagramas de extremos e quartis os casos marcadamente diferentes dos restantes

são assinalados, como pode ver-se no gráfico acima. Distinguem-se dois níveis de

diferença face à generalidade dos casos:

os OUTLIERS MODERADOS

e os OUTLIERS SEVEROS

que o SPSS identifica por outliers e extremes, respectivamente.

Por defeito, os outliers são marcados com um círculo e os extremos com um asterisco.

Page 16: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 16 - Tratamento de informação

20

11

ASSIMETRIA E CURTOSE

SKEWNESS – MEDIDA DE ASSIMETRIA UTILIZADA PELO SPSS

Esta medida tem como factor de comparação a simetria da distribuição normal

(ver representação na página seguinte).

É possível quantificar a assimetria efectuando o seguinte rácio:

Medida deassimetria SkewnessErro padrãoda assimetria Standard error of skewness

sr

Se a distribuição é simétrica

Se Distribuição assimétrica e como o coeficiente de assimetria < 0 é uma assimetria negativa

Se a distribuição é assimétrica e como o coeficiente de assimetria > 0 é uma assimetria positiva

KURTOSIS – MEDIDA DE CURTOSE UTILIZADA PELO SPSS

Esta medida tem como factor de comparação a curtose da distribuição normal.

É possível quantificar o grau de achatamento da distribuição a partir do seguinte

rácio:

Medida de curtose KurtosisErro padrãoda curtose Standard error of Kurtosiskr

Se a distribuição é mesocúrtica e a curtose é igual à da distribuição normal);

a distribuição é platicúrtica (curtose inferior à da distribuição normal);

Se a distribuição é leptocúrtica e a curtose é superior à da distribuição normal);

Page 17: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 17 - Tratamento de informação

20

11

DISTRIBUIÇÃO NORMAL

x x

2

1)x(f

30 40 50 60 70 80 90 100

0.000

0.015

0.030

P eso

De

nsid

ad

e

Page 18: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 18 - Tratamento de informação

20

11

GLOSSÁRIO DE ALGUMAS MEDIDAS DESCRITIVAS UNIVARIADAS

Median

Mode

Quartiles

Mean

Std. Deviation

Variance

Minimum

Maximum

Range

Page 19: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 19 - Tratamento de informação

20

11

Skewness

Kurtosis

Std. Error of Skewness

Std. Error of Kurtosis

Interquartle Range (Intervalo interquartil)

Std. Error of Mean

Page 20: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 20 - Tratamento de informação

20

11

APRESENTAÇÃO DE RESULTADOS

QUADROS

Distribuição de uma variável qualitativa nominal

Quadro 1 Classificação Colarinho Branco/Colarinho Azul dos pais

Classificação Colarinho Branco/Colarinho

Azul dos pais N %

Colarinho branco muito qualificado 1392 28,1

Colarinho branco pouco qualificado 1778 35,9

Colarinho azul muito qualificado 1179 23,8

Colarinho azul pouco qualificado 607 12,2

Total 4956 100,0

Fonte: PISA, 2006

Relação entre duas variáveis qualitativas

Quadro 2 Importância de ter sucesso a Matemática segundo Sexo dos alunos

Importância de ter sucesso

a Matemática

Sexo

Feminino Masculino Total

N % N % N %

Nada importante 51 2,5 61 3,1 112 2,8

Pouco importante 138 6,9 138 6,9 276 6,9

Importante 723 36,1 660 33,1 1383 34,6

Muito importante 1091 54,5 1137 57,0 2228 55,7

Total 2003 100,0 1996 100,0 3999 100,0

Fonte: PISA, 2006

Page 21: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 21 - Tratamento de informação

20

11

Distribuição de uma variável quantitativa segundo uma variável qualitativa

Quadro 3 Nível socioeconómico dos pais dos alunos segundo o grau de importância de ter sucesso nas diferentes disciplinas

Nada importante Pouco importante Importante Muito importante

Média HISEI Média HISEI Média HISEI Média HISEI

Importância de ter sucesso a Ciências 40,80 38,43 38,97 45,40

Importância de ter sucesso a Matemática 38,23 36,42 39,35 43,69

Importância de ter sucesso a Língua 43,81 46,75 42,40 39,13

Fonte: PISA, 2006

0.0

5.0

10.0

15.0

20.0

25.0

30.0

35.0

40.0

45.0

50.0

Nada importante Pouco importante Importante Muito importante

dia

HIS

EI

Importância de ter sucesso -

Ciências

Importância de ter sucesso -Matemática

Importância de ter sucesso -

Língua

Page 22: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 22 - Tratamento de informação

20

11

GRÁFICOS GRÁFICO DE BARRAS

Adequado para variáveis qualitativas – nominais ou ordinais – e quantitativas discretas com um número não excessivamente elevado de valores.

Gráfico 1 Distribuição da taxa de emprego part-time1 por sexo, por país

Fonte: Eurostat, 2005

1 This is a division of the number of employees calculated by reference to the number of hours worked per week for which they are paid; this number of hours is considered in relation to the length of what is considered to be a full-time working week in the Member State or the sector of the unit or the unit itself.

Part-time workers are persons whose usual hours of work are less than the normal working hours. This definition encompasses all forms of part-time work (half-day work, work for one, two or three days a week, etc.). This number may be established at the national, regional, industrial or unit level.

It should be noted that whereas the "full-time employee" category is relatively homogeneous, the same cannot be said of the "part-time employee" category since this can cover anything between 20% or even less and 80% or more of the normal working hours of the employing unit.

http://ec.europa.eu/eurostat/ramon/nomenclatures/index.cfm?TargetUrl=DSP_GLOSSARY_NOM_DTL_VIEW&StrNom=CODED2&StrLanguageCode=EN&IntKey=16538835&RdoSearch=BEGIN&TxtSearch=n&CboTheme=&IntCurrentPage=11

Page 23: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 23 - Tratamento de informação

20

11

GRÁFICO DE BARRAS EMPILHADAS

Cada uma corresponde a 100%

Gráfico 2 Importância do consumo de tabaco segundo as habilitações literárias

Outro exemplo no qual as unidades estatísticas estão directamente

visíveis (ex: países)

As barras estão na horizontal e cada uma delas corresponde a 100%

Page 24: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 24 - Tratamento de informação

20

11

Gráfico 3 Taxa de desemprego juvenil segundo os níveis de habilitações

Fonte: Eurostat, 2008

GRÁFICO SECTORIAL

Adequado para variáveis qualitativas. Um nº muito elevado de categorias implicará pouca legibilidade

Gráfico 4 Classificação Colarinho Branco/Colarinho Azul dos pais dos alunos

Fonte: PISA, 2006

0% 20% 40% 60% 80% 100%

UE27

Suécia

Roménia

República Checa

Reino Unido

Portugal

Polónia

Malta

Luxemburgo

Lituânia

Letónia

Itália

Irlanda

Hungria

Holanda

Grécia

França

Finlândia

Estónia

Espanha

Eslovénia

Eslováquia

Dinamarca

Chipre

Bulgária

Bélgica

Áustria

Alemanha

Taxa desemprego dos jovens até 3º ciclo (2008)

Taxa desemprego dos jovens com Ensino Secundário e Pós-secundário (2008)

Taxa desemprego dos jovens com Ensino Superior (2008)

28.1%

35.9%

23.8%

12.2%

Colarinho branco muito qualificadoColarinho branco pouco qualificadoColarinho azul muito qualificadoColarinho azul pouco qualificado

Page 25: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 25 - Tratamento de informação

20

11

GRÁFICO DE LINHAS

Com médias

Gráfico 5 Distribuição dos scores em ciências, matemática e em leitura segundo o tempo de estudo dos alunos

Fonte: PISA, 2006

Com percentagens

Gráfico 6 Taxa de desemprego por idades na UE27

Fonte: Eurostat, 2008

400.0

420.0

440.0

460.0

480.0

500.0

520.0

540.0

Nenhum < 2 horas semana

2-4 horas semana

4-6 horas semana

> 6 horas semana

dia

Score a ciências

Score a leitura

Score a matemática

Page 26: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 26 - Tratamento de informação

20

11

DIAGRAMA DE EXTREMOS E QUARTIS

Só deve ser opção quando a variável cuja distribuição se pretende representar é pelo menos ordinal.

Gráfico 7 Scores em ciências, em matemática e em leitura segundo o sexo dos alunos

Fonte: PISA, 2006

Page 27: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 27 - Tratamento de informação

20

11

GRÁFICO DE BARRAS E DIAGRAMA DE EXTREMOS E QUARTIS.

Apesar de a variável ser quantitativa o gráfico de barras ainda é adequado

porque a variável não apresenta um nº muito elevado de valores. Caso

contrário seria preferível optar por um histograma construindo classes de

antiguidade.

Gráfico 8 Distribuição da antiguidade da licenciatura

Page 28: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 28 - Tratamento de informação

20

11

Em igualdade de condições de risco e rentabilidade, com que probabilidade investiria num Fundo Investimento Florestal (FIF)?

N % % Acumulada

0 (Nada provável) 11 1,8 1,8

10 17 2,8 4,6

20 17 2,8 7,4

30 43 7,0 14,4

40 42 6,9 21,2

50 151 24,7 45,9

60 90 14,7 60,6

70 95 15,5 76,1

80 79 12,9 89,1

90 28 4,6 93,6

100 (De certeza) 39 6,4 100,0

Total 612 100,0

Estatísticas

N Respostas válidas 612

Não-respostas 26

Média 58,53

Mediana 60,00

Moda 50

Intervalo variação 100

Mínimo 0

Máximo 100

Percentis 25 50,00

50 60,00

75 70,00

Page 29: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 29 - Tratamento de informação

20

11

HISTOGRAMA

Adequado para variáveis quantitativas contínuas. Dados classificados em

intervalos.

Neste exemplo apresenta-se em sobreposição a distribuição normal.

Existem situações de análise nas quais é pertinente avaliar o ajustamento

da distribuição empírica à distribuição normal. Poderá ser realizado um

teste de aderência à normalidade.

Gráfico 9 Distribuição dos scores a leitura

Fonte: PISA, 2006

Poder-se-ão construir intervalos em variáveis quantitativas discretas

quando a variabilidade de valores assim o exige para proceder à

representação gráfica. Veja-se o exemplo disponível na página seguinte.

Page 30: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 30 - Tratamento de informação

20

11

Idade N % % Acumulada

20 17 2,9 2,9 21 19 3,3 6,2 22 24 4,1 10,4 23 28 4,8 15,2 24 25 4,3 19,5 25 20 3,5 23,0 26 32 5,5 28,5 27 17 2,9 31,4 28 16 2,8 34,2 29 20 3,5 37,7

30 13 2,2 39,9 31 15 2,6 42,5 32 13 2,2 44,7 33 10 1,7 46,5 34 10 1,7 48,2

35 6 1,0 49,2 36 10 1,7 50,9 37 14 2,4 53,4 38 12 2,1 55,4 39 10 1,7 57,2

40 14 2,4 59,6 41 10 1,7 61,3 42 20 3,5 64,8 43 10 1,7 66,5 44 9 1,6 68,0 45 12 2,1 70,1 46 19 3,3 73,4 47 10 1,7 75,1 48 9 1,6 76,7 49 7 1,2 77,9

50 11 1,9 79,8 51 12 2,1 81,9 52 13 2,2 84,1 53 8 1,4 85,5 54 10 1,7 87,2

55 7 1,2 88,4 56 4 0,7 89,1 57 8 1,4 90,5 58 2 0,3 90,8 59 1 0,2 91,0

60 6 1,0 92,1 61 6 1,0 93,1 62 4 0,7 93,8 63 3 0,5 94,3 64 3 0,5 94,8 65 1 0,2 95,0 66 5 0,9 95,9 67 4 0,7 96,5 68 2 0,3 96,9 69 2 0,3 97,2

70 2 0,3 97,6 71 1 0,2 97,8 72 1 0,2 97,9 73 2 0,3 98,3 74 2 0,3 98,6

75 4 0,7 99,3 76 1 0,2 99,5 78 2 0,3 99,8 79 1 0,2 100,0

Total 579 100,0

Page 31: Conceitos e Tratamento Informação (HC. 2011)

Helena Carvalho

- 31 - Tratamento de informação

20

11

DIAGRAMA DE DISPERSÃO (scatter plot)

Adequado para representar a relação entre duas variáveis quantita-tivas

Gráfico 10 Relação entre Desigualdade na distribuição do rendimento e Risco de Pobreza

Fonte: Eurostat, 2008