variables qualitatives

20
1 Variables qualitatives Taules de freqüències: freq. absolutes, percentatges i freq.relatives Gràfiques: barres, sectors, de Pareto, i altres Descriptius: la moda, per a totes les qualitatives la mediana i els percentils, per a les qualitatives ordinals Un exemple de variable nominal: estudi complert Un exemple de variable ordinal: estudi complert

Upload: lilith

Post on 10-Jan-2016

49 views

Category:

Documents


1 download

DESCRIPTION

Variables qualitatives. Taules de freqüències: freq. absolutes , percentatges i freq.relatives Gràfiques: barres , sectors , de Pareto , i altres Descriptius : la moda , per a totes les qualitatives la mediana i els percentils , per a les qualitatives ordinals - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Variables qualitatives

1

Variables qualitativesTaules de freqüències: freq. absolutes, percentatges i freq.relatives Gràfiques: barres, sectors, de Pareto, i altres

Descriptius: la moda, per a totes les qualitatives la mediana i els percentils, per a les qualitatives ordinals

Un exemple de variable nominal: estudi complert

Un exemple de variable ordinal: estudi complert

Page 2: Variables qualitatives

2

Taules de freqüències per a variables qualitatives• Consisteixen en un resum dels valors o modalitats diferents que pren la

variable qualitativa, amb el recompte del nombre d’aparicions per a cada valor.

Exemple: Variable religió majoritària. Casos: països. Pag. 18

Valors o modalitats Sense valors perduts

(27/109)x100 (27/108)

x100

Page 3: Variables qualitatives

3

Exemple: Variable regió econòmica. Casos: països. Pag. 19

Sense ponderar:

tots els països el mateix pes

Ponderant segons la població: cada

país té un pes proporcional a la

seva població

Page 4: Variables qualitatives

4

Taula de freqüències tipus Pag. 20

knnn ...21

Page 5: Variables qualitatives

5

Taules de freq. per a variables qualitatives: resum

• S’utilitzen per resumir la informació dels k valors o modalitats d’una

variable qualitativa, en un total de n casos: k ≤ n• Les freq. absolutes o recomptes indiquen, per a cada valor, xi , el

nombre de vegades que es repeteix: ni

• Les freq. relatives o tants per ú indiquen, per a cada valor, xi , la

proporció de vegades que es repeteix: fi

• Els percentatges o tants per cent indiquen, per a cada valor, xi , el %

• de vegades que es repeteix: pi =

n

ni

100fi

Page 6: Variables qualitatives

6

Gràfiques per a variables qualitatives: barres• Per a cada valor o modalitat, s’aixeca una barra d’altura igual (o

proporcional) a la seva freqüència o percentatge. Pag. 26

Exemple: Variable religió majoritària. Casos: països. Pag. 27

Page 7: Variables qualitatives

7

Exemple: Variable religió majoritària: tipologies. Casos: països. Pag. 27

Aparentment, les religions cristianes semblen molt més majoritàries, del

que en realitat són

L’eix no comença al 0

Page 8: Variables qualitatives

8

Gràfiques per a variables qualitatives: sectors• Per a cada valor o modalitat, es considera un sector d’angle proporcional a

la seva freqüència o percentatge. Pag. 27

Exemple: Variable religió majoritària: tipologies. Pag. 28

Els països no estan ponderats: per a cada modalitat, es veu el %

de països

Els països estan ponderats per població: per a cada modalitat, es

veu el % de població

Page 9: Variables qualitatives

9

Gràfiques per a variables qualitatives: barres de Pareto• Diagrama de barres per als valors o modalitats ordenats de més a menys

freqüent. Doble eix vertical: a l’eix principal de l’esquerra freqüències (o %), corresponents a les barres; a l’eix secundari de la dreta, % acumulats, corresponents a la línia poligonal creixent. Pag. 29

Exemple: Variable religió majoritària: països sense ponderar

Entre catòlica, musulmana i protestant hi ha gairebé el

80% dels països

Page 10: Variables qualitatives

10

Gràfiques per a variables qualitatives: pictogrames

Page 11: Variables qualitatives

11

Descriptius per a variables qualitatives: la moda

• La moda (Mo) és el valor o modalitat més freqüent de la variable. Li corresponen màxima freqüència absoluta, relativa i percentatge. Pag. 42

Exemple:La moda de la taula 1.1, és la religió catòlica, atès que té el % més elevat de

països: 38%

• Equivalentment, li corresponen la barra més alta i el sector d’angle més gran.

Exemples:La moda de les modalitats de religió dels països sense ponderar, és la

modalitat de religions cristianes, atès que té el sector més gran: 60.19% de països.

La moda de les modalitats de religió dels països ponderats per població, és la modalitat d’altres religions, atès que té el sector més gran: 48.47% de població.

Page 12: Variables qualitatives

12

Remarques i propietats importants de la moda• És fàcil de calcular. És una característica de posició central.

• La moda és més significativa, si té una freqüència sensiblement superior a les dels altres valors.

• Pot no ser única, si la màxima freqüència correspon a dos o més valors. Es parla de distribucions unimodals, bimodals, etc.

Exemple:

La distribució de països (sense ponderar per població) segons regions econò-miques, té dues modes: OCDE i Amèrica Llatina, amb un 19.3% de països.

Page 13: Variables qualitatives

13

Per contra:

La distribució de regions econòmiques, per països ponderats per població, és unimodal: Moda=Àsia/Pacífic, amb un 58.5% de la població.

Page 14: Variables qualitatives

14

Descriptius per a variables qualitatives ordinals: la moda, mediana, els quartils i els percentils

• La mediana (Md) és el valor que ocupa la posició central quan tenim totes les observacions ordenades: la meitat d’observacions (50%) són menors o iguals que la mediana i l’altra meitat són majors o iguals. Pags. 39,..

Exemples, amb poques dades: n senarLa mediana de 3, 27, 30, 51 i 100 és 30, és la que està al mig: Md = 30La mediana de 3, 3, 3, 5 i 7 és 3, és la que està al mig: Md = 3

Exemples, amb poques dades: n parellLa mediana de 3, 27, 51 i 100 és la mitjana de les dues que estan al mig:

Md = (27+51)/2 = 39La mediana de 3, 3, 3 i 5 és 3, és la mitjana de les dues que estan al mig:

Md = (3+3)/2 = 3

Page 15: Variables qualitatives

15

Càlcul de la mediana per a les dades resumides en una taula de freqüències

• Els valors han d’estar ordenats• Localitzarem el primer percentatge acumulat que supera el 50%, el valor

corresponent és la mediana.• Cas que hi hagi un percentatge acumulat igual al 50%, farem la mitjana

entre el valor corresponent i el següent (només pot ocórrer si n és parell)

Exemple, a partir d’una taula de freqüencies: n senar

Md = 4

Page 16: Variables qualitatives

16

Exemples, a partir d’una taula de freqüencies: n parell

a) Cap percentatge acumulat coincideix amb el 50%

Md = 5

b) Un percentatge acumulat coincideix amb el 50%

Md =(5+7)/2 = 6

Page 17: Variables qualitatives

17

Distribució d’una variable de tipus numèric, mesurada en escala ordinal: l’últim interval és obert!

ingper91 Ingresos del encuestado 1991

26 1,7 2,6 2,6

36 2,4 3,6 6,2

30 2,0 3,0 9,3

24 1,6 2,4 11,7

23 1,5 2,3 14,0

23 1,5 2,3 16,3

15 1,0 1,5 17,8

31 2,1 3,1 20,9

55 3,7 5,5 26,5

54 3,6 5,4 31,9

64 4,3 6,4 38,3

58 3,9 5,8 44,2

55 3,7 5,5 49,7

61 4,1 6,1 55,8

84 5,6 8,5 64,3

83 5,5 8,4 72,6

54 3,6 5,4 78,1

66 4,4 6,6 84,7

38 2,5 3,8 88,5

23 1,5 2,3 90,8

44 2,9 4,4 95,3

47 3,1 4,7 100,0

994 66,3 100,0

493 32,9

9 ,6

4 ,3

506 33,7

1500 100,0

1 Menos de $1000

2 $1000-2999

3 $3000-3999

4 $4000-4999

5 $5000-5999

6 $6000-6999

7 $7000-7999

8 $8000-9999

9 $10000-12499

10 $12500-14999

11 $15000-17499

12 $17500-19999

13 $20000-22499

14 $22500-24999

15 $25000-29999

16 $30000-34999

17 $35000-39999

18 $40000-49999

19 $50000-59999

20 $60000-74999

21 $75000+

22 Rehusa

Total

Válidos

0 No procede

98 No sabe

99 No contesta

Total

Perdidos

Total

Frecuencia PorcentajePorcentaje

válidoPorcentajeacumulado

Page 18: Variables qualitatives

18

Els percentils: quartils i decils (casos particulars): Pgs. 44,...

• El percentil o centil d’ordre r(Cr) és el valor tal que un (r x 100 %) de les observacions són menors o iguals que Cr i el (100-r) x 100 % són majors o iguals. Es localitzen a partir dels percentatges acumulats.

Per exemple, C60 és tal que el 60% d’observacions són menors o iguals i el 40% són majors o iguals, etc. Es localitza a partir del primer percentatge acumulat que supera el 60%, el valor corresponent és el centil 60.

A la taula pag. anterior, veiem que:

C60 correspon a l’interval 25000$ a 29999$, que podem representar pel seu punt mitjà: 27500$

C90 correspon a l’interval 60000$ a 74999$, que podem representar pel seu punt mitjà: 67500$

[25000, 30000)

Page 19: Variables qualitatives

19

La mediana és el centil 50: parteix la distribució en dues parts, cadascuna amb un 50% d’observacions

Page 20: Variables qualitatives

20

Hi ha tres quartils

Q1= C25 , Q2= C50 = Md , Q3= C75

que parteixen la distribució en quatre parts, cadascuna amb un 25% d’observacions (una quarta part de l’àrea)