Download - LEZIONE A.4 Modalità rappresentative
LEZIONE A.4
Modalità rappresentative
TQuArs – a.a. 2010/11Tecniche quantitative per l’analisi nella ricerca sociale
Giuseppe A. Micheli
In questa lezione..
In questa lezione proseguiremo nella procedura di sintesi delle informazioni.
Abbiamo già conosciuto i primi tre passi di sintesi:
La ricodifica in matrice;
La classificazione in forma di variabile statistica
La rappresentazione grafica.
Il quarto passo è quello della individuazione e calcolo di misure di misure di sintesi delle distribuzioni di frequenzasintesi delle distribuzioni di frequenza. Esse sono come i tratti tratti identificativi di una carta d'identitàidentificativi di una carta d'identità.
In questa lezione acquisteremo familiarità con la media e la moda.a media e la moda.
Ne vedremo le proprietà e le procedure di calcolo.Ne vedremo le proprietà e le procedure di calcolo.
Infine calcoleremo tali misure Infine calcoleremo tali misure per miscugli di popolazioniper miscugli di popolazioni.
Tratti identificativi
Carta di identità di
Pippo Superman
Tratti identificativi:
Quanto è alto? __
Quanto pesa?___
Colore occhi____
………….. _____
Carta di identità di
Distribuzione dei redditi di XLand
Tratti identificativi:
Quale è il reddito medio? ________
Quanta è la disuguaglianza?_
E’ asimmetrica?__
………….. _____
Come in una carta d'identità, non po-tendo descrivere la persona o variabile statistica nei minimi dettagli, ci limi-teremo a identificarla mediante alcune misure sintetiche:misure di posizione (centro)misure di dispersione o variabilitàaltre misure di forma (simmetria,...)
NOTA: sintetizzando perdiamo sempre informazioni. Se di un ricercato sappiamo solo che è
alto 1.70, pesa 63 kg. e ha occhi castani, quanti di voi
potrebbero essere "vittime di errore giudiziario"?
Misure di posizione
Le misure di posizione misurano l'attitudine di un fenomeno X a localizzarsi in un intorno delimitato dell'asse reale, che siamo indotti a ritenere il centrocentro di X.
Quale è il partito di
maggioranza?
La lunghezza delle gonne varia di anno in anno.
Qual è la moda di quest’anno?
A che età avviene ‘di
regola’ l’andata
in pensione? Qual è il numero medio di figli per donna in Italia?
Possiamo chiamare queste misure genericamente "medie".
Due definizioni di media
Una media M = g(xUna media M = g(x11, x, x22,..., x,..., xmm) è un indice sintetico di una di-) è un indice sintetico di una di-
stribuzione statistica, che alle diverse modalità del carattere ne stribuzione statistica, che alle diverse modalità del carattere ne sostituisce una sola che, per il modo in cui è stata scelta, possa sostituisce una sola che, per il modo in cui è stata scelta, possa ritenersi rappresentativa o tipicaritenersi rappresentativa o tipica.
Se la v.s. è quantitativa la media indicherà l'ordine di grandezzal'ordine di grandezza del carattere studiato. In caso di v.s. quantitative definiamo:
Media in senso stretto di una v.s. X è una qualsiasi funzione Media in senso stretto di una v.s. X è una qualsiasi funzione reale M = reale M = (x(x11,.., x,.., xmm; n; n1,1,.., n.., nmm) che soddisfi 3 proprietà) che soddisfi 3 proprietà:
InternalitàInternalità [Cauchy]: la media deve essere compresa tra il mini-mo e il massimo valo-re assunto dalla varia-bile.
MonotonicitàMonotonicità: date due v.s. X e Y, con osserva-zioni identiche salvo (al-meno) una per la quale sia yi >xi, la media di Y non può essere più pic-cola della media di X.
MoltiplicativitàMoltiplicatività [o in-varianza rispetto all’u-nità di misura]: se C è una costante reale e o-gni modalità xi è mol-tiplicata per C, anche la media è moltiplicata per C.
Medie analitiche, medie lasche
La definizione di media in senso stretto è restrittiva.
Può essere soddisfatta da medie calcolate su v.s. quantitative, che quindi possono «coinvolgere in un'unica funzione coinvolgere in un'unica funzione di sintesi matematica di sintesi matematica tutti i termini della distribuzione, xtutti i termini della distribuzione, xii e n e nii». Una mediamedia calcolata in questo modo si dice analiticaanalitica.
Una media che non coinvolge nel calcolo tutti i termini della Una media che non coinvolge nel calcolo tutti i termini della distribuzione si dice media lascadistribuzione si dice media lasca.
Grazie alla loro procedura di costruzione, alcune medie lasche possono essere calcolate anche per mutabili. In compenso potranno non godere della terza proprietà (di monotonicità).
Medie lasche (o "medie in senso lato“) sono la moda e la mediana.
Di medie analitiche ce n’è una gran varietà. La più ‘naturale’ e di uso comune è la media aritmetica ponderata.
In questa lezione faremo conoscenza della Media aritmetica e della Moda.
Medie come modalità rappresentative
Di medie, s’è detto, sia generiche che in senso stretto, se ne possono de-finire molte. Noi ci fermeremo su alcune, a cui corrisponde un significato logico comprensibile e utile. Medie che siano per noi davvero rappresen-rappresen-tativetative della popolazione analizzata. In particolare definiremo medie che:
Corrispondono alla modalità più osservatamodalità più osservata (es. partito di mag-gioranza, abbigliamenti ‘in’ o di moda…).
Corrispondono alla modalità ‘di mezzo’ della popolazionemodalità ‘di mezzo’ della popolazione, quella che sta ‘al centro del plotone’ (vedi l’immagine oraziana dell’”in medio stat virtus”, o ‘l’uomo medio’ di Quetelet o di Asimov).
Corrispondono a una modalità ‘virtuale’modalità ‘virtuale’ che, se sostituita a tutte le modalità di fatto osservate, lascia immutata una misura ‘di sin-lascia immutata una misura ‘di sin-tesi’ della popolazionetesi’ della popolazione (es.: il reddito medio è quello che sostituito ai diversi redditi lascia inalterato il reddito complessivo della col-lettività; il tasso di incremento del costo della vita negli anni ’90 è quello che, sostituito ai diversi tassi annui, lascia inalterato il tasso di incremento sull’intero decennio..).
Medie e livelli di misurazione
I tre significati di media corrispondono a livelli diversi di misurazione. I tre significati di media corrispondono a livelli diversi di misurazione.
Medie che corrispondono..
Richiedono operazioni di .. Livello di misurazione
Alla modalità più osservata
Spoglio delle modalità, di qualunque tipo esse siano
Tutte Tutte (nominali, ordi-nali, quantitat.)
Alla modalità ‘di mezzo’
Ordinamento delle modalità in una sequenza crescente o decrescente
OrdinabiliOrdinabili (ordinali, quantitative)
Alla modalità che, sostituita alle xi, lascia immutata una misura di sintesi
Sintesi algebrica delle proprietà individuali (somma, prodotto) per determinare la corrispondente proprietà collettiva
Solo Solo quantitativequantitative
Medie e funzione obiettivo
Anche se si possono applicare solo a variabili quantitative, medie del terzo tipo (le medie analitiche) corrispondono all’idea più diffusa e all’uso comune delle medie. Esse implicano l’esistenza di una sintesi algebrica sintesi algebrica delle proprietà individuali in una corrispondente proprietà del delle proprietà individuali in una corrispondente proprietà del collettivo, che abbia un significato utile e condivisocollettivo, che abbia un significato utile e condiviso.
Media obiettivo (o secondo Chisini)Media obiettivo (o secondo Chisini) rispetto a una data funzione o-funzione o-biettivobiettivo è quel valore numerico che, sostituito a ogni modalità osservata, lascia inalterata la funzione obiettivo stessa. Una media analitica richiede:
la possibilità di maneggiare algebricamente le modalità individuali osservate,
una scelta ragionata della misura di sintesi.
Dunque non esiste una media buona “per tutte le stagioni”, ma la non esiste una media buona “per tutte le stagioni”, ma la media giusta per ogni “funzione obiettivo”.media giusta per ogni “funzione obiettivo”.
Intensità totale e media aritmetica
La funzione obiettivo più diffusa è l’intensità totalel’intensità totale del carattere studiato, cioè la somma delle modalità osservate nelle N unità somma delle modalità osservate nelle N unità della popolazionedella popolazione. L’intensità totale ripartita tra le N unità è la L’intensità totale ripartita tra le N unità è la media aritmetica.media aritmetica.
Carattere / popolazione Intensità totale Media aritmetica
Reddito annuo / cittadini Prodotto interno Reddito pro capite
Nascita di un figlio nell’anno / donne
Totale nascite annue Numero medio figli per donna
Ore lezione / docenti Monte ore Numero medio ore/docente
Furti / province Ammontare nazionale microcriminalità
Media furti per provincia
m
i
m
iii
iix N
nxfxmXEXMm
1
11)()(
Media aritmetica ‘pon-pon-derata’derata’: le modalità so-
no ‘ponderate’ con le rispettive frequenze
Calcolo della media aritmetica
xi
x1
x2
x3
x4
x5
ni
n1
n2
n3
n4
n5
N
fi= ni /N
f1= n1/N
f2= n2/N
f3= n3/N
f4= n4/N
f5= n5/N
1
xi ni
x1 n1
x2 n2
x3 n3
x4 n4
x5 n5
T
xi fi
x1 f1
x2 f2
x3 f3
x4 f4
x5 f5
T/N
Per calcolare una media aritmetica usere-mo la rappresentazione incolonnata di una v.s.. Alle colonne già note dovremo ag-giungere quella delle intensità specifiche (xi
ni) o, equivalentemente, delle intensità specifiche relative (xi fi).
L’intensità totale del ca-rattere studiato si ottiene facendo la somma della colonna delle intensità specifiche:
T = xi ni
La media aritmetica si ot-tiene dividendo T per N, oppure facendo la somma della colonna delle inten-sità specifiche relative:
m = xi fi m = T/N
Un esempio su variabili discrete (e 3 annotazioni)
(I) Le intensità specifiche (assolute) han-(I) Le intensità specifiche (assolute) han-no un significato concreto: 350 è il monte no un significato concreto: 350 è il monte totale di azioni possedute dai piccoli totale di azioni possedute dai piccoli azionisti (10 azioni a testa), mentre 200 è azionisti (10 azioni a testa), mentre 200 è il monte azioni dei grandi azionisti.il monte azioni dei grandi azionisti.
010203040
xxii
nnii
xi ni fi
10 35 0,7609
50 9 0,1956
100 2 0,0435
niente 46 1,00
xi ni xi fi
350 7,61
450 9,78
200 4,35
1000 21,74
Torniamo ai 46 azionisti e loro azioni
m = xi fi = 21,74
m =T/N=1000/46
=21,74
(II) L’uso di frazioni (II) L’uso di frazioni come le frequenze come le frequenze relative nel calcolo relative nel calcolo richiede di portarsi richiede di portarsi dietro un ‘congruo’ dietro un ‘congruo’ numero di decimalinumero di decimali
m=21,739
(III) La media aritmetica è una modalità ‘virtuale’! Essa può non corrispondere a (III) La media aritmetica è una modalità ‘virtuale’! Essa può non corrispondere a nessun valore osservato e nemmeno osservabile (cfr 2,1 figli per donna..)nessun valore osservato e nemmeno osservabile (cfr 2,1 figli per donna..)
Variabili per classiIl calcolo della media aritmetica coinvolge nel conto tutte le modalità e numerosità. Che fare, se una variabile è per classi? Quale valore assumiamo per ogni intervallo? Il minimo? Il massimo? Uno a caso?
Anche se comporta rischi di errore, si sceglie di prendere il valore centrale di ogni intervallo, cioè la semisomma degli estremi: vci = (xi
INF + xi
SUP)/2.
Pazienti anoressiche per età di insorgenza
xi-xi+1 ni(xi+xi+1)/2 fi vci x fi
9-11 11 10 0,077 0,770
11-14 45 12,5 0,317 3,963
14-19 63 16,5 0,444 7,326
19-25 23 22 0,162 3,564
142 1,000 15,623
Nota: prendere il valore centrale delle classi non è solo una scelta pragmatica. Abbiamo costruito l’istogramma con l’ipotesi di distribuzione uniforme entro ogni intervallo, e la mediala media di una distribuzione di una distribuzione rettangolare è rettangolare è proprio laproprio la semisomma semisomma.
0
4
8
12
16
20
0 5 10 15 20 25 30
mmxx=15,6=15,6
xxii
hhii
Un secondo esempioxi |- xi+1
0 |- 20
20 |- 40
40 |- 60
60 |- 80
80 |- 100
100|-160
160|-300
ni
126
439
346
123
37
22
6
1099
fi
11,46
39,95
31,48
11,19
3,37
2,00
0,55
100
VCi
10
30
50
70
90
130
230
vci x fi
1,146
11,985
15,740
7,833
3,033
2,600
1,265
43,6
0
4
8
12
16
20
24
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32
xi
hi
Famiglie per reddito annuo (milioni lire)
vci x ni
1260
13170
17300
8610
3330
2860
1380
47910
mx = T/N = 47910/1099 = 43,6 (il grafico è espresso in decine di milioni)
mx=4,36
Un esempio riassuntivo xi |- xi+1
0,0 |- 0,8
0,8 |- 1,2
1,2 |- 1,6
1,6 |- 2,0
2,0 |- 2,4
2,4 |- 2,8
2,8 |- 3,2
3,2 |- 3,6
3,6 |- 4,0
4,0 |- 4,4
4,4 |- 4,8
4,8 |- 5,2
5,2 |- 6,0
6,0 |- 8,0
8,0 |- 12
milano
ni
4
1
7
10
9
23
11
15
8
6
3
3
3
8
3
114
xi
0,4
1,0
1,4
1,8
2,2
2,6
3,0
3,4
3,8
4,2
4,6
5,0
5,6
7,0
10,0
xini
1,6
1,0
9,8
18,0
19,8
59,8
33,0
51,0
30,4
25,2
13,8
15,0
16,8
56,0
30,0
381,2
ni
7
9
55
103
88
123
68
50
30
41
15
11
12
13
3
628
xi
0,4
1,0
1,4
1,8
2,2
2,6
3,0
3,4
3,8
4,2
4,6
5,0
5,6
7,0
10,0
piccoli
xini
2,8
9,0
77,0
185,4
193,6
319,8
204,0
170,0
114,0
172,2
69,0
55,0
67,2
91,0
30,0
1760,0
Possiamo ora fare confronti tra medieconfronti tra medie:
mxM=381,2/114=3,34
mxP=1760,0/628=2,80
Il reddito medio di Mi-lano è assai più elevato di quello dei piccoli co-muni della Regione
Una cosa da notare:La classe di reddito a
cui corrisponde il maggiore ammontaredi reddito non è perforza l’ultima, quella
dei più ricchi: è quella dei numerosi ceti medi
(2,4-2,8 milioni)
Proprietà della media aritmetica
La media aritmetica rispetta le tre proprietà di base delle medie La media aritmetica rispetta le tre proprietà di base delle medie analitiche.analitiche.
InternalitàInternalità: m=21,74 azioni sta in mezzo tra x: m=21,74 azioni sta in mezzo tra x11 (10) e x (10) e xmm (100) (100)
Invarianza alle trasformazioniInvarianza alle trasformazioni: se ogni azioni vale 1,5 euro, la : se ogni azioni vale 1,5 euro, la v.s. “Valore azionario posseduto in euro” è una trasformata v.s. “Valore azionario posseduto in euro” è una trasformata Y=1,5Y=1,5**X. La media di Y è effettivamente = 1,5X. La media di Y è effettivamente = 1,5**m(X)m(X)
MonotonicitàMonotonicità: se i due grandi azionisti incrementano il loro pac-: se i due grandi azionisti incrementano il loro pac-chetto portandolo a 150 azioni ciascuno, il monte azioni totale di-chetto portandolo a 150 azioni ciascuno, il monte azioni totale di-venta T=1100 e la media aritmetica diventa 23,9. La spe-venta T=1100 e la media aritmetica diventa 23,9. La spe-requazione del mercato cresce, ma la media procapite aumenta!requazione del mercato cresce, ma la media procapite aumenta!
Ma essa possiede anche altre due proprietà assai importanti :Ma essa possiede anche altre due proprietà assai importanti :
BaricentricitàBaricentricità: la media a. è il ‘baricentro’ della distribuzione: la media a. è il ‘baricentro’ della distribuzione
Minimizzazione del dannoMinimizzazione del danno: la media a. rende minima una : la media a. rende minima una funzione di errore o di perdita di informazioni funzione di errore o di perdita di informazioni
Il concetto di baricentro
La rana è più grassa della gru: l’altalena non è in equilibrio. Come fare per portarla in equilibrio?
A sinistra possono appollaiarsi più gru a diverse di-stanze: ora la somma dei pesi delle gru moltiplica-te per le loro distanze dal cuneo che fa da punto di appoggio è pari al prodotto del peso della rana per la sua distanza dal cuneo. L’altalena è in equilibrio.
Più semplicemente, basta spostare il fulcro dell’al-talena: ora la distanza della rana, moltiplicata per il suo peso, pareggia il peso della gru moltiplicato per la distanza dal fulcro. L’altalena è in equilibrio.
Il fulcro è il Il fulcro è il baricentro baricentro dell’altalenadell’altalena
Media aritmetica come baricentro
La media aritmetica ponderata è il baricentro di una v.s.: essa cioè si situa nel punto di equilibrio centrale della distribuzione, così che la somma delle modalità (distanze dal fulcro) alla sua sinistra, ponderate per le rispettive numerosità (pesi), pareggia la somma delle modalità alla sua destra, ponderate per le rispettive numerosità.
Algebricamente questa proprietà si esprime così: "la somma degli scarti la somma degli scarti semplici delle modalità osservate dalla media aritmetica, ponderati semplici delle modalità osservate dalla media aritmetica, ponderati per le rispettive frequenze (o numerosità) è zeroper le rispettive frequenze (o numerosità) è zero"
01
p
iixi fmx
p
iix
p
iii
p
iixi fmfxfmx
111
01 1
xx
p
iixx mmfmm
Infatti:
C.V.D.
Un esempio
xi ni xi ni
10 35 350
50 9 450
100 2 200
46 1000
(xi-m) (xi-m)n i
-11,739 -410,87
28,261 +254,35
78,261 +156,52
1000 0
010203040
m=21,739
Nota:
La proprietà è soddisfatta sia ponderando con le numerosità che pe-sando con le frequenze relative.
La media aritmetica è l’unica media che possiede questa proprietà.
Verifichiamo la proprietà della media come baricentro con un esempio già conosciuto:
Il concetto di funzione di perdita
Supponete che una grande azienda di abbigliamento basi la propria pro-duzione di giacche sulle statistiche dell’ufficio Leva nazionale, da cui ri-sulta che la taglia media dei giovani italiani è la 48.
L’azienda produca allora giacche ‘giovanili’ solo di taglia 48. I giovani di taglia 46 ci staranno larghi, i ’50’ stretti e brontoleranno. Ma tutti gli altri (i 44, i 52..) si incavoleranno proprio e cambieranno marca..
Data un v.s. X e un indice di posizione , misuro la perdita di informazione con una "funzione di perditafunzione di perdita":
L(SL(Skk) = L(x) = L(xkk – – ))kk > 0 > 0 k, per k = 1,...N k, per k = 1,...N
Ci sono tante "leggi di perdita“ secondo il valore di k. Per esempio:
scarti assoluti: L(Sscarti assoluti: L(Skk)=|x)=|xkk––|; o scarti quadratici: L(S|; o scarti quadratici: L(Skk)=(x)=(xkk––)²)²
Data una funzione di perdita definita per un k definiamo DANNODANNO la media aritmetica della perdita. Scegliamo la media Scegliamo la media che minimizza il danno che minimizza il danno.
Media aritmetica come misura di minimo danno
c.v.d. m= SSE min
021
2
x
2
1
1
2
1
2
1
2
1
2
1
2
xx
m
iixix
m
iix
m
iixi
m
iixxi
m
iixxi
m
iii
mmKost
fmxm
fmfmx
fmmx
fmmxfx
x1
2 m= SSE min
m
iii fx
La media aritmetica è la misu-La media aritmetica è la misu-ra di posizione che rende mini-ra di posizione che rende mini-ma una funzione quadratica di ma una funzione quadratica di perdita di informazione.perdita di informazione.
= i(xi -)2fi
min
mLa media m è il valore di in cui la funzione quadratica pervie-ne al suo minimo. In tal punto la tangente alla curva (cioè la deri-vata) ha pendenza nulla. Quindi:
=min dove d/d =0
Medie di miscugliTorniamo all’esempio delle province secondo il tasso di disoccupazione
xi|-xi+1 xi niT xi ni
T
0–5 2,5 15 37,5
5-10 7,5 44 330,0
10-15 12,5 25 312,5
15-25 20 16 320,0
Italia 100 1000,0
xi niN xi ni
N
2,5 15 37,5
7,5 36 270,0
12,5 4 50,0
20 0 0,0
Nord 55 357,5
xi niS xi ni
N
2,5 0 0,0
7,5 8 60,0
12,5 21 262,5
20 16 320,0
Sud 45 642,5
Nel nord le 55 province hanno un tasso medio mN(x)=357,5/55=6,5
Nel sud le 45 province hanno un tasso medio mS(x)=642,5/45= 14,278
In Italia le 100 province hanno un tasso medio mT(x)=1000/100= 10
Ma il tasso nazionale si ottiene anche come media ponderata dei tassi delle due ripartizioni: mT(x)= [mN(x)nN . mS(x)nS]/N. In generale:
La media di un miscuglio è pari alla media delle medie delle singole subpopolazioni, ponderate per le rispettive numerosità.
Variabili qualitative: la moda e il suo calcolo
xi ni fi
Sufficiente 33679 0,667
Insuff. 3 mesi 6291 0,124
Insuff. 6 mesi 10574 0,209
X=acqua corr. 50544 1,000
sufficienteinsuff 3minsuff 6m0
0,2
0,4
0,6
0,8
1
xi ni fi
Sinistra 20 0,113
Centrosin. 45 0,254
Centro 39 0,220
Centrodes. 59 0,290
Destra 20 0,113
X=deputati 177 1,000
dxcdxcxcsxsx06
121824303642485460
Per variabili Per variabili qualitative la qualitative la Moda è la Moda è la modalità con modalità con la massima la massima frequenza.frequenza.
Calcolo della moda per variabili quantitative
xi ni fi
10 35 0,7609
50 9 0,1956
100 2 0,0435
46 1,00
010203040
m=21,74
xi-xi+1 ni
9-11 11
11-14 45
14-19 63
19-25 23
142
MMxx=15,6=15,6
Per v.s. discrete la Moda Per v.s. discrete la Moda è il valore più frequente-è il valore più frequente-mente osservato. mente osservato.
Per v.s. per classi Moda è Per v.s. per classi Moda è la semisomma della clas-la semisomma della clas-se con massima densità se con massima densità di frequenzadi frequenza
hi=ni/i
5,50
15,00
12,60
3,83
Md=12,5Md=12,5
Md=10Md=10
0
4
8
12
16
20
0 5 10 15 20 25 30
Max hi = 15,00
Md = (11+14)/2
= 12,5
Proprietà della moda
dxcdxcxcsxsx06
121824303642485460
Variabile bimodale La moda (Md) è la modalità a cui corrisponde La moda (Md) è la modalità a cui corrisponde la massima frequenza (v.s. discrete) o la la massima frequenza (v.s. discrete) o la massima densità di frequenza (v.s. per massima densità di frequenza (v.s. per classi)classi)(si distingue una classe modale (max den-sità) e un valore modale (valore centrale classe).Un fenomeno può avere più di una modapiù di una moda; si dirà bi-modale, tri-modale, amodale (tutte le modalità con uguale frequenza).
La moda è data a ogni livello di misurazioneLa moda è data a ogni livello di misurazione.Ma Ma non soddisfa la proprietà di monotonicitànon soddisfa la proprietà di monotonicità..Esempio: Nel tema in classe ci sono stati 10 quattro, 11 cinque, 6 sei, 2 sette, 1 otto. Md=5, M=5,1. Se il prof alza due voti da 5 a 6, M=5,17 ma Md=4. 87654
0
3
6
9
12
15
876540
3
6
9
12
15
Il fatto è che la moda non coinvolge nel conto Il fatto è che la moda non coinvolge nel conto tutte le modalità. Per lo stesso motivo la moda tutte le modalità. Per lo stesso motivo la moda di un miscuglio si comporta in modo imprevistodi un miscuglio si comporta in modo imprevisto(pensate a un corridore al Giro che vince la classifica ‘a punti’ senza vincere neanche una tappa)