notes of descriptive statistics and...

NOTES OF DESCRIPTIVE STATISTICS

GIUSEPPE BOARI – GABRIELE CANTALUPPI

AND PROBABILITY

Indice

Prefazione iii

1 Introduzione 1

2 Caratteri e scale di misura 7

3 Caratteri e loro rappresentazione grafica 25

4 Classificazione congiunta di due caratteri 53

5 Indici di posizione (1) 57

6 Indici di posizione (2) 95

7 Variabilità (1) 109




11 Indici di forma 157

12 Rapporti statistici 173

13 Analisi statistica bivariata 197

14 Connessione (1) 207

15 Connessione (2) 217

16 Studio della dipendenza se la variabile dipendente è di tipo quantitativo 231

17 Studio della dipendenza se entrambe le variabili sono di tipo quantitativo (1) 243

18 Studio della dipendenza se entrambe le variabili sono di tipo quantitativo (2) 255

19 Modelli polinomiali 267

20 Modelli riconducibili al modello retta 289

21 Esempio stima modelli in presenza di tabella a doppia entrata 299

22 Esempio stima modelli in presenza di coppie di dati 309

23 Regressione lineare multipla 319

24 Calcolo delle probabilità (1) 343




28 Richiami di matematica 411

29 Indice analitico 427

30 Riferimenti bibliografici 431

.1

i

Prefazione

La presente dispensa raccoglie, in versione cartacea, il materiale riguardante il corso diSTATISTICA. Trae origine dalle lezioni del Prof. Angelo ZANELLA, per lunghi annititolare dell’insegnamento presso la Facoltà di Economia dell’Università Cattolica delSacro Cuore, e presenta approfondimenti di carattere applicativo utili nell’ambito dellescienze economiche, della gestione aziendale, della gestione dei beni culturali e dellospettacolo e delle scienze del turismo.

Gli argomenti trattati riguardano essenzialmente la statistica descrittiva, lo studio dellaconnessione e della dipendenza, ed elementi introduttivi di calcolo delle probabilità.

Della dispensa esiste anche una versione elettronica (e-book), disponibile sul sitohttp://www.educatt.it/libri/materiali, destinata alla preparazione del-la prova scritta, e collegata (mediante link) con il materiale riguardante la soluzione disvariati temi d’esame (dei quali è disponibile anche una versione cartacea). Il testo ’Temie soluzioni per l’esame di statistica’ fornisce infatti differenti livelli di supporto: il sem-plice richiamo dell’argomento trattato, il collegamento automatico alle pagine di teoria,ai risultati degli esercizi e alla soluzione guidata e dettagliata degli stessi.

iii

http://www.educatt.it/libri/materiali

Sezione 1Introduzione

1.1

Indice

1 Che cosa è la Statistica 1

2 Caratterizzazione dell’approccio deduttivo e dell’approccio induttivo 2

3 La variabilità accidentale 2

4 Il modello statistico 4

5 Caratterizzazione della componente di errore 4

6 Le branche della statistica 5 1.2

1 Che cosa è la Statistica

• Diramazione delle Matematiche• Ausilio alle discipline sperimentali

– Fisica

– Chimica

– Biologia

– Medicina

– Economia

Categorie di discipline scientifiche

• DEDUTTIVE

– matematica

– geometria

• INDUTTIVE

– discipline che fanno ricorso alle indagini sperimentali empiriche

1.3

1

2 Caratterizzazione dell’approccio deduttivo e dell’ap-proccio induttivo

Approccio deduttivo1. Assunzione preliminare di certi enti e di alcune loro proprietà

assiomi

2. Acquisizione di altri contenuti per via deduttiva dagli assiomi

teoremi1.4

Approccio induttivo (sperimentale)

IPOTESI

osservazioni / nuovi fatti

conferma sperimentale

NOSI

(il ciclo si riattiva quando si presentano fatti nuovi)

TEORIA (formulazione/aggiornamento)

1.5

3 La variabilità accidentale

La statistica si interessa in particolare della variabilità accidentale.

Variabilità accidentaleEsistono fenomeni caratterizzati da molteplici manifestazioni , vale a dire fenomeni chedanno luogo a risultati non prevedibili con certezza.

Le differenti manifestazioni di un fenomeno possono verificarsi a seguito di meccanismidi:

• ripetitività virtuale,• ripetitività attuale.

1.6

Fenomeni caratterizzati da ripetitività virtualePossono idealmente essere ripetuti nelle stesse condizioni sperimentali.

Esempio 1 (Lancio di una moneta (T ;C)).

∼ 50%T ∼ 50%C

cause di variabilità:non si ripete l’esperimento nelle stesse condizioni.

1.7

2

Riduzione delle fonti di variabilità1. faccia della moneta posta in alto (T )

T ∼ 55%T ∼ 45%C

2. faccia della moneta posta in alto (T ) e supporto di lancio

T ∼ 80%T ∼ 20%C

3. faccia della moneta posta in alto (T ) e supporto di lancio e piano di atterraggio

T ∼ 99%T ∼ 1%C

1.8

Fenomeni caratterizzati da ripetitività attualeSi sono già manifestati: i risultati che si osservano sono caratterizzati da una certa varia-bilità (molteplicità).

Esempio 2 (Indagine sul reddito degli abitanti di una certa città a una certa data).

classi di reddito frequenza0 a 20 10%20 a 30 60%superiore a 30 30%

la variabilità dipende dalle differenti caratteristiche dei soggetti esaminati.1.9

Si può ridurre la variabilità, considerando altri fattori, che consentono di individua-re insiemi più omogenei di unità statistiche

1. soggetti con età 40 a 50classi di reddito frequenza0 a 20 2%20 a 30 33%superiore a 30 65%

2. soggetti con età 40 a 50 e professione impiegatoclassi di reddito frequenza0 a 20 2%20 a 30 13%superiore a 30 85%

3. soggetti con età 40 a 50 e professione impiegato e titolo di studio laureaclassi di reddito frequenza0 a 20 0%20 a 30 5%superiore a 30 95%

1.10

3

4 Il modello statistico

MODELLO ≡MECCANISMO GENERATORE DELLE OSSERVAZIONI

• descrive i possibili risultati (osservazioni)• nell’ipotesi di ripetere più volte l’esperimento

1.11

Esempio 3. Relazione fra il peso (Y ) e la sola altezza (X) di n individui adultimodello:

yi = a+bxi + ei, i = 1, . . . ,n

Y = f (X)+E = legge+ errore accidentale

Introduzione

40

50

60

70

80

90

100

150 160 170 180 190 200

COMPITO DELLA STATISTICA

- identificazione dei modelli - verifica della loro validità

1.12

5 Caratterizzazione della componente di errore

Accidentalità

• non prevedibile con certezza• non presenta sistematicità

caratteristica minimale:compensazione tra errori positivi e negativi (somma nulla).

1.13

Compito della statistica

• Identificazione del modello che meglio riproduce i dati,• verifica della validità del modello

4

FONTI DI INDETERMINATEZZA

• Imperfetta specificazione del modello:

– forma delle relazioni presenti nel modello(si sono, ad esempio, considerate solo relazioni di tipo lineare);

– variabili esplicative non incluse nel modello.

• Imprecisione degli strumenti di misura.

COME AFFRONTARE LA VARIABILITÀ

• Punto di vista deterministicocerca di eliminare la variabilità individuandone le fonti.

• Approccio statisticosepara la componente strutturale da quella aleatoria (segnale/rumore)

f (X) da Ela legge dall’ errore accidentale.

1.14

OsservazioneA volte l’aleatorietà è parte essenziale dell’esperimento

(es. giochi d’azzardo).

Considerazione conclusivaSi accetta l’indeterminatezza quando:

• l’eccessiva analiticità diventa troppo onerosa,• la parte strutturale f (x) non è sovrastata dall’errore (rumore).

Compito della statisticaPrevedere al meglio il valore della generica realizzazione del fenomeno oggetto di studio

1.15

6 Le branche della statistica

Statistica descrittivaSintesi delle osservazioni campionarie o dei dati censuari.

Statistica probabilisticaStudio del meccanismo generatore delle realizzazioni campionarie

(modello→ campione).

Statistica inferenzialeDal campione al suo meccanismo generatore

(campione→ modello).

1.16

5

Esempio 4 (Problema probabilistico). Si consideri una popolazione composta da 1000consumatori, 200 dei quali sono nostri clienti.

200 800

C C

Calcolare la probabilità che contattando un campione rappresentativo di 50 consumatori:

• 5 di questi siano nostri clienti;• 10 di questi siano nostri clienti;• 20 di questi siano nostri clienti.

OsservazioneLa nostra quota di mercato è del 20% e 10 corrisponde al 20% di 50.

1.17

Esempio 5 (Problema inferenziale). Solitamente la quota di mercato è incognita.

p? (1− p)?

C C

Estratto un campione rappresentativo di 50 soggetti abbiamo che 10 di questi sono nostriclienti e 40 sono della concorrenza.A partire da questa informazione e con riferimento alla conoscenza del meccanismo di’selezione’ del campione, si cerca una ’stima’ della nostra quota di mercato.

OsservazioneÈ impossibile fornire una risposta certa.Mediante gli strumenti della statistica inferenziale verrà, ad esempio, indicato un inter-vallo (p− ε, p+ ε) di valori plausibili con associato un predefinito livello di probabilità.

1.18

6

Sezione 2Caratteri e scale di misura

2.1

Indice

1 Le fasi di una ricerca 7

2 La rilevazione dei dati 82.1 Oggetto della rilevazione (censimento/campione) . . . . . . . . . . . . . 8

3 Lo spoglio dei dati 15

4 Terminologia essenziale 15

5 Tipi di caratteri e scale di misura 16

6 I caratteri qualitativi 16

7 I caratteri quantitativi 197.1 Variazione assoluta, misura relativa e variazione relativa . . . . . . . . . 20

8 Scale per caratteri quantitativi 21

9 Alcune considerazioni sulle scale di misura 23 2.2

1 Le fasi di una ricerca

1. Identificazione del problema2. Astrazione

• individuazione variabili osservabili (proxy)

3. Rilevazione

• sperimentazione, questionari, . . .

4. Spoglio dei dati

(a) organizzazione dati

(b) classificazione

5. Elaborazione dei dati

(a) sintesi

(b) interpretazione

(c) inferenza

7

OsservazioneUna prima statistica consiste nel costruire le tabelle riassuntive.

2.3

2 La rilevazione dei dati

Può essere effettuata tramite:

• sperimentazionetipicamente nell’ambito dei processi industriali e nel controllo della qualità

• questionarianche in questo caso spesso si effettuano delle ’sperimentazioni’, come avviene ad esempioper la valutazione del gradimento di nuove caratteristiche di un prodotto/servizio

• basi dati aziendaliinterrogazioni dei data base aziendali con procedure SQL

• basi dati istituzionaliIstat, Eurostat, Banca d’Italia, Uffici comunali dati statistici

• Internet, social networks, tweettipicamente analisi testuali

OsservazioneIl questionario ha anche finalità di comunicazione.

2.4

2.1 Oggetto della rilevazione (censimento/campione)

Definizione 1 (Rilevazione censuaria). Si rilevano dati su tutti i soggetti che costituisconola popolazione di riferimento.

Definizione 2 (Rilevazione campionaria). Si contatta solo un sottoinsieme (campione)della popolazione oggetto di studio.

OsservazionePer garantire che il campione sia rappresentativo della popolazione, si utilizzano proce-dure di selezione di natura casuale.

2.5

8

2.6

9

2.7

10

http://www.istat.it/it/prodotti/banche-dati

2.8

http://dati.istat.it

11

http://www.istat.it/it/prodotti/banche-dati

http://dati.istat.it

2.9

2.10

2.11

12

http://ec.europa.eu/eurostat/data/database

2.12

http://www.bancaditalia.it/statistiche/

2.13

13

http://ec.europa.eu/eurostat/data/database

http://www.bancaditalia.it/statistiche/

http://dati.comune.milano.it/

2.14

Una volta raccolti, i dati confluiscono nella cosiddetta matrice dei dati

Esempio 3 (Matrice dati votazioni studenti).1 2 3 4 5 . . . k

id (matr) cognome nome età voto stat . . . voto laurea1 1234321 Astolfi Antonio 23 28 . . . 1052 4321234 Bianchi Mario 22 31 . . . 110L...

......

......

......

n 7654567 Zito Mario 22 28 . . . 108

Esempio 4 (Matrice dati imprese).1 2 3 4 5

id (ragione soc.) settore dimensione n. dipendenti fatturato1 abc industria grande 123 2 050 2342 ayz terziario piccola 5 520 342...

......

......

...n zyz industria media 60 520 420

2.15

• In ogni riga della matrice dei dati figurano tutte le informazioni riferite a un singolosoggetto.

• In ogni colonna della matrice dei dati figurano le manifestazioni di una singolavariabile per tutti i soggetti.

2.16

14

http://dati.comune.milano.it/

3 Lo spoglio dei dati

Esempio 5. Rilevazione tipologia ultima vacanza effettuata da un campione di n = 36soggetti

tipo conteggio n

mare ||||— ||||— ||||— |||| 19montagna ||||— ||||— | 11città d’arte |||| 4agriturismo || 2

n = 36

v j = singoli valori ( j = 1,2, . . . ,n)(le osservazioni di base) 2.17

FormalizzazioneIndicando con xi (i = 1,2, . . . ,k) le modalità distinte e con ni le rispettive frequenzeabbiamo

X = tipologia ultima vacanza

xi = tipo ni = frequenzax1 = mare n1 = 19x2 = montagna n2 = 11x3 = città d’arte n3 = 4x4 = agriturismo n4 = 2

n = 36

e, in estrema sintesi,X = (xi,ni), i = 1,2, . . . ,k

2.18

4 Terminologia essenziale

Unità statistiche o sperimentaliSupporto fisico/materiale su cui si estrinseca il fenomeno

• numero finito (popolazione)• infinità numerabile (universo)

CaratteriProprietà dell’unità sperimentale

• qualitativi• quantitativi

Modalità del carattere

• attributi o categorie (caratteri qualitativi)• misure (caratteri quantitativi)

2.19

15

5 Tipi di caratteri e scale di misura

Qualitativi / Categorici

tipo scalasconnessi scala nominale / per attributiordinati scala ordinale

(non ha senso confrontare distanze tra categorie)

Quantitativi / Metrici(sono misure espresse da numeri interi o reali)

tipodiscreticontinui

scalescala per intervalliscala per rapporti

2.20

6 I caratteri qualitativi

Esempi di caratteri qualitativi sconnessi (scala nominale)• comune di residenza• tipo di industria• tipo di fabbricazione

...

Non è possibile stabilire un ordine tra le categorie di un carattere qualitativo sconnesso.

Esempi di caratteri qualitativi ordinati (scala ordinale)• titolo di studio• grado di vendibilità• tipo di abitazione• risultato di un esame (A,B,C, . . . )

...2.21

Esempio 6. Esprimi la tua opinione riguardo al prolungamento degli orari di aperturadelle sale studio

moltod'accordo

indifferente decisamentecontrario

(punteggi espressi su scale convenzionali)(tipicamente la scala di Likert)

2.22

16

Indagine sulla soddisfazione dei clienti (’customer satisfaction’)

Esempio 7. Grado di soddisfazione relativo al servizio di bookshop di un museo

Insoddisfatto poco

soddisfatto

indifferente soddisfatto molto

soddisfatto

2.23


1 2 3 4 5

con 1 = Insoddisfatto, ..., 5 = Molto soddisfatto

2.24


Insoddisfatto Moltosoddisfatto

2.25

Nei precedenti esempi il carattere grado di soddisfazione è espresso su scale ordinali. Lafunzione di trasferimento, mediante la quale il generico soggetto ricodifica il suo statusmentale, che ha natura continua, in un punteggio convenzionale non è detto sia di tipolineare, come viene mostrato nei seguenti grafici.Le categorie del carattere qualitativo anche se espresse attraverso dei valori numericirimangono dei codici ordinati.

Funzione di trasferimento tra status mentale e punteggio dichiarato

status mentale

giudizio espresso

molto sodd.

M.sodd.

insodd.

Ins.1

2

3

4

5 •

•

La trasformazione ideale è quella lineare (proporzionalità) 2.26

17

Funzione di trasferimento tra status mentale e punteggio dichiarato

status mentale

giudizio espresso

molto sodd.

M.sodd.

insodd.

Ins.1

2

3

4

5 •

•

Nella realtà difficilmente la trasformazione sarà lineare. 2.27

OsservazioneNon ha senso confrontare distanze tra categorie(anche se codificate con valori numerici)

status mentale

giudizio espresso

molto sodd.

M.sodd.

insodd.

Ins.1

2

3

4

5

a b c d

•

•

infattiab 6= cd mentre (2−1) = (5−4).

2.28

18

OsservazioneDue soggetti potrebbero perfino avere funzioni di trasferimento diverse ed esprimerepunteggi differenti in corrispondenza dello stesso livello di percezione della soddisfazione

status mentale

giudizio espresso

molto sodd.

M.sodd.

insodd.

soggetto A

Ins.soggetto B1

2

3

4

5 •

•

Quale tra i due soggetti (A o B) è più severo nelle sue valutazioni? 2.29

7 I caratteri quantitativi

Le modalità di un carattere quantitativo sono delle misure, vale a dire dei numeri reali chedescrivono una proprietà oggettiva dell’unità statistica.

Tipologia• continui

l’insieme delle possibili modalità è un intervallo (esempi: altezza, peso, reddito,durata di una visita a un museo);

• discretil’insieme delle possibili modalità è un insieme finito o numerabile (esempi: numerodei componenti di una famiglia, punteggio finale campionato di calcio).

Proprietà dei caratteri quantitativi• ordinamento dei numeri reali• definibile una distanza d tra le modalità

2.30

Definizione 10 (Distanza). Dati due numeri reali x1 e x2, una funzione d(x1,x2) si defini-sce distanza tra x1 e x2 se gode delle seguenti proprietà:

1. d(x1,x2) = d(x2,x1) = |x2− x1|= |x1− x2| ≥ 0 (simmetria e non negatività)2. d(x1,x2) = 0↔ x1 = x23. |x1− x2| ≤ |x1− x3|+ |x2− x3| (diseguaglianza triangolare)

x1

x3

x2

OsservazioneHanno senso le differenze (e le somme) e, quindi, per i caratteri quantitativi, è possibileeffettuare operazioni aritmetiche (ad esempio calcolare delle medie).

2.31

19

7.1 Variazione assoluta, misura relativa e variazione relativa

Si considerino due misurazioni x1 e x2 di una grandezza X .Esempi:

• presenze alle esposizioni delle opere di Mirò e di Schiele• valore del titolo Sotheby’s al 30.01.2013 e al 28.02.2013

Si ipotizzi chex1 = 15 x2 = 20

Definizione 11 (Variazione assoluta tra x1 e x2).

∆ = x2− x1 =

> 0 se x2 > x1= 0 se x2 = x1< 0 se x2 < x1

∆ = x2− x1 = 20−15 = 52.32

Definizione 12 (Misura relativa di x2 rispetto a x1).

x2

x1=

> 1 se x2 > x1= 1 se x2 = x1< 1 se x2 < x1

x2

x1=

2015

= 1.3333

Se x1 e x2 sono due misurazioni di X in due istanti temporali, ad esempio t1 e t2, la misurarelativa viene denominata montante unitario.

In ambito finanziario il montante unitario è il capitale che si riceve alla fine del periodo diinvestimento a fronte di un investimento unitario. 2.33

Definizione 13 (Variazione relativa tra x1 e x2).

x2− x1

x1=

x2

x1−1 =

> 0 se x2 > x1= 0 se x2 = x1< 0 se x2 < x1

x2− x1

x1=

20−1515

=5

15=

x2

x1−1 =

2015−1 = 0.3333.

La variazione relativa può essere espressa in termini percentuali100

(x2− x1

x1

)% =

100

(x2

x1−1)

%

e con riferimento all’esempio abbiamo:

(100 ·0.3333)% = 33.33%.2.34

Esercizio 14 (Ideogrammi). Cosa suggerisce la seguente rappresentazione grafica?In seguito a nuove assunzioni il numero di meccanici

Rappresentazioni grafiche

Cosa suggeriscono le seguenti rappresentazioni grafiche? In seguito alle nuove assunzioni il numero di meccanici

→ è raddoppiato è triplicato è quadruplicato

→ oppure → è raddoppiato è triplicato è quadruplicato

Di quanto è cresciuto il numero di abitazioni considerate nell’ultima ricerca di mercato rispetto alle precedenti indagini?

→ oppure → del 100% del 150% del 300%


20

2.35

Esercizio 15. Cosa suggerisce la seguente rappresentazione grafica?In seguito a nuove assunzioni il numero di meccanici




→ analogo a → è raddoppiato è triplicato è quadruplicato


→ del 100% del 150% del 300%


2.36

Esercizio 16. Cosa suggerisce la seguente rappresentazione grafica?Di quanto è cresciuto il numero di abitazioni considerate nell’ultima ricerca di mercatorispetto alle precedenti indagini?








2.37

Esercizio 17. Cosa suggerisce la seguente rappresentazione grafica?Di quanto è cresciuto il numero di abitazioni considerate nell’ultima ricerca di mercatorispetto alle precedenti indagini?






→ del 100% del 150% del 300%

→ analogo a → del 100% del 150% del 200%

Letture di approfondimentoHuff D. (1954) How to Lie with Statistics, Norton & Company.Spirer F.H., Spirer L., Jaffe A.J. (1998) Misused Statistics, 2nd ed., Marcel Dekker. 2.38

2.39

2.408 Scale per caratteri quantitativi

Definizione 18 (Scala per intervalli). È caratterizzata dalle seguenti due proprietà

• zero convenzionale• unità di misura convenzionale

Esempi: temperature, date di calendario, anno di nascita, . . .(sono confrontabili le differenze semplici, non quelle percentuali) 2.41

Esempio 19. Una temperatura di 30 non si riferisce a uno stato termico ’doppio’ rispettoa una temperatura di 15

invecela differenza tra 30 e 34 è doppia che tra 20 e 22

Si considerino le misurazioni in gradi Fahrenheit (F = 32+1.8C)

C F0 32.0

15 59.020 68.022 71.630 86.034 93.2

21

34−30 = 4 = 2(22−20) = 2 ·293.2−86 = 7.2 = 2(71.6−68) = 2 ·3.6

30/15 = 2 6= 86/59 = 1.4576

non ha quindi senso calcolare ’misure relative’ e nemmeno ’variazioni relative’.2.42

Esempio 20. Se la temperatura in gradi Celsius passa da 20 a 24 si ha un aumento del20%

C F20 68.024 75.2

In corrispondenza F(20) = 68 e F(24) = 75.2 e si registra un aumento del 10.59%.2.43

Definizione 21 (Scala per rapporti). È caratterizzata dalle seguenti tre proprietà• zero oggettivo (naturale)• unità di misura convenzionale• modalità positive

Esempi: peso, lunghezza, velocità, età(ha senso trattare le variazioni percentuali). 2.44

Esempio 22. Una variazione di velocità da 60 a 90 km/h corrisponde all’incrementopercentuale tra le stesse velocità misurate, ad esempio, in m/sRicordando che 1km/h = 1000m/3600s = 0.2778m/s

km/ora m/sec60 16.666790 25.0000

e la variazione relativa in termini percentuali risulta

100 ·(

90−6060

)% = 50% = 100 ·

(25−16.6667

16.6667

)%.

2.45

OsservazioneI numeri indici, cfr. Sezione 11, sono delle misure relative e possono essere definiti soloper caratteri misurati su scale per rapporti.

OsservazioneLe variazioni assolute, calcolate su un carattere definito su scala per intervalli, sonodefinite su scala per rapporti.

2.46

Esempio 23. L’anno 2000 non rappresenta un istante temporale ’doppio’ rispetto all’anno1000mentre un’età di 30 anni è superiore del 50% di quella di 20 anni(età = differenza tra anno corrente e anno di nascita)L’età ha uno zero oggettivo (età alla nascita).Esempio 24. La differenza tra 30 e 34 è doppia che tra 20 e 22

0 20 22 30 34

32 68 71.6 86 93.2

0 2 0 4

convenzionale

oggettivo oggettivo

oggettivo oggettivo0 3.6 0 7.2

si crea uno zero oggettivo.2.47

22

9 Alcune considerazioni sulle scale di misura

L’impostazione seguita nella presentazione delle scale di misura fa riferimento a StevensSS 1946 On the Theory of Scales of Measurement. Science 103, 677-680.

Problema(Lord FM 1953 On the statistical treatment of football numbers. American Psychologist,8, 750-775)A ciascun componente di 2 squadre universitarie (matricole, 2 anno) di football ameri-cano viene assegnato in maniera casuale il numero di maglia.Ricevuti i numeri i componenti della squadra del 1 anno lamentano che i numeri loroassegnati sono troppo bassi.Quesiti

• Come possiamo classificare il carattere ’numeri assegnati’?• È possibile considerare il carattere ’numeri assegnati’ come un carattere di tipo

quantitativo e utilizzare le conseguenti misure di sintesi per risolvere il problema?2.48

Risposte

• Si tratta di un carattere qualitativo sconnesso.• I sostenitori dell’approccio cosiddetto ’operazionalista’ affermando

«Since the numbers don’t remember where they came from ...»

applicherebbero ’senza farsi troppi scrupoli’ la media aritmetica per confrontare idue gruppi di numeri.

In base alla classificazione proposta da Stevens tale prassi non può essere ammessa.

Una possibile soluzione può essere individuata adottando un’approccio cosiddettopragmatico.

2.49

Approccio pragmatico(Hand DJ 2004 Measurement theory and practice. The world through quantification,Wiley).Occorre definire in maniera molto accurata il contesto e le finalità dell’applicazione chestiamo conducendo.

• nel caso in oggetto non esiste relazione alcuna tra i numeri assegnati e il sistemaempirico basato sul livello di abilità dei giocatori.

• l’applicazione dei metodi statistici propri dei caratteri quantitativi può avere sensosolo se si considerano i due gruppi di numeri solo ’come numeri’, tenendo presenteche non descrivono l’abilità dei giocatori.

2.50

Quesiti

• La famosa batteria di test relativi al Quoziente Intellettivo che porta all’indicatoreQI misura l’ ’intelligenza’ di un individuo?

• Su quale scala è espressa?2.51

Risposte

• La batteria dei test misura, in realtà, il concetto sotteso all’insieme di quesiti pro-posti.La batteria di test e, in generale, ogni questionario rappresentano uno strumento dimisurazione.

23

• In base all’approccio pragmatico possiamo dire che:«The precise property being measured is defined simultaneously with the procedurefor measuring it, under the assumption of explicitly defining the meaning of theconcept one is measuring»(Hand DJ in Kenett Salini (eds.) 2012 Modern Analysis of Customer SatisfactionSurveys, Wiley)e che«In a sense this makes the scale type the choice of the researcher»(Hand DJ 2004 Measurement theory and practice. The world through quantifica-tion, Wiley, p. 63.)

2.52

OsservazioneQuesti ragionamenti possono, in alcune situazioni, giustificare il trattamento delle scalepresenti, ad esempio, nelle indagini di customer satisfaction che sarebbero da trattarecome propriamente ordinali, ma che correntemente vengono utilizzate come se fossero ditipo metrico.(Essenzialità delle fasi di astrazione e di ricerca della definizione dei concetti che sarannooggetto di analisi.)

Esercizio 25. Qual è la scala di misura della variabile ’quantità di cibo ingerito’?

La risposta sembra ovvia: si tratta di un carattere quantitativo continuo misurato su scalaper rapporti.

E se questa variabile fosse considerata una misura del ’livello di fame/sazietà di un indi-viduo’?

2.53

24

Sezione 3Caratteri e loro rappresentazionegrafica

3.1

Indice

1 Organizzazione dei dati elementari 251.1 Carattere qualitativo sconnesso . . . . . . . . . . . . . . . . . . . . . . . 261.2 Carattere qualitativo ordinato . . . . . . . . . . . . . . . . . . . . . . . . 301.3 Carattere quantitativo non raggruppato in classi . . . . . . . . . . . . . . 331.4 Carattere quantitativo raggruppato in classi . . . . . . . . . . . . . . . . 351.5 Il grafico di Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441.6 Riepilogo rappresentazioni grafiche . . . . . . . . . . . . . . . . . . . . 461.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2 Rappresentazione grafica delle serie storiche 49 3.2

1 Organizzazione dei dati elementari

Si costruiscono dei prospetti riassuntivi a partire dall’elenco delle osservazioni.

matrice dati impreseragione soc. settore dimensione n. dipendenti fatturato

1 abc industria grande 123 2 050 2342 ayz terziario piccola 5 520 342...

......

......

...n = 528 zyz industria media 60 520 420

v1,v2, . . . ,vn (generica colonna estratta dalla matrice dei dati)

Se il numero di categorie/valori distinti è limitato risulta agevole raccoglierli in unatabella. 3.3

Esempio 1. n imprese per settore

xi niagricoltura 76industria 195terziario 257

528

tra le n = 528 unità sperimentali esistono n2 = 195 unità con modalità x2 = industria.3.4

25

Esempio 2. n stanze per abitazione

xi ni1 1842 4513 3124 1975 846 26

1254

tra le n = 1254 unità sperimentali esistono n3 = 312 unità con modalità x3 = 3.3.5

1.1 Carattere qualitativo sconnesso

Riclassificazione delle osservazioni di un carattere qualitativo sconnessoSi è rilevato il carattere X = ’tipologia dell’ultimo spettacolo di evasione a cui hai par-tecipato’, ottenendo, per 8 soggetti, le seguenti osservazioni ( f = film, t = teatro, c =concerto)

soggetto 1 2 3 4 5 6 7 8evento f f c c f t f c

i valori possono essere riclassificati nella seguente tabella

xi ni fif 4 0.500t 1 0.125c 3 0.375

8 1.000

• xi: modalità,• ni: frequenze assolute; numero di unità statistiche con modalità xi,• fi =

nin : frequenze relative; quota di unità statistiche con modalità xi.

3.6

Definizione 3 (Mutabile statistica). L’insieme delle coppie

(xi,ni), i = 1, . . . ,k

è detto mutabile statistica.

Perdita d’informazione

xi ni fif 4 0.500t 1 0.125c 3 0.375

8 1.000

Rispetto ai dati iniziali si è persa l’informazione su quale soggetto abbia partecipato a unadeterminata manifestazione.

3.7

26

Rappresentazione grafica (grafico a bastoncini oppure a canne d’organo/rettangoli)

xi ni fif 4 0.500t 1 0.125c 3 0.375

8 1.000

xi

ni oppure fi

f t c

(modalità convenzionalmente equispaziate)3.8

Il grafico di ParetoIn presenza di un carattere qualitativo sconnesso l’ordine dato nella rappresentazionegrafica alle categorie è arbitrario.Nel grafico di Pareto le categorie vengono ordinate in funzione decrescente delle rispettivefrequenze. Si veda la Sezione 1.5 per il completamento del grafico di Pareto.

xi ni fif 4 0.500t 1 0.125c 3 0.375

8 1.000

xi

ni oppure fi

f c t

3.9

27

Le word cloudNell’ambito delle analisi testuali trovano applicazione le cosiddette word cloud che rap-presentano graficamente i termini che figurano con maggior frequenza in un documento.Ai fini della costruzione di una word cloud il documento viene preliminarmente tratta-to, eliminando, in particolare, le cosiddette stop words (articoli, preposizioni semplici earticolate, verbi ausiliari, etc.).La word cloud riporta i termini che figurano con frequenza più elevata nel testo; la di-mensione grafica dei termini viene determinata in funzione della loro frequenza nel testo,mentre la disposizione dei termini sul grafico è casuale.

3.10La seguente word cloud è stata costruita a partire dalla descrizione (circa 3 pagine) di unCorso di Studio presente nella Guida dello Studente. Di quale Corso di Studio si tratta?

cultu

rali

competenze

economiabeni

forniresettore

spettacologestione

arte

base

form

ativ

oimpresepercorso

storiaanalisi

discipline

necessarie

uman

istic

a

aziende

gestionalim

etod

olog

ie

operanti

particolare

teatrotemi

La word cloud è stata costruita utilizzando la funzione wordcloud disponibile nelpackage wordcloud del software statistico R. 3.11

Frequenze assolute o relative? (1)numero capi composizione

USA CH USA CHbovini 127976000 2005000 0.67 0.46suini 49602000 2006000 0.26 0.46ovini 13346000 377000 0.07 0.09

190924000 4388000 1.00 1.00

xixi

0.0e

+00

2.0e

+07

4.0e

+07

6.0e

+07

8.0e

+07

1.0e

+08

1.2e

+08

1.4e

+08

ni

bovini suini ovini

confronto in termini di dimensione 3.12

28

Frequenze assolute o relative? (2)

numero capi composizioneUSA CH USA CH

bovini 127976000 2005000 0.67 0.46suini 49602000 2006000 0.26 0.46ovini 13346000 377000 0.07 0.09

190924000 4388000 1.00 1.00

xixi

0.0

0.2

0.4

0.6

0.8

1.0

fi

bovini suini ovini

confronto in termini di composizione

3.13È anche possibile costruire un grafico a torta (settori proporzionali alle frequenze)

xi ni fi settoref 4 0.500 180

t 1 0.125 45

c 3 0.375 135

8 1.000 360

film

teatro

concerto

3.14

29

1.2 Carattere qualitativo ordinato

Riclassificazione delle osservazioni di un carattere qualitativo ordinatoSi è rilevato il carattere X = ’votazione’ ottenuta da 8 soggetti, ottenendo le seguentiosservazioni (d = discreto, b = buono, o = ottimo)

soggetto 1 2 3 4 5 6 7 8votazione d d o o d b d o

i valori possono essere riclassificati nella seguente tabella(perdendo l’informazione sul voto conseguito da ciascun soggetto)

xi ni fi Ni Fid 4 0.500 4 0.500b 1 0.125 5 0.625o 3 0.375 8 1.000

8 1.000


nin : frequenze relative; quota di unità statistiche con modalità xi.

3.15

xi ni fi Ni Fid 4 0.500 4 = 4 0.500 = 0.5 = 4/8b 1 0.125 5 = 4+1 0.625 = 0.5+0.125 = 5/8o 3 0.375 8 = 4+1+3 1.000 = 0.5+0.125+0.375 = 8/8

8 1.000


nin : frequenze relative; quota di unità statistiche con modalità xi,

• Ni: frequenze assolute cumulate; numero di unità statistiche con modalità fino a xi,• Fi =

Nin = ∑

ij=1 f j =

1n ∑

ij=1 n j: frequenze relative cumulate; quota di unità statisti-

che con modalità fino a xi.3.16

30

Rappresentazione grafica (grafico a bastoncini oppure a canne d’organo/rettangoli)

xi ni fid 4 0.500b 1 0.125o 3 0.375

8 1.000

xi

ni oppure fi

d b o

3.17Per rappresentare graficamente le frequenze cumulate ci si avvale della funzione di ripar-tizione F(x)

Funzione di ripartizione

• F(x) quota di unità statistiche con modalità fino a x.

La definizione di funzione di ripartizione ha carattere generale (può essere applicata a tuttii caratteri ordinati e, in particolare, anche ai caratteri quantitativi).Si osserva come x possa corrispondere anche a valori non osservati o inesistenti.Nell’esempio in esame: una votazione insufficiente o compresa tra buono e ottimo o anchesuperiore a ottimo.

3.18

31

Grafico Funzione di RipartizioneF(x) quota di unità statistiche con modalità fino a x

xi ni fi Ni Fid 4 0.500 4 0.500b 1 0.125 5 0.625o 3 0.375 8 1.000

8 1.000

x

0.0

0.2

0.4

0.6

0.8

1.0

F(x)

d b o

3.19

Grafico frequenze cumulateÈ possibile rappresentare graficamente anche le frequenze cumulate assolute mediante lafunzione N(x)

• N(x) numero di unità statistiche con modalità fino a x

xi ni fi Nid 4 0.500 4b 1 0.125 5o 3 0.375 8

8 1.000

x

02

46

8

N(x)

d b o

3.20

32

1.3 Carattere quantitativo non raggruppato in classi

Riclassificazione delle osservazioni di un carattere quantitativo non raggruppato inclassiValgono le stesse considerazioni fatte per i caratteri qualitativi ordinati.

Occorre solo tenere presente, nel costruire le rappresentazioni grafiche, che le modalitàdel carattere sono delle misure e quindi potrebbero essere non equispaziate.

3.21

Si è rilevata la variabile X = ’votazione’ riportata da 8 soggetti, considerata metricasecondo l’approccio pragmatico, ottenendo le seguenti osservazioni

soggetto 1 2 3 4 5 6 7 8votazione 24 24 30 30 24 28 24 30

i valori possono essere riclassificati nella seguente tabella

xi ni fi Ni Fi24 4 0.500 4 0.50028 1 0.125 5 0.62530 3 0.375 8 1.000

8 1.000

3.22


nin : frequenze relative; quota di unità statistiche con modalità xi,

• Ni =∑ij=1 n j: frequenze assolute cumulate; numero di unità statistiche con modalità

minore o eguale a xi,• Fi =

Nin = ∑

ij=1 f j: frequenze relative cumulate; quota di unità statistiche con mo-

dalità minore o eguale a xi.3.23

Definizione 4 (Serie statistica). L’insieme delle coppie

(xi,ni), i = 1, . . . ,k

è detto serie statistica.3.24

33

Rappresentazione grafica (grafico a bastoncini)

xi ni fi24 4 0.50028 1 0.12530 3 0.375

8 1.000

x

20 22 24 26 28 30 32

ni oppure fi

3.25

Grafico Funzione di RipartizionePer rappresentare graficamente le frequenze cumulate ci si avvale della funzione di ripar-tizione F(x)

• F(x) quota di unità statistiche con modalità minore o eguale a x

xi ni fi Ni Fi24 4 0.500 4 0.50028 1 0.125 5 0.62530 3 0.375 8 1.000

8 1.000

20 22 24 26 28 30 32

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x)

3.26

34

Grafico Frequenze cumulateÈ possibile rappresentare graficamente anche le frequenze cumulate assolute mediante lafunzione N(x)


xi ni fi Ni24 4 0.500 428 1 0.125 530 3 0.375 8

8 1.000

20 22 24 26 28 30 32

02

46

8

x

N(x)

3.27

1.4 Carattere quantitativo raggruppato in classi

Nel caso di variabile continua si hanno troppi valori distinti!!È opportuno raggruppare i dati in classi.In genere le classi sono chiuse a destra (da . . . escluso, a . . . incluso] 3.28

Esempio 5. Si è rilevata l’altezza di 10 individui ottenendo le seguenti misurazioni:

soggetto 1 2 3 4 5 6 7 8 9 10altezza 175 168 165 172 180 185 178 172 174 183

↑ ↑min max

I valori assunti dalle unità statistiche possono essere rappresentati come punti sulla rettareale

175168165 172 180 185178172 174 183

3.29

35

Si consideri un intervallo (h0,hk] inclusivo di tutti i valori,

175168165 172 180 185178172 174 183

](h0 h k

(ma anche di possibili valori che potrebbero essere rilevati su altre unità statistiche)quindi

h0 < min teorico e hk ≥max teorico3.30

si definisca una partizione dell’intervallo in k sottoinsiemi (denominati classi)

( ( (] ] ]h0 h1 h2 h k−1 h k

classe 1 classe 2 ... classe k

Le k classi(h0,h1],(h1,h2], . . . ,(hk−1,hk]

costituiscono una partizione dell’intervallo (h0,hk]; infatti:

1. sono intervalli (insiemi) disgiunti,2. la loro unione coincide con (h0,hk].

3.31

Nel caso in esame si ipotizzi di utilizzare k = 3 classi.


↑ ↑min max

È, quindi, possibile assegnare ciascuno dei valori osservati a una e una sola delle classi

175168165 172 180 185178172 174 183

( ( (] ] ]162 170 180 190

Si osserva il carattere esaustivo della classificazione operata.3.32

36

Una volta definiti gli estremi delle classi, i seguenti valori


possono essere riclassificati in una tabella

i classe hi−1 a hi ni1 h0 = 162 a h1 = 170 22 h1 = 170 a h2 = 180 63 h2 = 180 a h3 = 190 2

10

• hi−1: estremo inferiore della classe i-esima,• hi: estremo superiore della classe i-esima,• ni: frequenze assolute; numero di unità statistiche con valore tra hi−1 e hi.

3.33

Definizione 6 (Seriazione statistica). L’insieme degli elementi

((hi−1,hi),ni), i = 1, . . . ,k

è detto seriazione statistica.

OsservazioneNella determinazione delle classi (hi−1 a hi) occorre evitare le seguenti situazioni:

• poche classi con frequenze troppo elevate,• molte classi con frequenze troppo basse (≤ 15).

3.34

Il fenomeno può essere analizzato non solo in termini assoluti, ma anche in termini relativi

hi−1 a hi ni fi162 a 170 2 0.2170 a 180 6 0.6180 a 190 2 0.2

10 1

• fi =nin : frequenze relative; quota di unità statistiche con valore tra hi−1 e hi

3.35

e si possono anche costruire le frequenze cumulate

hi−1 a hi ni fi Ni Fi162 a 170 2 0.2 2 0.2170 a 180 6 0.6 8 0.8180 a 190 2 0.2 10 1

10 1

• hi−1,hi: estremi inferiore e superiore della classe i-esima,• ni: frequenze assolute; numero di unità statistiche con valore tra hi−1 e hi,• fi =

nin : frequenze relative; quota di unità statistiche con valore tra hi−1 e hi,

• Ni: frequenze assolute cumulate; numero di unità statistiche con modalità ≤ hi,• Fi: frequenze relative cumulate; quota di unità statistiche con modalità ≤ hi.

3.36

37

Perdita d’informazionesoggetto 1 2 3 4 5 6 7 8 9 10altezza 175 168 165 172 180 185 178 172 174 183

hi−1 a hi ni162 a 170 2170 a 180 6180 a 190 2

10

Rispetto ai dati iniziali non si è solo persa l’informazione su quale soggetto abbia una de-terminata altezza, ma non si hanno più nemmeno i valori delle singole altezze all’internodi ciascuna classe.

3.37

Ipotesi di equidistribuzione delle unità statistiche all’interno di ciascuna classehi−1 a hi ni

162 a 170 2170 a 180 6180 a 190 2

10

( ( (] ] ]162 170 180 190

È come se si suddividesse ciascuna classe hi−1 a hi in ni sottoclassi e si posizionassero idati in corrispondenza degli estremi superiori di queste sottoclassi.

3.38

Definizione 7 (Densità di frequenza (assoluta)). Rapporto tra il numero, ni, di unitàstatistiche nella classe i e l’ampiezza della classe ai = hi−hi−1

di =ni

ai.

Essa rappresenta il numero (medio) di unità statistiche che cadono in un generico inter-vallo di ampiezza unitaria all’interno della classe.

Graficamente, nell’ipotesi che ni 1, abbiamo

](

hi−1 hi

intervallo unitario3.39

La densità di frequenza può, naturalmente, essere espressa anche in termini relativi.

Definizione 8 (Densità di frequenza (relativa)). Quota (media) di unità statistiche chevengono a cadere in un generico intervallo di ampiezza unitaria all’interno della classe

di =fi

ai

rapporto tra quota di unità statistiche nella classe e ampiezza della classe ai = hi−hi−1.3.40

38

Rappresentazione grafica (istogramma)Sull’asse delle ordinate si riportano le densità di frequenza (assolute o relative)

hi−1 a hi ni fi ai di(assolute) di(relative)162 a 170 2 0.2 8 0.25 0.025170 a 180 6 0.6 10 0.60 0.060180 a 190 2 0.2 10 0.20 0.020

10 1.0

x

150 160 170 180 190 200

ni ai oppure fi ai

3.41

Interpretazione istogrammaL’area di ciascun rettangolo nell’istogramma coincide con la frequenza assoluta (relativa)della classe

niai

ai · niai= ni

ai

fiai

ai · fiai= fi

ai

3.42

39

Funzione di ripartizione F(x)Quota di unità statistiche con modalità minore o eguale a x


10 1

x

150 160 170 180 190 200

0.0

0.2

0.4

0.6

0.8

1.0

F(x)

sulla base delle informazioni disponibili possiamo solo quantificare il valore di F(x) soloper x = hi, i = 1, . . . ,k, x < h0 e x > hk.

3.43

40

Ipotizzando però l’equidistribuzione delle unità statistiche all’interno di ciascuna clas-se possiamo individuare la posizione delle singole ni osservazioni di ciascuna classeottenendo (cfr. rappresentazione per caratteri discreti)


10 1

150 160 170 180 190 200

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x)

3.44

41

Quando il numero di unità statistiche risulta sufficientemente elevato in ciascuna classe,ni 1, otteniamo

150 160 170 180 190 200

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x)

3.45

In tal caso la funzione a gradini può essere approssimata con una spezzata

x

150 160 170 180 190 200

0.0

0.2

0.4

0.6

0.8

1.0

F(x)

Questa rappresentazione viene comunque utilizzata anche nel caso di ni qualsiasi, facendol’ipotesi che ni 1. 3.46

42

È possibile rappresentare graficamente anche le frequenze cumulate assolute mediante lafunzione N(x)


hi−1 a hi ni fi Ni162 a 170 2 0.2 2170 a 180 6 0.6 8180 a 190 2 0.2 10

10 1

x

150 160 170 180 190 200

02

46

810

N(x)

3.47

43

1.5 Il grafico di Pareto

Nella Sezione 1.1 si è introdotta una possibile descrizione del grafico di Pareto, ricordandocome nello stesso le categorie vengano ordinate in funzione decrescente delle rispettivefrequenze.Il grafico di Pareto viene solitamente completato riportando sullo stesso anche una rap-presentazione delle frequenze cumulate relative, ottenute in accordo all’ordinamento dellecategorie tipico del grafico in oggetto.

3.48Con riferimento all’esempio del carattere X = ’tipologia dell’ultimo spettacolo di evasio-ne a cui hai partecipato’, utilizzato per introdurre il grafico di Pareto abbiamo la seguenterappresentazione.

xi ni Ni Fif 4 4 0.500c 3 7 0.875t 1 8 1.000

8

4

3

1

0%

20%

40%

60%

80%

100%

film concerto teatro

Tipologia di Spettacolo (Grafico di Pareto)

Ai fini della determinazione delle frequenze cumulate anche le categorie nella tabella sonostate ordinate in funzione decrescente della loro frequenza.

3.49Il grafico di Pareto consente di individuare il ’gruppo’ di categorie ’più frequenti’ conriferimento al carattere oggetto di studio.

Applicazioni in ambito aziendale possono essere, ad esempio, riferite alla determina-zione dell’insieme delle tipologie di difettosità più frequenti nell’ambito di un processoproduttivo o dell’insieme di prodotti che contribuiscono maggiormente al fatturato. 3.50

Si osserva come il grafico di Pareto evidenzi le categorie più ’frequenti’ che potrebberonon coincidere con le più ’importanti’.Gli interventi di strategia aziendale dovranno tenere conto anche di altre variabili oltrealla frequenza di difettosità o all’ammontare di fatturato per prodotto; ad esempio, i costidi intervento o il livello di gravità dei difetti nell’ambito del controllo di un processo indu-striale (un difetto anche se poco frequente potrebbe però bloccare il processo produttivo)oppure il potenziale di sviluppo o l’importanza strategica di alcuni prodotti nell’ambito diuna definizione delle strategie di Marketing.Si veda al riguardo Montgomery D.C. 2000 Controllo statistico della qualità, Mc-Graw-Hill.

Si osserva che la rappresentazione secondo un grafico di Pareto può essere estesa anchead altre tipologie di caratteri oltre ai qualitativi sconnessi. 3.51

44

Si considera la costruzione del grafico di Pareto riferito all’analisi testuale della descri-zione (circa 3 pagine) di un Corso di Studio presente nella Guida dello Studente, di cui siè ottenuta la seguente word cloud nella Sezione 1.1.

cultu

rali

competenze

economiabeni

forniresettore

spettacologestione

arte

base

form

ativ

o

impresepercorso

storiaanalisi

discipline

necessarie

uman

istic

a

aziende

gestionali

met

odol

ogie

operanti

particolare

teatrotemi

3.52

Il grafico di Pareto deve in questo caso necessariamente essere costruito, omettendo itermini che hanno una frequenza bassa.La precedente word cloud è stata costruita a partire da un insieme di 346 termini. Ai finidella costruzione del grafico di Pareto si considerano solo i termini che figurano almeno5 volte nel documento. 3.53

2316

12 10 10 10 8 7 5 5 5 5 5 5

0%

20%

40%

60%

80%

100%

cultu

rali

com

pete

nze

econ

omia

beni

fornir

e

setto

re

spet

taco

lo

gesti

one

arte

base

form

ativo

impr

ese

perc

orso

storia

Descrizione di un Corso di Studio (grafico di Pareto)

3.54

Si osserva come riordinando in maniera opportuna gli 8 termini più frequenti, che rap-presentano quasi l’80% dei termini nell’insieme considerato, si ottenga una descrizionesintetica delle finalità principali del Corso di Studio.L’elevata frequenza dell’attributo ’culturali’ è legata sia al suo utilizzo congiunto con’beni’ (’beni culturali’) sia al suo utilizzo come qualificatore di altri elementi presentinella descrizione del Corso di Studio.Analisi testuali più raffinate prevedono anche la cosiddetta lemmatizzazione dei termini,ovvero la trasformazione dei termini in lemmi. Si rinvia, al riguardo, alle metodologie di’Text mining’ e di ’Linguistica computazionale’.I grafici di Pareto sopra riportati sono stati ottenuti utilizzando la funzione paretochartdisponibile nel package qicharts2 del software statistico R. 3.55

45

1.6 Riepilogo rappresentazioni grafiche

Frequenze semplici ni, fiTipologia carattere

qualitativo qualitativo quantitativo quantitativosconnesso ordinato no classi con classi

ni ai oppure fi ai

3.56

Frequenze cumulate Ni,FiTipologia carattere

qualitativo qualitativo quantitativo quantitativosconnesso ordinato no classi con classi

non definita

3.57

OsservazionePer ogni variabile presente nella matrice dei dati

matrice dati impreseragione soc. settore dimensione n. dipendenti fatturato

1 abc industria grande 123 2 050 2342 ayz terziario piccola 5 520 342...

......

......

...n zyz industria media 60 520 420

siamo in grado di effettuare sintesi univariate (tabelle e grafici).

Nel seguito considereremo ulteriori analisi (indici di posizione e variabilità).3.58

46

OsservazioneSi osserva come la locuzione variabile statistica venga comunemente utilizzata per indi-care sia l’insieme delle coppie (xi,ni), i = 1, . . . ,k nel caso di una mutabile statistica odi una serie statistica, sia l’insieme degli elementi ((hi−1,hi),ni), i = 1, . . . ,k nel casodi una seriazione statistica.

3.59

1.7 Esercizi

Eventuali riferimenti in parentesi riportano numero del tema d’esame, data e numero diesercizio della corrispondente prova di Statistica I (Università Cattolica del Sacro Cuore,Milano, Facoltà di Economia, Interfacoltà di Economia-Lettere).

Esercizio 9. Nella seguente figura sono riportate le Funzioni di Ripartizione relative alleseriazioni statistiche:

• X : distribuzione dei redditi nella località A;• Y : distribuzione dei redditi nella località B.

0 10 20 30 40 50 600 10 20 30 40 50 60

0.2

0.7

0.8

1

A

B

In quale località si ha presenza di redditi più elevati?

A≺ B: i redditi in B sono superiori a quelli in AA B: i redditi in A sono superiori a quelli in B

3.60

Definizione 10 (Dominanza Statistica). Siano FX (·) e FY (·) le funzioni di ripartizione didue variabili statistiche X e Y .

• X si dice statisticamente inferiore a Y (indicato con la notazione X ≤ Y ) se vale:

FX (w)≥ FY (w), ∀w ∈ℜ.

• X si dice statisticamente superiore a Y (indicato con la notazione X ≥ Y ) se vale:

FX (w)≤ FY (w), ∀w ∈ℜ.3.61

47

Esercizio 11 (T 162, 24.06.1998, A). Una delegazione provinciale della F.I.C. (Federa-zione Italiana Cronometristi) dispone dei dati inerenti 15 servizi di cronometraggio esple-tati dai suoi 8 componenti (A,B, . . . ,H) durante l’anno. Si riportano il tipo di sport (S,nelle categorie n = nuoto, s = sci, c = ciclismo), la stagione del servizio (T , a = autunno,i = inverno, p = primavera, e = estate), la durata del servizio (D, in minuti) e l’entità delrimborso complessivamente percepito per il servizio (R, in e).

serv 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15cron B B H G F A E E B C D D B C GS n n c c n s s n s n s s c c nT a a a a i i i i i p p p p p pD 120 120 360 60 180 360 360 120 360 180 480 420 300 420 180R 20 20 45 60 30 50 70 30 60 45 60 70 40 60 30

1. Si rappresenti graficamente la mutabile S.2. Si rappresentino graficamente le frequenze assolute e la funzione di ripartizione

della variabile D.3. Si raggruppino i valori di R in tre classi chiuse a destra di ampiezza 25, consi-

derando come estremo inferiore della prima classe il valore 10, e se ne dia unarappresentazione grafica.

3.62

Esercizio 12 (T 258-3, 15.07.2010, 1). Con riferimento a 80 soggetti si riportano le di-stribuzioni del tempo in minuti, Y , dedicato alla visita di una mostra, distinte rispetto allivello di conoscenza artistica (’visitatori esperti’ e ’visitatori occasionali’):

’visitatori esperti’hi−1 a hi fi5 a 10 0.40

10 a 20 0.4020 a 25 0.20

1.00

’visitatori occasionali’hi−1 a hi fi5 a 10 0.76

10 a 20 0.0820 a 25 0.16

1.00

1. Si rappresentino graficamente le distribuzioni delle frequenze relative per le duetipologie di visitatori. -

2. Si riporti l’ordinamento delle classi della distribuzione di frequenza dei visitatoriesperti in funzione crescente del livello di concentrazione di unità statistiche.

3.63

Esercizio 13 (T 180, 14.09.2000, 1). Lo spessore X delle lamine prodotte da una mac-china è compreso tra 15.2 e 16.5 mm.Si individuino le ampiezze delle 4 classi (Ii) in cui è ripartito l’intervallo (15.1;16.5] inmodo tale che:

I1 I2 I3 I4fi 0.05 0.09 0.72 0.14di 0.25 0.45 2.40 0.20

1. Si costruisca l’istogramma della variabile X .2. Supponendo che dalla produzione vengano scartate le lamine con spessore minore

di 15.3 mm o superiore di 16 mm, si calcoli, sulla base del grafico prima costruito,la percentuale di lamine eliminate.

3.64

48

2 Rappresentazione grafica delle serie storiche

Le serie storicheUna serie storica Xt è una sequenza di valori

x0,x1, . . . ,xT

registrati:

• in corrispondenza degli istanti temporali t = 0,1,2, . . . ,T• al termine degli intervalli (t−1, t], t = 0,1,2, . . . ,T .

Si pensi, ad esempio, alla quotazione giornaliera di un titolo di borsa oppure alla realiz-zazione mensile o trimestrale del fatturato di un’azienda.

Serie storiche di stock e di flusso

• La serie storica si definisce di stock se i riferimenti temporali sono istanti temporali(’capitale sociale’, ’quotazione di chiusura di un titolo’).

• La serie storica si definisce di flusso se i riferimenti temporali sono degli intervallitemporali(’risultato economico di esercizio’, ’volume degli scambi’).

3.65

3.66

A partire dai valori osservati è possibile definire:

• la sequenza delle variazioni assolute rispetto a un particolare istante temporale, adesempio t = 0:

x0− x0 = 0,x1− x0, . . . ,xT − x0

• la sequenza delle misure relative rispetto a un particolare istante temporale, adesempio t = 0:

x0

x0= 1,

x1

x0, . . . ,

xT

x0

• la sequenza delle variazioni relative rispetto a un particolare istante temporale, adesempio t = 0:

x0− x0

x0= 0,

x1− x0

x0=

x1

x0−1, . . . ,

xT − x0

x0=

xT

x0−1

49

che possono anche essere espresse come variazioni relative percentuali (se molti-plicate per 100):

0,x1− x0

x0, . . . ,

xT − x0

x0

= 100

0,

x1− x0

x0, . . . ,

xT − x0

x0

%

0,x1

x0−1, . . . ,

xT

x0−1

= 100

0,

x1

x0−1, . . . ,

xT

x0−1

%

3.67

Esempio 14. Serie storica Xt delle valutazioni contabili del patrimonio dell’azienda Yrisultanti dai bilanci degli esercizi 2003, . . . ,2007 (dati in milioni di e); le sequenze dellevariazioni assolute xt − xt−1, delle misure relative xt

xt−1e delle variazioni relative semplici

e percentuali, xt−xt−1xt−1

e 100 xt−xt−1xt−1

%, definite rispetto agli istanti temporali t−1:

t Anno xt xt − xt−1xt

xt−1

xt−xt−1xt−1

%0 2003 5181 2004 550 32 1.0618 0.0618 6.182 2005 540 −10 0.9818 −0.0182 −1.823 2006 580 40 1.0741 0.0741 7.414 2007 608 28 1.0483 0.0483 4.83

3.68Si riportano le possibili rappresentazioni grafiche delle serie storiche oggetto di analisi.

2002 2003 2004 2005 2006 2007 2008

450

500

550

600

650

Serie storica xt che descrive l’andamento del patrimonio dell’azienda Y tra il 2003 e il2007 (dati in milioni di e) (stock) 3.69

50

2002 2003 2004 2005 2006 2007 2008

−20

−10

010

2030

4050

Serie storica xt−xt−1 che descrive le variazioni del patrimonio dell’azienda Y tra il 2003e il 2007 (dati in milioni di e) (flusso) 3.70

2002 2003 2004 2005 2006 2007 2008

450

550

650

2002 2003 2004 2005 2006 2007 2008

−20

020

40

2002 2003 2004 2005 2006 2007 2008

0.90

1.00

1.10

Serie storiche xt , xt−xt−1 e xtxt−1

che descrivono rispettivamente il patrimonio dell’aziendaY , le sue variazioni assolute e i valori relativi, di anno in anno, tra il 2003 e il 2007. 3.71

51

2002 2003 2004 2005 2006 2007 2008

−20

020

40

2002 2003 2004 2005 2006 2007 2008

−0.

040.

000.

040.

08

2002 2003 2004 2005 2006 2007 2008

−4

02

46

8

Serie storiche che descrivono le variazioni assolute xt−xt−1, le variazioni relative sempli-ci e percentuali, xt−xt−1

xt−1e 100 xt−xt−1

xt−1%, subite di anno in anno dal patrimonio dell’azienda

Y tra il 2003 e il 2007. 3.72

Esercizio 15. Si ricostruiscano le rappresentazioni grafiche precedenti con riferimentoalla seguente serie storica:

t Anno xt xt − xt−1xt

xt−1

xt−xt−1xt−1

100 xt−xt−1xt−1

%0 2000 1001 2001 502 2002 1003 2003 1504 2004 100

3.73

52

Sezione 4La classificazione congiunta didue caratteri

4.1

Indice

1 La classificazione congiunta di due caratteri 53

2 Le distribuzioni marginali 54

3 Le distribuzioni condizionate 55

4 Formalizzazione simbolica v.s. doppia 55 4.2

1 La classificazione congiunta di due caratteri

Esempio 1. Con riferimento ai dati, inerenti 15 servizi di cronometraggio complessiva-mente espletati da 8 componenti della F.I.C. (Federazione Italiana Cronometristi), cfr.Esercizio nella sezione precedente,

servizio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15D 120 120 360 60 180 360 360 120 360 180 480 420 300 420 180R 20 20 45 60 30 50 70 30 60 45 60 70 40 60 30

si vuole studiare il comportamento congiunto delle variabili D ed R.A tal fine si raggruppano i valori di D nelle tre classi (50,180],(180,360],(360,480] e ivalori di R nelle tre classi (10,35],(35,60],(60,85].

D \ R 10 a 35 35 a 60 60 a 8550 a 180180 a 360360 a 480

4.3Ciascuna unità statistica può essere assegnata a una e una sola delle celle nella tabella;occorre conteggiare quante unità statistiche corrispondono a ciascuna combinazione delleclassi di D = durata del servizio e R = entità del rimborso

D \ R 10 a 35 35 a 60 60 a 85 ni•50 a 180 5 2 0 7180 a 360 0 4 1 5360 a 480 0 2 1 3

n• j 5 8 2 15

53

Il valore 4 nella seconda riga, seconda colonna (parte interna della tabella) indica che trale 15 unità statistiche ve ne sono 4 che hanno prestato una durata del servizio tra 180 e360 minuti ricevendo un rimborso compreso tra 35 e 60 e.

Esso viene indicato con n22, dove il primo indice sta a indicare la classe della variabileD (indice di riga) mentre il secondo indice indica la classe della variabile R (indice dicolonna). 4.4

Abbiamo quindi

D \ R 10 a 35 35 a 60 60 a 85 ni•50 a 180 n11 = 5 n12 = 2 n13 = 0 n1• = 7

180 a 360 n21 = 0 n22 = 4 n23 = 1 n2• = 5360 a 480 n31 = 0 n32 = 2 n33 = 1 n3• = 3

n• j n•1 = 5 n•2 = 8 n•3 = 2 n = 15

• ni j frequenze congiunte; numero di unità statistiche con modalità (appartenenti allaclasse) corrispondente alla i-esima riga e j-esima colonna.

• ni• frequenze marginali di D; numero di unità statistiche con i-esima modalità (ap-partenenti alla i-esima classe) di D; (somma delle frequenze congiunte nella i-esimariga;

• n• j frequenze marginali di R; numero di unità statistiche con j-esima modalità(appartenenti alla j-esima classe) di R; (somma delle frequenze congiunte nellaj-esima colonna.

4.5

2 Le distribuzioni marginali

Si osserva come nella tabellaD \ R 10 a 35 35 a 60 60 a 85 ni•

50 a 180 n11 = 5 n12 = 2 n13 = 0 n1• = 7180 a 360 n21 = 0 n22 = 4 n23 = 1 n2• = 5360 a 480 n31 = 0 n32 = 2 n33 = 1 n3• = 3

n• j n•1 = 5 n•2 = 8 n•3 = 2 n = 15

figurino anche le frequenze assolute delle due variabili D e R considerate separatamente

D ni•50 a 180 7

180 a 360 5360 a 480 3

15

R n• j10 a 35 535 a 60 860 a 85 2

15

La frequenza n1• = 7, attinente alla classe 50 a 180 è stata ottenuta sommando n11 = 5,n12 = 2 e n13 = 0.

Il simbolo • sostituisce l’indice rispetto al quale si è effettuata la somma:

7 = n1• = n11 +n12 +n13 =3

∑j=1

n1 j.

Le distribuzioni delle due variabili D e R, considerate separatamente, sono dette distribu-zioni marginali. 4.6

OsservazioneNon è immediato stabilire, con la semplice lettura della tabella, se la durata del servizio(D) induce un aumento dell’importo percepito (R); necessitano, a tale proposito, ulterioristrumenti statistici che verranno presentati nell’ambito dell’analisi statistica bivariata.

4.7

54

3 Le distribuzioni condizionate

È possibile anche studiare la distribuzione di uno dei due caratteri in corrispondenza di unsottoinsieme di unità statistiche che assumono una determinata categoria o un determinatovalore o appartengono a una certa classe dell’altro carattere.In questo modo si ottengono le cosiddette distribuzioni condizionate. 4.8

Esempio 2. La distribuzione dell’importo percepito R condizionata al fatto che la duratadel servizio D sia compreso nell’intervallo (50,180] è riferita a n1• = 7 unità statistiche(cfr. la prima riga della tabella a doppia entrata) e risulta

r j|d1 n1 j10 a 35 535 a 60 260 a 85 0

7

Il simbolo |d1 indica il condizionamento alla prima categoria/modalità/classe di D.4.9

Esempio 3. La distribuzione della durata del servizio D condizionata al fatto che l’importopercepito R sia compreso nell’intervallo (35,60] è riferita a n•2 = 8 unità statistiche (cfr.la seconda colonna della tabella a doppia entrata) e risulta

di|r2 ni250 a 180 2

180 a 360 4360 a 480 2

8

Il simbolo |r2 indica il condizionamento alla seconda categoria/modalità/classe di R.4.10

4 Formalizzazione simbolica v.s. doppia

Le coppie di dati elementari vr,wr (r = 1,2, . . . ,n) sono riassunte in h modalità/classixi e k modalità/classi y j

X \ Y y1 . . . y j . . . yk ni•x1 n11 . . . n1 j . . . n1k n1•...

......

......

xi ni1 . . . ni j . . . nik ni•...

......

......

xh nh1 . . . nh j . . . nhk nh•n• j n•1 . . . n• j . . . n•k n

xi,y j = eventuali valori centralini• = totali di riga = ∑

kj=1 ni j

n• j = totali di colonna = ∑hi=1 ni j

h

∑i=1

k

∑j=1

ni j =h

∑i=1

ni• =k

∑j=1

n• j = n.

4.11

55

Definizione 4 (Variabile/Mutabile statistica doppia). L’insieme (X ,Y ) delle terne

xi,y j,ni j, i = 1,2 . . . ,h; j = 1,2, . . . ,k,

dove gli elementi xi,y j possono essere categorie, valori singoli, classi o valori centralidelle classi, è detto mutabile/variabile statistica doppia.

Dalla mutabile/serie/seriazione doppia è possibile ricavare due distribuzioni marginaliunivariate e 2 famiglie di distribuzioni condizionate (univariate) composte rispettivamenteda h e k elementi. 4.12

56

Sezione 5Indici di posizione (1)

5.1

Indice

1 Indici sintetici o statistiche 57

2 Indici di posizione 582.1 Proprietà degli indici di posizione . . . . . . . . . . . . . . . . . . . . . 59

3 La moda 60

4 I percentili (quantili) 62

5 Box & Whiskers plot 75

6 Le medie potenziate 836.1 La media aritmetica (r = 1) . . . . . . . . . . . . . . . . . . . . . . . . . 836.2 La media armonica (r =−1) . . . . . . . . . . . . . . . . . . . . . . . . 846.3 La media quadratica (r = 2) . . . . . . . . . . . . . . . . . . . . . . . . 856.4 Il Teorema fondamentale sulle medie potenziate . . . . . . . . . . . . . . 866.5 La media geometrica (r = 0) . . . . . . . . . . . . . . . . . . . . . . . . 87

7 Esercizi 88

8 La media aritmetica è sempre media in senso stretto 90

9 L’operatore media aritmetica 92

10 Interpretazione fisica della media aritmetica 92

11 Media aritmetica di una trasformazione lineare 93

12 I momenti 94 5.2

1 Indici sintetici o statistiche

Date le n osservazioni campionarie

v1,v2, . . . ,vn,

eventualmente raccolte in una serie statistica

X = (xi,ni), i = 1, . . . ,k,

57

un indice sintetico è una funzione

I = α(v1,v2, . . . ,vn) = α(X)

che, a partire dalla variabile statistica X , restituisce una sintesi di uno dei molteplici aspettiche caratterizzano la X oggetto di studio (ad esempio: posizione, variabilità, ...). 5.3

2 Indici di posizione

Un indice sintetico di posizione è un valore che può ritenersi rappresentativo di tutte leosservazioni.Tale valore può anche essere utilizzato per effettuare confronti tra diverse distribuzioni.

?

sono migliori gli studenti maschi o le femmine

?

si mangiano più polli pro-capite in Italia o in Danimarca

?

Per rispondere a tali quesiti si confrontano statistiche che rappresentano i livelli/valoritipici. 5.4

Una famosa poesia di Trilussa evidenzia i limiti interpretativi, associati all’utilizzo di unsolo indice sintetico.

LA STATISTICAdi Trilussa

Sai ched’è la statistica? È na’ cosache serve pe fà un conto in generalede la gente che nasce, che sta male,che more, che va in carcere e che spósa.

Ma pè me la statistica curiosaè dove c’entra la percentuale,pè via che, lì, la media è sempre egualepuro co’ la persona bisognosa.

Me spiego: da li conti che se fannoseconno le statistiche d’adessorisurta che te tocca un pollo all’anno:

e, se nun entra nelle spese tue,t’entra ne la statistica lo stessoperch’è c’è un antro che ne magna due.

Nel seguito si vedrà come sia possibile porre rimedio alla incongruenza interpretativaevidenziata, mediante l’utilizzo di più indici sintetici, sia di posizione che di misura dellavariabilità. 5.5

58

2.1 Proprietà degli indici di posizione

A seconda della scala di misurazione un indice di posizione dovrà soddisfare le seguenticaratteristiche:

• per tutti i tipi di dati: modalità/valore più simile a tutti (o alla maggioranza)

1. internalità (condizione di Cauchy)

α(X) = uno dei valori assunti dal fenomeno

• se la scala è almeno ordinale: valore centrale della distribuzione

1. internalità (condizione di Cauchy)

xmin ≤ α(X)≤ xmax

2. monotonicitàX ≤ Y → α(X)≤ α(Y )

• se i dati sono metrici: valore più vicino a tutti

3. moltiplicativitàα(cX) = cα(X)

con c costante arbitraria.5.6

È possibile definire i seguenti indici di posizione, in accordo alla scala di misurazione delcarattere oggetto di studio

• da nominale in su→ moda (o norma)

• da ordinale in su→ mediana (o percentili)

• da scala per intervalli (dati metrici)→ medie

5.7

Osservazioni

• la proprietà di Cauchy è irrinunciabile• se sono soddisfatte 1) 2) e 3) la media si dice in senso stretto• se cade la proprietà di monotonicità la media si dice in senso lato

Alcuni indici tipici

• moda• percentili (quantili) xp di ordine p (0≤ p≤ 1)• mediana• medie potenziate

– aritmetica

– armonica

– geometrica

– quadratica...

(la moda è definibile anche per caratteri qualitativi sconnessi) 5.8

59

3 La moda

Definizione 1 (Moda per caratteri qualitativi e caratteri quantitativi con valori non rag-gruppati in classi).

Moda(X) = x j : n j = maxni= x j : f j = max fi(modalità/valore di massima frequenza)

xi ni2 24 57 38 2

12

0 2 4 6 8 10

05

xi

ni oppure fi

Moda(X)=4

5.9

Definizione 2 (Moda per caratteri quantitativi con valori raggruppati in classi).

Moda(X) =

x j :

n j

a j= max

ni

ai

=

x j :

f j

a j= max

fi

ai

(valore centrale classe di massima densità di frequenza)

xi ni di2 a 4 6 34 a 5 4 45 a 7 10 57 a 8 8 88 a 9 2 2

30

0 2 4 6 8 10

010

n ia i

o

ppur

e

f ia i

ni ai oppure fi ai

Moda(X)=7.5

5.10

(se Moda(X) esiste, cioè unimodale . . . )Esempio 3. Si consideri la distribuzione degli spettacoli organizzati dalle associazioniculturali di una regione

tipo spettacolo n. eventiteatrale 82concerto musica classica 125concerto rock 160concerto big band 158totale 525

60

La distribuzione è quasi bimodale!La nozione di media espressa dalla moda può avere, a volte, un carattere molto incerto. 5.11

OsservazioneCadendo la monotonicità la moda è media solo in senso lato.

Esempio 4. Distribuzione delle auto di servizio di 15 aziendeX : osservazioni al tempo t,Y : osservazioni al tempo t +1

xi ni1 52 73 24 1

15

yi ni1 52 43 24 4

15(3 aziende con due auto hanno raddoppiato il parco macchine)

tempo t: 1 1 1 1 1 2 2 2 2 2 2 2 3 3 4tempo t +1: 1 1 1 1 1 2 2 2 2 3 3 4 4 4 4

= = = = = = = = = > > > > > =

Moda(X) = 2 Moda(Y ) = 1

anche se1 y( j) ≥ x( j) ( j = 1, . . . ,15) abbiamo Moda(Y )< Moda(X)!! 5.12

Esempio 5 (Carattere qualitativo sconnesso). Si considerano le distribuzioni percentualidel colore dei capelli di alcune scolaresche

colore S1 S2 S3nero 0.10 0.30 0.70castano 0.25 0.30 0.20biondo 0.60 0.30 0.05altro 0.05 0.10 0.05

1 1 1

La moda è una delle modalità !!!Ha senso solo la moda (modalità comune al maggior numero di unità statistiche)Non è possibile calcolare mediana o media !

OsservazioneS2 è plurimodale

5.13

Esercizio 6. Con riferimento a 80 soggetti si riportano le distribuzioni del tempo in minu-ti, Y , dedicato alla visita di una mostra, distinte rispetto al livello di conoscenza artistica(’visitatori esperti’ e ’visitatori occasionali’):


10 a 20 0.4020 a 25 0.20

1.00


10 a 20 0.0820 a 25 0.16

1.00

1. Si rappresentino graficamente le funzioni di ripartizione.2. In base ai grafici precedenti si individui la moda delle due distribuzioni.

5.141Si indica con il simbolo x( j) il valore di X che occupa la posizione j-esima nella serie dei dati ordinati.

61

4 I percentili (quantili)

La presentazione segue i seguenti punti• Cosa sono i percentili e come vengono utilizzati (definizione preliminare)

Si pensi ad esempio al problema della determinazione dei valori di reddito che definisconogli scaglioni di imposizione fiscale.Un criterio è quello di considerare le quote di unità statistiche che risultano collocate inciascuna classe di reddito.

• Limiti della definizione preliminare• Definizione formale ed esempi applicativi• Procedura grafica semplificata• Metodi di calcolo presenti nei software applicativi• Esempi di calcolo della mediana 5.15

Cosa sono i percentili e come vengono utilizzati (definizione preli-minare)

Si consideri una serie di n valori distinti riferiti a una variabile misurata su scala almenoordinale

(ad esempio l’altezza in cm di n = 150 individui)

codi

ce in

divi

duo

altezzakpu

gyn

ueb

qsy

xhq

koy

gvm

qrh

tka

heo

scl

rqv

iwm

tjy

zik

agt

5.16

62

In primo luogo occorre ordinare le osservazioni.

num

ero

d'or

dine

indi

vidu

i per

alte

zza

(1,2

,...,n

)

altezza5.17

Si cerca il valore xp che divide la distribuzione dei dati ordinati in due parti tali che:

• una quota p dei soggetti ha valore inferiore o uguale a xp• una quota 1− p dei soggetti ha valore superiore o uguale a xp

5.18

63

altezza

p1

−p

xp

F(x)

altezza

p

xp5.19

Alcuni percentili notevoli

• x0.25 = Q1 = 1 quartile• x0.50 = Q2 = 2 quartile = mediana• x0.75 = Q3 = 3 quartile

5.20

Esempio 7. Se il percentile di ordine 0.30 della distribuzione delle altezze dei soggetti diuna collettività è pari a x0.30 = 130 cm, ciò significa che:

• il 30% dei soggetti ha un’altezza minore o uguale a 130 cm• il 70% dei soggetti ha un’altezza non inferiore a 130 cm.

Limiti della definizione preliminare

OsservazioneIl percentile è individuabile, in maniera univoca, solo in situazioni particolari(ad esempio, n 100 e variabile statistica continua che si manifesta con un elevatonumero di valori distinti).

5.21

64

Esempio 8. Si vuole determinare x0.5, percentile di ordine 0.5 dell’altezza delle seguentin = 12 unità statistiche

xxxxxxxxxxxxUna volta ordinate dalla più piccola alla più grande

xxxxxxxxxxxxsi assegni la posizione (rango) all’interno dei dati ordinati

x

(1)x(2)

x(3)

x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

Nessuna delle altezze assunte dai soggetti divide la distribuzione esattamente in 2 parti.5.22

x

(1)x(2)

x(3)

x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

Ogni valore strettamente compreso tra l’altezza x(6) della sesta unità statistica e x(7),altezza della settima unità statistica, divide la distribuzione esattamente in 2 parti:

• la quota di soggetti con altezza non superiore a quel valore è esattamente pari al50% (6/12).

• la quota di soggetti con altezza non inferiore a quel valore è esattamente pari al50% (6/12).

5.23

Esempio 9. Si vuole determinare x0.5, percentile di ordine 0.5, per le seguenti n = 12unità statistiche

xxxxxxxxxxxxle si ordina e si assegna la posizione all’interno dei dati ordinati

x(1)

x(2)

x(3)x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

Anche in questo caso nessuna delle altezze assunte dai soggetti divide la distribuzioneesattamente in 2 parti

5.24

x(1)

x(2)

x(3)x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

Le altezze della sesta e settima (e ottava) unità statistica coincidono, diciamo sono ugualia c:

• la quota di soggetti con altezza non superiore a c è superiore al 50% (8/12).• la quota di soggetti con altezza non inferiore a c è superiore al 50% (7/12).

5.25

Esempio 10. Si vuole determinare x0.5, percentile di ordine 0.5, per le seguenti n = 5unità statistiche

xxxxx

65

le si ordina e si assegna la posizione all’interno dei dati ordinati

x(1)x(2)x(3)x(4)x(5)

Anche in questo caso nessuna delle altezze assunte dai soggetti divide la distribuzioneesattamente in 2 parti

5.26

x(1)x(2)x(3)x(4)x(5)

Si consideri l’altezza della terza unità statistica x(3):• la quota di soggetti con altezza non superiore a x(3) è superiore al 50% (3/5).• la quota di soggetti con altezza non inferiore a x(3) è superiore al 50% (3/5).

Occorre, quindi, una definizione più generale di percentile. 5.27

Definizione formale ed esempi applicativi

xp è un valore x:• non superato da almeno una frazione p delle unità statistichee contemporaneamente• superato da almeno una frazione 1− p delle unità statistiche

x

(1)x(2)

x(3)

x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

x(1)

x(2)

x(3)x(4)x(5)x(6)x(7)x(8)x(9)x(10)x(11)x(12)

Definizione 11 (Percentile - definizione formale).

xp =

x :

[∑

xi≤xfi ≥ p

]∩

[∑

xi≥xfi ≥ (1− p)

]xp = x : [F(x)≥ p]∩ [1−F(x)+ f req(x)≥ (1− p)]

dove con f req(x) si è indicata la frequenza relativa corrispondente al valore x.5.28

In particolare assumiamo che:• se p = 0→ x0 = xmin = x(1)• se p = 1→ x1 = xmax = x(n) 5.29

Per determinare il percentile possiamo contemporaneamente fare riferimento:• alla funzione di ripartizione F(x) → quota di unità statistiche con modalità

minore o uguale a x:→x : F(x)≥ p

• alla funzione di ripartizione retrocumulata R(x) → quota di unità statistichecon modalità maggiore o uguale a x:

→x : R(x)≥ (1− p)

Definizione 12 (Funzione di ripartizione retrocumulata R(x)). Si definisce funzione diripartizione retrocumulata, detta anche funzione di sopravvivenza, la funzione che a ognix fa corrispondere la quota di unità statistiche con modalità non inferiore a x.

5.30

66

Relazione tra F(x) e R(x)

Seriazioni statisticheSe il carattere è quantitativo continuo (classi)

R(x) = 1−F(x).

F(x) e R(x) danno la ’stessa’ informazione con riferimento alla determinazione del per-centile:

xp = F−1(p) = R−1(1− p).

Mutabili/serie statisticheIn presenza di un carattere qualitativo ordinato e di un carattere quantitativo non rilevatocon classi vale:

Ri = 1−Fi + fi.5.31

Calcolo Fi e Ri

xi ni fi Fi Ri2 4 0.204 6 0.305 4 0.207 1 0.058 5 0.25

20 15.32

5.33

5.34

5.35

5.36

5.37

5.38

5.39

5.40

5.41

5.42

Per trovare xp dobbiamo cercare l’insieme dei valori che soddisfa le due condizioniF(x)≥ pR(x)≥ 1− p

5.43

xi ni fi Fi Ri2 4 0.20 0.20 1.004 6 0.30 0.50 0.805 4 0.20 0.70 0.507 1 0.05 0.75 0.308 5 0.25 1.00 0.25

20 1• p = 0.25

x0.25 = 4

F(4) = 0.5≥ 0.25 e R(4) = 0.8≥ 0.755.44

• p = 0.50x0.5 = 4 ma anche x0.5 = 5

F(4) = 0.5≥ 0.5 e R(4) = 0.8≥ 0.5F(5) = 0.7≥ 0.5 e R(5) = 0.5≥ 0.5

4≤ x0.5 ≤ 5

Si può utilizzare il valore centrale

x0.5 =4+5

2= 4.5 =

x(10)+ x(11)

2.

67

5.45

• p = 0.75x0.75 = 7 ma anche x0.75 = 8

F(7) = 0.75≥ 0.75 e R(7) = 0.3≥ 0.25F(8) = 1≥ 0.75 e R(8) = 0.25≥ 0.25

7≤ x0.75 ≤ 8

Si può utilizzare il valore centrale

x0.75 =7+8

2= 7.5.

5.46

68

Procedura grafica semplificata

Per determinare xp possiamo però anche fare riferimento alla sola funzione di ripartizione.Se il carattere è qualitativo ordinato oppure siamo in presenza un carattere quantitativocon valori non raggruppati in classi abbiamo

xi ni Ni Fi2 4 4 0.204 6 10 0.505 4 14 0.707 1 15 0.758 5 20 1.00

20

0.0

0.2

0.4

0.6

0.8

1.0

0 2 4 5 7 8 10

0.25

0.5

0.75

x0.25

• p = 0.25 x0.25 = F−1(0.25) = 4

x0.5 = F−1(0.5) =?? x0.75 = F−1(0.75) =??

5.47

• p = 0.5x(10) = 4≤ x0.5 < 5 = x(11)

si ricorda che x(10) = 4 e x(11) = 5 soddisfano la definizione formale di mediana.Si può utilizzare il valore centrale

x0.5 =4+5

2= 4.5.

5.48

• p = 0.75x(15) = 7≤ x0.75 < 8 = x(16)

si ricorda che x(15) = 7 e x(16) = 8 soddisfano la definizione formale di terzo quar-tile.Si può utilizzare il valore centrale

x0.75 =7+8

2= 7.5.

5.49

69

In presenza di classi, se ni 1, abbiamo

xi ni fi Fi2 a 4 200 0.2 0.24 a 5 100 0.1 0.35 a 7 300 0.3 0.67 a 8 300 0.3 0.98 a 9 100 0.1 1

1000 1F

(x)

2 4 5 7 8 9

0.0

0.2

0.3

0.6

0.9

1.0

p

xp

x0.25 = 4.5

5.50

xi fi Fi2 a 4 0.2 0.24 a 5 0.1 0.35 a 7 0.3 0.67 a 8 0.3 0.98 a 9 0.1 1

1

F(x

)

2 4 5 7 8 9

0.0

0.2

0.3

0.6

0.9

1.0

x0.3

x0.3 = 5

x0.5 =??

5.51

70

Per determinare il valore della mediana, percentile di ordine 0.5, identifichiamo in primoluogo la classe di appartenenza, 5 a 7 (corrispondente alla prima Fi ≥ 0.5)

xi fi Fi2 a 4 0.2 0.24 a 5 0.1 0.35 a 7 0.3 0.67 a 8 0.3 0.98 a 9 0.1 1

1

x

F(x

)

2 4 5 7 8 9

0.0

0.2

0.3

0.6

0.9

1.0

0.5

x0.5

Osserviamo come il punto 0.5 sull’asse delle ordinate sia a 23 del segmento che unisce i

punti 0.3 e 0.6; infatti 0.5−0.30.6−0.3 = 0.2

0.3 = 23 .

Anche x0.5 sull’asse delle ascisse sarà in posizione 23 sul segmento che unisce i punti 5 e

7, vale a dire

x0.5 = 5+23· (7−5) = 6.3333.

5.52

Segue la formula teorica per determinare il valore di xp:

xp = hi−1 +p−Fi−1

Fi−Fi−1ai = hi−1 +

p−Fi−1

fiai

dove:

• hi−1: estremo inferiore della classe (i) di appartenenza del percentile di ordine p,• ai: ampiezza della classe i,• Fi−1 e Fi: valori della funzione di ripartizione in hi−1 e hi,• fi = Fi−1−Fi: frequenza relativa della classe i.

5.53

71

Metodi di calcolo presenti nei software applicativi

Come si è visto, in molte situazioni, la determinazione del percentile avviene in maniera’convenzionale’.Con riferimento alla serie statistica

xi ni fi Fi Ri2 4 0.20 0.20 1.004 6 0.30 0.50 0.805 4 0.20 0.70 0.507 1 0.05 0.75 0.308 5 0.25 1.00 0.25

20 1

per la mediana, x0.5, e per il terzo quartile, x0.75, si sono scelti 4.5 e 7.5, valori intermeditra 4 e 5 e tra 7 e 8.Si osserva come qualsiasi altro valore negli intervalli [4,5] e [7,8] avrebbe potuto essereutilizzato per x0.5 e per x0.75. 5.54

Se il numero delle unità statistiche è ridotto, i valori che soddisfano la definizione formaledi percentile potrebbero anche essere molto dissimili tra loro.

Esistono in letteratura diverse formule per il calcolo dei percentili, si veda Hyndman,R. J., Fan, Y. (1996) Sample quantiles in statistical packages, American Statistician, 50,361-365.

Si riporta una delle definizioni, comunemente utilizzata nei pacchetti statistici di usocorrente. 5.55

Definizione 13 (Calcolo ’preciso’ xp).

xp = (1− γ) · x( j)+ γ · x( j+1)

dove x( j) è l’elemento che occupa la posizione j all’interno dei dati ordinati con

j = [np+(1− p)]

[·] parte intera dell’argomento, e

γ = np+(1− p)− j.5.56

Esempio 14. Per calcolare il percentile di ordine 0.95 in corrispondenza dei redditi din = 315 soggetti, si determinano innanzitutto la posizione ( j) e ( j+1) dei due soggetti icui valori x( j) e x( j+1) soddisfano la definizione formale di percentile di ordine p:

j = [np+(1− p)] = [315 ·0.95+0.05] = [299.3] = 299

La funzione [·] considera solo la parte intera (scartando le cifre decimali) dell’argomento.Il valore del percentile risulta una combinazione lineare dei valori x(299) e x(300) con pesi(1− γ) = 0.7 e γ = 0.3.Si osserva come γ = 0.3 coincida con la parte decimale scartata per ottenere il risultatonella formula precedente.In presenza di x(299)= 60350 e x(300)= 61280 si ottiene x0.95= 0.7 ·60350+0.3 ·61280=60629.

5.57In particolare, se p = 0.5, si ottiene

j = n

2 se n è parin+1

2 se n è disparie

γ =

12 se n è pari0 se n è dispari

5.58

72

Esempi di calcolo della mediana

Segue la definizione di mediana, che distingue le situazioni di numerosità pari e dispari:

Definizione 15 (Mediana).

x0.5 =

12

(x( n

2 )+ x( n

2+1)

)se n è pari

x( n+12 ) se n è dispari

Con riferimento all’esempio di n = 20 unità statistiche, la mediana risulta la semisommadegli elementi di posizione 10 e 11 nella serie dei dati ordinati

x(10)+ x(11)

2=

4+52

= 4.5.

Nel caso il carattere sia qualitativo ordinato o quantitativo non rilevato in classi, per lamediana si ottiene lo stesso risultato che si avrebbe con il metodo grafico della funzionedi ripartizione. 5.59

In presenza di una seriazione statistica, se ni non è elevato, abbiamo: (per n pari)

xi ni Ni2 a 4 6 64 a 5 3 95 a 7 9 187 a 8 9 278 a 9 3 30

30

x

N(x

)

2 4 5 7 8 9

1516

0

6

9

18

27

30

x(n 2) x(n 2+1)

x0.5 =x( n

2 )+ x( n

2+1)

2=

12

(5+

69·2)+

(5+

79·2)

= 6.4444

x( n2 )

= hi−1 +n2 −Ni−1

Ni−Ni−1ai x( n

2+1) = hi−1 +

( n2 +1

)−Ni−1

Ni−Ni−1ai

5.60

Si ottiene

x0.5 = hi−1 +

( n+12

)−Ni−1

Ni−Ni−1ai

Anche in presenza di una seriazione statistica con n dispari abbiamo la stessa formula

x0.5 = x( n+12 ) = hi−1 +

( n+12

)−Ni−1

Ni−Ni−1ai

5.61

73

Riepilogo

xp =

x :

[∑

xi≤xfi ≥ p

]∩

[∑

xi≥xfi ≥ (1− p)

]• È possibile calcolare i percentili solo in presenza di dati ordinati.• Se i dati non sono raccolti in classi si può utilizzare la funzione di ripartizione F(x)

nel modo seguente:

– xp corrisponde al primo valore xi per cui Fi ≥ p

– nel caso in cui risulti Fi = p allora, in genere(∗), xp =xi+xi+1

2

xi ni Ni Fi2 4 4 0.204 6 10 0.505 4 14 0.707 1 15 0.758 5 20 1.00

20

0.0

0.2

0.4

0.6

0.8

1.0

0 2 4 5 7 8 10

0.25

0.5

0.75

x0.25

x0.25 = 4 x0.50 = 4.5 x0.75 = 7.5(∗) Se Fi = p e ni+1 = 0, si dovrà porre xp =

xi+xi+22 5.62

• In presenza di seriazioni statistiche (dati raccolti in classi) il percentile viene deter-minato mediante lettura inversa della funzione di ripartizione

F(x

)

2 4 5 7 8 9

0.0

0.2

0.3

0.6

0.9

1.0

p

xp

• È possibile anche un calcolo più preciso, attraverso i valori di N(x).

x

N(x

)

2 4 5 7 8 9

1516

0

6

9

18

27

30

x(n 2) x(n 2+1)

74

5.63

Esempio 16. Il seguente prospetto riporta i tempi di risposta (in secondi) a un quiz daparte di 29 concorrenti. Si calcoli il tempo mediano

xi ni1 53 84 85 69 2

29

Essendo n = 29 dispari, la mediana è il valore che occupa la posizione n+12 = 15 nella

serie dei dati ordinati; corrisponde, quindi, al tempo del 15o soggetto classificato

xi ni Ni ordine classifica1 5 5 dal 1o al 5o

3 8 13 dal 6o al 13o

4 8 21 dal 14o al 21o

5 6 27 dal 22o al 27o

9 2 29 dal 28o al 29o

29

abbiamox0.5 = x(15) = 4.

5.64

Esercizio 17. Si fornisca una rappresentazione grafica e si riassumano opportunamentegli esiti riportati nel seguente prospetto

vi niscarso 18

sufficiente 14discreto 12buono 6

5.65

5 Box & Whiskers plot

Si considerino le seguenti osservazioni di un carattere quantitativo

20,11,11,10,15,14,30,8,12,12,7

Gli n = 11 valori sono dei punti sulla retta reale

127 1110 1514 3020118 12

Nel grafico si sono evidenziati i valori 11 e 12 con dei punti più grandi in quanto figurano2 volte. 5.66

Si procede al calcolo dei percentili di ordine 0.25, 0.5 e 0.75, primo quartile, mediana eterzo quartile della distribuzione.

75

xi ni Ni Fi7 1 1 0.098 1 2 0.1810 1 3 0.2711 2 5 0.4512 2 7 0.6414 1 8 0.7315 1 9 0.8220 1 10 0.9130 1 11 1.00

11

0.0

0.2

0.4

0.6

0.8

1.0

0 7 10 12 14 20 30

0.25

0.5

0.75

x0.25 x0.5 x0.75

Otteniamo:x0.25 = 10, x0.5 = 12, x0.75 = 15

5.67

Riportiamo, con tre segmenti, sul grafico in cui figurano le osservazioni i tre quartili.

127 1110 1514 3020118 12

76

Possiamo ora rappresentare ’in un altro modo’ i punti che figurano tra il primo e il terzoquartile.Sappiamo che:

• tra x0.25 e x0.5 figura una quota di osservazioni approssimativamente pari al 25%;• tra x0.5 e x0.75 figura una quota di osservazioni approssimativamente pari al 25%;• tra x0.25 e x0.75 figura una quota di osservazioni approssimativamente pari al 50%.

7 10 15 30208 12

Nel grafico precedente abbiamo unito i 3 quartili costruendo una scatola (Box), che con-tiene i valori centrali della distribuzione 5.68

I valori molto distanti dalla scatola sono qualificabili come valori anomali.Si definiscono, generalmente, anomali quei valori che hanno una distanza dalla scatolasuperiore a 1.5 · (x0.75− x0.25)Identifichiamo, allora, sul grafico due limiti (Whiskers) al di fuori dei quali figurano ivalori anomali:

• baffo inferiore = maxxmin,x0.25−1.5(x0.75− x0.25)• baffo superiore = minxmax,x0.75 +1.5(x0.75− x0.25)

7 30208

5.69

Concludiamo la costruzione del grafico lasciando solo il Box & Whiskers Plot e glieventuali dati anomali.

7 10 12 15 22.5 30

In alcuni software applicativi la costruzione del grafico pone i baffi in corrispondenza didati esistenti: nel caso in esame il baffo superiore viene posto a 20, ottenendo così unarappresentazione sintetica dei dati effettivamente osservati.

7 10 12 15 20 30

Il Box & Whiskers plot può essere ottenuto mediante il software statistico R con leseguenti istruzioni:

• x <- c(12,7,11,10,15,14,30,20,11,8,12)per assegnare i dati all’oggetto x

• boxplot(x)per produrre il grafico

5.70

77

Riepilogo Box & Whiskers plot 1

Quantitativo no classi

xi ni Ni Fi7 1 1 0.098 1 2 0.1810 1 3 0.2711 2 5 0.4512 2 7 0.6414 1 8 0.7315 1 9 0.8220 1 10 0.9130 1 11 1.00

11

0.0

0.2

0.4

0.6

0.8

1.0

0 7 10 12 14 20 30

0.25

0.5

0.75

x0.25 x0.5 x0.75

7 10 12 15 22.5 30

Quantitativo con classi

hi−1 a hi ni Ni Fi10 a 22 60 60 0.3022 a 31 90 150 0.7531 a 51 50 200 1.00

200

0 10 20 30 40 50

0.0

0.2

0.4

0.6

0.8

1.0

0.25

0.5

0.75

x0.25 x0.5 x0.75

10 20 26 31 47.5 51

78

5.71

5.72

Riepilogo Box & Whiskers plot 2

30

3132

3334

35

50%

25%

25%

outliers

x0.25

x0.5

x0.75

75%

75%

5.73

Il Box & Whiskers plot è, quindi, una rappresentazione grafica costituita da:

• box (scatola)

– x0.25 = Q1

– x0.50 = Q2

– x0.75 = Q3

• whiskers (baffi)

– baffo inferiore = maxxmin,Q1−1.5(Q3−Q1)– baffo superiore = minxmax,Q3+1.5(Q3−Q1)

x0.75− x0.25 = Q3−Q1 è chiamata differenza interquartile. 5.74

Può essere utilizzato:

• per avere una idea sintetica della distribuzione• per effettuare dei confronti• per l’individuazione di dati anomali (oltre i baffi)

5.75

79

Esempio 18 (Altezza della navata e lunghezza totale delle cattedrali inglesi). Faraway JJ2002 Practical Regression and Anova using R, July 2002,http://stat.ethz.ch/CRAN/doc/contrib/Faraway-PRA.pdf

• x altezza della navata (m) y lunghezza totale (m)

Alcune cattedrali sono in stile romanico, altre in stile gotico.I dati relativi alle cattedrali con entrambi gli stili sono stati duplicati.Si confrontano i due stili mediante grafici Box & Whiskers plot, rimandando il lettore allaSezione 11.3 per un’analisi dettagliata dell’esempio.

style x yDurham r 22.86 153.01

Canterbury r 24.38 159.11Gloucester r 20.73 129.54

Hereford r 19.51 104.85Norwich r 25.30 124.05

Peterborough r 24.38 137.46St.Albans r 21.34 167.94

Winchester r 23.16 161.54Ely r 22.56 166.73

York g 30.48 158.19Bath g 22.86 68.58

Bristol g 15.85 91.44Chichester g 18.90 127.41

Exeter g 20.73 124.66GloucesterG g 26.21 129.54

Lichfield g 17.37 112.78Lincoln g 24.99 154.23

NorwichG g 21.95 124.05Ripon g 26.82 89.92

Southwark g 16.76 83.21Wells g 20.42 126.49

St.Asaph g 13.72 55.47WinchesterG g 31.39 161.54

Old.St.Paul g 31.39 186.23Salisbury g 25.60 144.17

5.76

g r

1520

2530

Distribuzione 'altezza della navata'

g r

6080

120

160

Distribuzione 'lunghezza totale'

5.77

80

http://stat.ethz.ch/CRAN/doc/contrib/Faraway-PRA.pdf

Si osserva come il solo esame di un grafico cosiddetto ’a dispersione’ risulti essere menoinformativo. L’analisi congiunta, opportuna nel caso in esame essendo i dati riferiti allestesse unità statistiche, evidenzia la presenza di cattedrali in stile gotico molto piccole (St.Asaph) e molto grandi (Old St. Paul, Winchester e York).

60 80 100 120 140 160 180

1520

2530

lunghezza totale

alte

zza

della

nav

ata

Durham

Canterbury

Gloucester

Hereford

Norwich

Peterborough

St.Albans

WinchesterEly

York

Bath

Bristol

Chichester

Exeter

GloucesterG

Lichfield

Lincoln

NorwichG

Ripon

Southwark

Wells

St.Asaph

WinchesterG Old.St.Paul

Salisbury

5.78

Esercizio 19. Si confrontino mediante grafici Box & Whiskers plot le seguenti serie diosservazioni

Serie X : 12,7,11,10,15,14,30,20,11,8,12

Serie Y : 7,17,10,9,9,11,8,6,12,7,10,7,13,9,85.79

Esercizio 20. Si costruisca il Box & Whiskers plot per la seguente serie statistica

xi ni18 423 4026 3629 7032 50

2005.80

Esercizio 21. Si costruisca il Box & Whiskers plot per la seguente seriazione statisticabasandosi sulla funzione di ripartizione

hi−1 a hi fi15 a 25 0.2225 a 29 0.1829 a 31 0.3531 a 35 0.25

15.81

81

Esercizio 22. Quale tra i due istogrammi corrisponde al Box & Whiskers plot?

1020

3040

50

0 10 20 30 40 500.00

0.01

0.02

0.03

0.04

0.05

0 10 20 30 40 500.00

0.01

0.02

0.03

0.04

0.05

5.82

Esercizio 23. Quale tra i due istogrammi corrisponde al Box & Whiskers plot?

1020

3040

50

0 10 20 30 40 500.00

0.01

0.02

0.03

0.04

0.05

0 10 20 30 40 500.00

0.01

0.02

0.03

0.04

0.05

5.83

82

6 Le medie potenziate

Definizione 24. Data una variabile statistica X con modalità xi > 0 (eventualmente valoricentrali) si definisce media potenziata di ordine r

µ(r) =

(1n

k

∑i=1

xri ni

) 1r

=

=

(k

∑i=1

xrini

n

) 1r

=

(k

∑i=1

xri fi

) 1r

con fi =nin ed r =±1,±2,±3, . . ..

Nel caso di frequenze unitarie (o valori singoli v j, j = 1, . . . ,n)

µ(r) =

(1n

n

∑j=1

vrj

) 1r

5.84

6.1 La media aritmetica (r = 1)

Definizione 25.

µ(1) = µ = M(X) =

1n

k

∑i=1

xini =k

∑i=1

xi fi.

OsservazioneÈ inessenziale la positività delle xi.

Esempio 26. M(X) è il valore centrale di una successione aritmetica con un numerodispari di termini, ad esempio

1,2,3,4,5

si osservi che in questo caso ciascuna modalità figura una sola volta, ovvero k = n = 5 en1 = n2 = . . .= nk = 1, quindi:

µ = M(X) =1n

k

∑i=1

xini =15(1+2+3+4+5) = 3.

5.85

83

Esempio 27. Avendo riclassificato i dati 2,2.5,1,2.5,2,10,2.5,2,2,1 nella serie statistica

xi ni1 22 4

2.5 310 1

10

(1)

si può procedere al calcolo della media aritmetica

xi ni xini1 2 22 4 8

2.5 3 7.510 1 10

10 27.5

µ = M(X) =1n

k

∑i=1

xini =1

1027.5 = 2.75.

5.86

OsservazioneNel caso di una seriazione statistica i valori xi sono i valori centrali delle classi

hi−1 a hi ni0.25 a 1.75 21.75 a 2.25 42.25 a 2.75 3

2.75 a 17.25 110

→

xi ni1 22 4

2.5 310 1

10

M(X) = 2.75

5.87

Esercizio 28. Si supponga che il valore di ciascuna unità statistica aumenti di 1 unità;si ricalcoli il valore della media aritmetica; si ripeta l’esercizio nel caso in cui i valoriraddoppino.

5.88

OsservazioneLa media potenziata di ordine r può essere riscritta nel seguente modo

µ(r) =

[1n

k

∑i=1

xri ni

] 1r

= [M (X r)]1r

Radice r-esima della media aritmetica dei valori di X elevati a r. 5.89

6.2 La media armonica (r =−1)

Definizione 29.µ(−1) =

[M(X−1)]−1

=1

M( 1

X

) = 11n ∑

ki=1

1xi

ni

OsservazioniLa presenza di valori xi = 0 toglie significato all’espressione;Inoltre, valori xi positivi e negativi potrebbero rendere il denominatore nullo.

5.90

84

Esempio 30. µ(−1) è il valore centrale di una successione armonica con un numero disparidi termini, ad esempio

1,12,

13,

14,

15

anche in questo caso siamo in presenza di valori singoli e, quindi, ciascuna modalità figurauna sola volta: k = n = 5 e n1 = n2 = . . .= nk = 1

µ(−1) =

11n ∑

ki=1

1xi

ni=

115 (1+2+3+4+5)

=13

5.91

Esempio 31. Avendo riclassificato i dati 2,2.5,1,2.5,2,10,2.5,2,2,1 in serie statistica èpossibile procedere al calcolo della media armonica

xi ninixi

1 2 22 4 2

2.5 3 1.210 1 0.1

10 5.3

µ(−1) =

11n ∑

ki=1

1xi

ni=

1110 5.3

=1

0.53= 1.8868

5.92

6.3 La media quadratica (r = 2)

Definizione 32.

µ(2) =

[M(X2)] 1

2 =√

M (X2) =

√√√√1n

k

∑i=1

x2i ni

OsservazioneLa positività delle xi è inessenziale.

5.93

Esempio 33. Con riferimento alla precedente serie statistica abbiamo

xi ni x2i ni

1 2 22 4 16

2.5 3 18.7510 1 100

10 136.75

µ(2) =

√√√√1n

k

∑i=1

x2i ni =

√110

136.75 = 3.698

OsservazioneVale l’ordinamento:

xmin < µ(−1) = 1.8868 < µ

(1) = 2.75 < µ(2) = 3.698 < xmax

5.94

85

6.4 Il Teorema fondamentale sulle medie potenziate

Teorema 34. La funzione

µ(r) =

(k

∑i=1

xri fi

) 1r

(r =±1,±2, . . .)

con xi positivi (ordinati) e distinti

1. è monotona in senso stretto;2. ha come asintoti

limr→−∞

µ(r) = x1 lim

r→+∞µ(r) = xk.

3. Ogni µ(r) è una media in senso stretto4. La media geometrica (r = 0) è definita come

limr→0

µ(r) = n

√k

∏i=1

xnii =

(k

∏i=1

xnii

) 1n

=k

∏i=1

x fii = µ

(0).

5.95

Esempio 35. Si riporta l’andamento della funzione µ(r) con riferimento alla seguenteserie statistica

xi ni1 72 33 34 7

20

−20 −10 0 10 20

01

23

45

r

µ(r)

xmax

xmin

µ(−1)

µ(0)

µ(1)

µ(2)

5.96

86

Definizione 36. Si definisce variabile statistica degenere una variabile statistica caratte-rizzata da valori tutti eguali fra loro: xi = c, ∀i (una sola modalità).Per tale variabile statistica, in base alla proprietà di Cauchy,

µ(r) = c

per qualsiasi valore dell’ordine r.

OsservazionePer r = 0 la media non è definita (forma indeterminata 1∞);µ(0) è ottenuta con un’operazione di limite

µ(0) = lim

r→0µ(r)

5.97

6.5 La media geometrica (r = 0)

Definizione 37.

µ(0) =

k

∏i=1

x fii

OsservazioneLa presenza di valori xi negativi potrebbe togliere significato all’espressione.

5.98

Esempio 38. Con riferimento alla precedente serie statistica abbiamo

xi ni fi x fii

1 2 0.2 12 4 0.4 1.3195

2.5 3 0.3 1.316410 1 0.1 1.2589

10 1 prodotto

µ(0) =

k

∏i=1

x fii = 2.1867

5.99

Esempio 39. Si calcolano media armonica, geometrica, aritmetica e quadratica dellaseguente variabile statistica

classi xi ni7.5 a 9.5 8.5 40

9.5 a 11.5 10.5 2511.5 a 15.5 13.5 12015.5 a 21.5 18.5 145

330

13.8577 14.3826 14.8636 15.2894

media media media media

armonica geometrica aritmetica quadratica

µ(−1) µ(0) µ(1) µ(2)

5.100

87

Riepilogo

Tipologia caratterequalitativo qualitativo quantitativo

Indice sconnesso ordinatomoda X X Xpercentili X Xmedia aritmetica Xmedia geometrica Xmedia armonica Xmedia quadratica Xmedie potenziate Xminimo X Xmassimo X X

Si osserva il carattere generale di applicazione dei percentili: attraverso il grafico Box &Whiskers plot abbiamo un’efficace descrizione di caratteri di tipo quantitativo.Nel seguito:

• considereremo alcune proprietà della media aritmetica• descriveremo alcuni criteri che ci possono supportare nella scelta della media più

adeguata per riassumere un carattere quantitativo.5.101

7 Esercizi

Esercizio 40. Con riferimento alla variabile statistica

xi ni1 22 4−θ

3 24 θ

5 210

1. indicare quali valori può assumere il parametro θ

2. si calcolino poi al variare di θ i valori della media armonica, geometrica, aritmeticae quadratica, della moda e della mediana

3. si commentino i risultati ottenuti con riferimento al Teorema sulle medie potenziate.5.102

Esercizio 41. Si riportano i redditi di 5 soggetti (valori in migliaia di e)

soggetto 1 2 3 4 5reddito 15 22 25 28 35

1. Si calcoli la media aritmetica dei redditi.2. Si calcoli la media aritmetica dei redditi nell’ipotesi che ciascun reddito raddoppi.3. Si calcoli la media aritmetica dei redditi nell’ipotesi che ciascun reddito aumenti di

5000e.5.103

88

Esercizio 42 (T 221, 08.09.2005, 1). Nel prospetto seguente sono riportate, con riferi-mento ai redditi di n soggetti (variabile X), le classi di rilevazione e le rispettive densitàdi frequenza.

hi−1 a hi di10 a 15 415 a 20 420 a 39 3

1. Si ricostruiscano le distribuzioni delle frequenze assolute e cumulate della variabileX e si dia una opportuna rappresentazione grafica di X e della sua funzione diripartizione F(x).

2. Si calcoli la media e si identifichino su un grafico i quartili di X .5.104

Esercizio 43. Si dia una rappresentazione grafica e si calcoli il valore della media armo-nica della seriazione statistica

hi−1 a hi ni1 a 3 13 a 6 96 a 10 10

10 a 20 205.105

Esercizio 44 (T 224, 02.02.2006, 2). Determinare i valori di x1 ed n1 in modo che nellaseguente tabella risulti µ(−∞) = 10 e µ(1) = 20

xi nix1 n130 30

5.106

Esercizio 45. Indicare se le seguenti medie potenziate

µ(0) = 6.3, µ = 4.3, µ

(2) = 4.3

sono compatibili con la seguente serie statistica(della quale sono note solo alcune informazioni)

xi ni2.5 204 22...

...16 10

5.107

Esercizio 46. Indicare se le seguenti medie potenziate

µ(−1) = 5, µ = 14, µ

(2) = 13

sono compatibili con la seguente serie statistica(della quale sono note solo alcune informazioni)

xi ni11 212 214 2...

...

89

5.108

Esercizio 47 (T 165, 30.09.1998, 3). Sia X una variabile statistica simmetrica rispetto alvalore 85:

xi ni10 10x2 n2

2x2−10 n3x4 10

1. Supponendo n = 100, si ricavi la distribuzione delle frequenze cumulate e se ne diarappresentazione grafica.

5.109

Esercizio 48 (P 001, 10.03.1995, 2). Dire, motivando la risposta, se µ(39), ovvero lamedia potenziata di ordine 39, può assumere il valore 39, con riferimento alla seguentev.s. X

xi 4 12 20 28 36ni 39 39 39 39 39

Calcolare la media geometrica di X e indicare l’intervallo di valori reali entro il quale puòpresentarsi la media armonica.

5.110

Esercizio 49. Si calcoli la media aritmetica della seguente variabile statistica X

xi fi2 0.24 0.55 0.3

5.111

Esercizio 50. Dimostrare che con riferimento alla media geometrica di una variabilestatistica X vale

µ(0) =

k

∏i=1

x fii = eM[ln(X)].

5.112

8 La media aritmetica è sempre media in senso stretto

La definizione di media aritmetica si estende anche a v.s. generiche (xi sia positivi chenegativi) mantenendo le proprietà di media in senso stretto

1. (Cauchy)Posto

x(1) = mini

xi = x1

x(n) = maxi

xi = xk

abbiamox1 ≤ xi ≤ xk

moltiplicando tutti i termini della diseguaglianza per la costante non negativa fi ilverso della diseguaglianza non cambia

x1 fi ≤ xi fi ≤ xk fi

90

la diseguaglianza vale per tutti i valori di X , possiamo quindi sommare rispettoall’indice i e il verso della diseguaglianza non cambia

k

∑i=1

x1 fi ≤k

∑i=1

xi fi ≤k

∑i=1

xk fi

x1 e xk sono delle costanti, non dipendono dall’indice i e possono essere portatefuori dalle sommatorie

x1

k

∑i=1

fi ≤k

∑i=1

xi fi ≤ xk

k

∑i=1

fi

la somma delle frequenze relative fi vale 1, quindi

x1 ≤k

∑i=1

xi fi ≤ xk

vale a direx1 ≤ µ ≤ xk.

5.113

2. (moltiplicatività)Si ricorda che

Y = cX ↔ yi = cxi.

La media di Y risulta

M(Y ) =k

∑i=1

yi fi,

sostituendo cxi a yi abbiamo

M(Y ) =k

∑i=1

cxi fi.

c è una costante moltiplicativa che può essere portata fuori dalla sommatoria, quindi

M(Y ) = ck

∑i=1

xi fi = cM(X)

ricordando che ∑ki=1 xi fi = M(X).

3. (monotonicità)Si ricorda che

Y ≥ X ↔ yi ≥ xi, i.e. yi = xi +δi (δi ≥ 0).

La media di Y risulta

M(Y ) =k

∑i=1

yi fi,

sostituendo xi +δi a yi abbiamo

M(Y ) =k

∑i=1

(xi +δi) fi.

Possiamo sviluppare il prodotto (xi +δi) fi

M(Y ) =k

∑i=1

(xi fi +δi fi)

91

e scomporre la sommatoria nella somma di due sommatorie

M(Y ) =k

∑i=1

xi fi +k

∑i=1

δi fi ≥k

∑i=1

xi fi = M(X).

La diseguaglianza finale vale in quanto ∑ki=1 δi fi ≥ 0 in base alla proprietà di Cau-

chy applicata alla variabile statistica (δi,ni), i = 1,2, . . . ,k.5.114

9 L’operatore media aritmetica

Definizione 51 (Operatore media aritmetica). Si definisce operatore media aritmetica,indicato con M(X), la funzione che assegna a ogni variabile statistica X la sua mediaaritmetica

µ =1n

k

∑i=1

xini =k

∑i=1

xi fi = M(X).

5.115Nella letteratura anglosassone l’operatore media aritmetica

M(X)

viene indicato conE(X)

(expected value). 5.116

10 Interpretazione fisica della media aritmetica

’centro di gravità’ o ’punto di equilibrio’ delle frequenze

x1 x2 x3 x4

µ

f1

f2

f3

f4

xi−µ = braccio fi = peso o forza

Si ricorda che il ’centro di massa’ di un corpo esteso, costituito da k oggetti posti lun-go una linea in posizione x1,x2, . . . ,xk, ciascuno dei quali è caratterizzato da una massaf1, f2, . . . , fk, è dato da ∑

ki=1 xi fi che corrisponde alla media aritmetica degli xi. Il centro di

massa (µ) è anche interpretabile come centro di gravità o punto di equilibrio delle masse

92

fi. Si considerano, infatti, le fi come pesi, o forze, agenti sui punti xi, secondo un bracciopari a xi−µ . Ora, dal momento che

k

∑i=1

(xi−µ) fi =k

∑i=1

(xi fi−µ fi) =k

∑i=1

xi fi−k

∑i=1

µ fi = µ−µ

k

∑i=1

fi = µ−µ = 0

µ costituisce il punto di equilibrio del sistema di frequenze fi. 5.117

11 Media aritmetica di una trasformazione lineare

Teorema 52. SeY = aX +b

con a,b ∈ℜ, e, quindi, yi = axi +b, allora

M(Y ) = aM(X)+b.

Dimostrazione.

M(Y ) =k

∑i=1

yi fi =k

∑i=1

(axi +b) fi =k

∑i=1

(axi fi +b fi)

=k

∑i=1

axi fi +k

∑i=1

b fi = ak

∑i=1

xi fi +bk

∑i=1

fi

= aM(X)+b.5.118

OsservazioneIl teorema precedente afferma che l’operatore media aritmetica M(X) è un operatorelineare

M(aX +b) = aM(X)+b.

OsservazioneIn particolare

•M(b) = M(costante) = b

dal momento che X = b è una variabile statistica degenere.•

M(aX) = aM(X)

in quanto la media aritmetica è media in senso stretto.5.119

Definizione 53 (Variabile scarto da un generico valore c).

Y = X− c.

ProprietàM(Y ) = M(X− c) = M(X)−M(c) = M(X)− c.

Definizione 54 (Variabile scarto dalla media). Si ponga nella definizione precedente c =µ

Y = X−µX , µX = M(X).

93

ProprietàM(Y ) = M(X−µX ) = M(X)−M(X) = 0.

5.120Segue che anche la somma degli scarti dalla media è nulla

k

∑i=1

(xi−µX )ni =k

∑i=1

(xini−µX ni) =

=k

∑i=1

xini−k

∑i=1

µX ni =

= n · 1n

k

∑i=1

xini−µX

k

∑i=1

ni = nM(X)−nM(X) = 0.

5.121

12 I momenti

Definizione 55 (Momenti di ordine s≥ 1 da un generico valore c).

M [(X− c)s] =k

∑i=1

(xi− c)s fi.

Definizione 56 (Momenti di ordine s≥ 1 dalla media, detti anche Momenti centrali).

M [(X−µX )s] =

k

∑i=1

(xi−µX )s fi.

Utilizzeremo, nel seguito:

• M[(X−µX )

2]

misura della variabilità di una distribuzione,

• M[(X−µX )

3]

misura di asimmetria di una distribuzione,

• M[(X−µX )

4]

misura di curtosi di una distribuzione.5.122

Definizione 57 (Momenti di ordine s≥ 1 dall’origine, c = 0).

M (X s) =k

∑i=1

xsi fi.

Abbiamo, in particolare, già visto che

µ(r) = [M (X r)]1/r .

5.123

94

Sezione 6Indici di posizione (2)

6.1

Indice

1 Il problema della scelta della media 95

2 Media obiettivo secondo Chisini 96

3 Alcuni esempi di applicazione del criterio di scelta della media secondo Chi-sini 96

4 Scelta della media per minimizzazione del danno 100

5 Proprietà associativa della media aritmetica 104

6 Esercizi 106

7 Riassunto delle proprietà di alcuni indici di posizione 107 6.2

1 Il problema della scelta della media

Si ricorda che lo studio di un fenomeno comporta, in genere, le seguenti fasi preliminari:

1. individuazione del carattere indicatore (proxy)2. ricerca di opportuni indici sintetici

α(X) = α(x1, . . . ,xk;n1, . . . ,nk) = α(v1,v2, . . . ,vn)

• funzione dei dati• ma . . . quale forma funzionale ??

Criteri

• media obiettivo• minimizzazione danno

Chisini (1929)La ricerca della media ha lo scopo di semplificare una data questione, sostituendo a dueo più quantità date una quantità sola, atta a sintetizzarle senza variare la visione delfenomeno in esame. 6.3

95

2 Media obiettivo secondo Chisini

Definizione 1 (Media Obiettivo secondo Chisini). Si consideri una v.s. X sulla quale èdefinita una particolare funzione φ(·) dei dati che fornisce un valore globale λ

φ(X) = φ(x1, . . . ,xk;n1, . . . ,nk) = λ

la media α deve soddisfare anch’essa il vincolo globale

φ(α) = φ(α, . . . ,α;n1, . . . ,nk) = λ

la media obiettivo o secondo Chisini è la soluzione dell’equazione

φ(x1, . . . ,xk;n1, . . . ,nk) = φ(α, . . . ,α;n1, . . . ,nk)

(non è garantito che α = α(X) sia una media in senso stretto)6.4

3 Alcuni esempi di applicazione del criterio di sceltadella media secondo Chisini

Esempio 2. La quantità totale di 26 gettoni è stata ripartita tra 10 soggetti nel modoseguente:

7 soggetti possiedono 2 gettoni2 soggetti possiedono 3 gettoni1 soggetto possiede 6 gettoni

Problema Determinare la quantità media da assegnare a ciascun soggetto in modo darealizzare una ripartizione egalitaria del totale

xi ni xini2 7 143 2 66 1 6

10 266.5

Soluzione Si può considerare come valore globale il totale assegnato λ = T ; quindi

φ(x1, . . . ,xk;n1, . . . ,nk) =k

∑i=1

xini = T

φ(α, . . . ,α;n1, . . . ,nk) =k

∑i=1

αni = T

k

∑i=1

xini =k

∑i=1

αni

k

∑i=1

αni =k

∑i=1

xini

α

k

∑i=1

ni =k

∑i=1

xini

αn =k

∑i=1

xini

96

da cui

α =1n

k

∑i=1

xini

la media α corrisponde alla media aritmetica delle xi. 6.6

ProprietàLa media aritmetica è la quantità che sostituita alle modalità di una variabile statistica nelascia invariato il totale.

(criterio adatto alla maggior parte dei fenomeni naturali) 6.7

Esempio 3. Un investitore deposita al tempo 0 un capitale C0 presso un istituto di cre-dito; la durata dell’investimento è pari a 5 anni; i tassi di interesse, definiti in regime dicapitalizzazione composta, concordati nei diversi periodi sono:

1 periodo 3% i1 = 0.03 u1 = 1.032 periodo 5% i2 = 0.05 u2 = 1.053 periodo 3% i3 = 0.03 u3 = 1.034 periodo 5% i4 = 0.05 u4 = 1.055 periodo 2% i5 = 0.02 u5 = 1.02dove u j è il montante unitario riferito al periodo j.

Problema Determinare il tasso di interesse medio corrisposto dall’istituto di credito nei5 anni. 6.8

Soluzione Si deve trovare il tasso di interesse medio i = αI(i1, . . . , i5), o equivalentementeil montante unitario medio

u = αU (u1, . . . ,u5),

che consente, partendo dalla somma iniziale C0, di riprodurre il capitale finale C5.

Ricordiamo che per j = 1,2, . . . ,5 abbiamo C j =C j−1+ I j, dove I j =C j−1 · i j è la sommacorrisposta a titolo d’interesse alla fine del periodo j-esimo.

Alla fine dei periodi:C1 =C0 + I1 =C0 ·u1C2 =C1 + I2 =C1 ·u2 =C0 ·u1 ·u2...C5 =C0 ·u1 ·u2 ·u3 ·u4 ·u5 =C0 ∏

5j=1 u j 6.9

C0 ·u1 ·u2 ·u3 ·u4 ·u5 =C5

In base al criterio di scelta secondo Chisini dobbiamo individuare il montante unitariomedio u tale che

C0 · u · u · u · u · u =C0u5 =C5

ovverou1 ·u2 ·u3 ·u4 ·u5 = u · u · u · u · u = u5

da cui

u = 5

√√√√ 5

∏j=1

u j =

(5

∏j=1

u j

) 15

=5

∏j=1

u15j

che corrisponde alla media geometrica dei montanti unitari, riferiti ai tassi di interesse i j.

Nel caso in esameu = 1.0359

97

da cuii = u−1 = 1.0359−1 = 0.0359 = 3.59%.

6.10

ProprietàLa media geometrica è la quantità che sostituita alle modalità di una variabile statistica nelascia invariato il prodotto.

6.11

Esempio 4 (Portafoglio titoli). Un risparmiatore acquista un portafoglio composto da2000e in BTP, 5000e in azioni e 3000e in obbligazioni e, tempo dopo, dismette il ca-pitale investito, ottenendo i seguenti rendimenti: BTP: 3.8%, azioni: −1%, obbligazioni3.5%

Btp Azioni ObbligazioniCi = quantità 2000 5000 3000

xi = rendimenti 3.8% -1% 3.5%

Problema Determinare il tasso di rendimento medio, α(x1,x2,x3), espresso in funzionedei rendimenti parziali xi, considerando come ’quantità invariante’ equivalentemente:

1. il montante complessivo (M)2. il guadagno complessivo (G)

6.12Soluzione Si indichino con Mi i montanti e con Gi i guadagni, i = 1,2,3 dei tre investi-menti.

1.

M =3

∑i=1

Mi =3

∑i=1

Ci(1+xi)=3

∑i=1

Ci(1+α) ovvero3

∑i=1

Ci+3

∑i=1

Cixi =3

∑i=1

Ci+3

∑i=1

Ciα

2.

G =3

∑i=1

Gi =3

∑i=1

Cixi =3

∑i=1

Ciα

da cui, risolvendo rispetto ad α , si ottiene:

α =∑

3i=1 Cixi

∑3i=1 Ci

=131

10000= 0.0131 = 1.31%.

La media trovata α corrisponde alla media aritmetica dei tassi di interesse xi ponderatirispetto ai capitali investiti Ci. 6.13

Esempio 5. Un automobilista percorre 100km e rileva le seguenti velocità:sulla prima tratta di 50km mantiene una velocità costante di 80km/hsulla seconda tratta di 40km una velocità costante di 120km/hsulla terza tratta di 10km una velocità costante di 40km/h

Problema determinare la velocità media di percorrenza dei 100km

vi si40 1080 50

120 40100

98

6.14Soluzione si può considerare come carattere invariante il tempo totale T impiegato percompiere l’intero tragitto.E’ possibile determinare il tempo di percorrenza della singola tratta in funzione dellarelazione, V = S

T , intercorrente tra velocità, spazio e tempo:

T =SV

;

con riferimento alla singola tratta risulta:

ti =si

vi

Ne consegue un tempo totale di percorrenza pari a:

T = t1 + t2 + t3 =s1

v1+

s2

v2+

s3

v3

Se si indica con α la velocità media è possibile riscrivere la relazione che ’garantisce’ ilrispetto del tempo totale di percorrenza

T =s1

α+

s2

α+

s3

α.

6.15

L’equazione conseguente, che consente di trovare l’espressione per α , è la seguente:

s1

v1+

s2

v2+

s3

v3=

s1

α+

s2

α+

s3

α

s1

α+

s2

α+

s3

α=

s1

v1+

s2

v2+

s3

v3

1α(s1 + s2 + s3) =

s1

v1+

s2

v2+

s3

v3

1α

=1

s1 + s2 + s3

(s1

v1+

s2

v2+

s3

v3

)(

1α

)−1

=

1

s1 + s2 + s3

(s1

v1+

s2

v2+

s3

v3

)−1

α =1

1s1+s2+s3

(s1v1+ s2

v2+ s3

v3

)6.16

La media trovata corrisponde alla media armonica delle velocità utilizzando ’come fre-quenze’ le lunghezze si delle diverse tratte

vi si ti =sivi

40 10 0.250080 50 0.6250

120 40 0.3333100 1.2083

α =1

1100 1.2083

=1

1100 1.2083

= 82.761

6.17

99

4 Scelta della media per minimizzazione del danno

Definizione 6. Data la variabile statistica X si cerca l’indice di posizione

α = α(x1, . . . ,xk;n1, . . . ,nk) = α(X)

tale da minimizzare la sua distanza complessiva dai dati (perdita di informazione) misu-rata attraverso gli scarti

ei = xi−α

come

D =1n

k

∑i=1

d(ei)ni

dove d(·) è un’opportuna funzione di distanza che quantifica il danno (perdita di informa-zione) ei = xi−α in corrispondenza della generica unità statistica

6.18

Teorema 7 (Funzione di perdita valore assoluto).

d(e) = |e|=

e se e≥ 0−e se e < 0

−3 −2 −1 0 1 2 3

0.0

0.5

1.0

1.5

2.0

2.5

3.0

e

|e|

D =1n

k

∑i=1|xi−α|ni

D = min↔ α = x0.5 (mediana)

In questo caso il danno è proporzionale rispetto all’errore. 6.19

Si riportano due dimostrazioni del risultato.

Dimostrazione. Con riferimento ai dati v j ordinati, ovvero v( j), D = 1n ∑

nj=1 |v j−α|.

Consideriamo v(1) e v(n)

v(1) v(n)α

ogni punto interno al segmento[v(1),v(n)

]è a distanza minima dagli estremi

(si pensi ai punti esterni)

v(1) v(n)

100

lo stesso può dirsi per[v(2),v(n−1)

]. . . e così viaPertanto:

• se n è dispari → α = v( n+12 )

• se n è pari → v( n2 )≤ α ≤ v( n

2+1)(va bene ogni punto del segmento)

In particolare:

x0.5 =v( n

2 )+ v( n

2+1)

2

6.20

6.21Dimostrazione. Si considerino 9 punti distinti su una retta

a b c d e f g h i

Dobbiamo cercare il punto che minimizza la media o, equivalentemente, la somma delledistanze da tutti i 9 puntiConsideriamo un punto compreso tra a e b

La somma delle distanze è data dalla somma dei 9 segmenti in figura

a b c d e f g h iα

Se consideriamo un punto compreso tra b e c la somma delle distanze si riduce:a e b sono più lontani dal nuovo punto, ma questo è più vicino agli altri 7 punti

a b c d e f g h iα

Possiamo ulteriormente ridurre la somma delle distanze spostando α verso destra

a b c d e f g h iα

101

La somma delle distanze risulta minima se α coincide con e.

Infatti spostandosi ancora a destra la distanza si ridurrebbe per f ,g,h, i, ma aumenterebbeper a,b,c,d ed e

a b c d e f g h iα

e rappresenta il punto mediano.6.22

6.23

6.24

6.25

6.26

Teorema 8 (Funzione di distanza quadratica).

d(e) = e2

−3 −2 −1 0 1 2 3

02

46

8

e

e2

D =1n

k

∑i=1

(xi−α)2ni

D = min↔ α = µ (media aritmetica)

In questo caso il danno è più che proporzionale rispetto all’errore. 6.27

Si riportano due dimostrazioni del risultato

Dimostrazione. Riscriviamo la funzione da minimizzare utilizzando l’operatore mediaaritmetica

D =1n

k

∑i=1

(xi−α)2ni = M[(X−α)2] .

Sommando e togliendo µ si ottiene

D = M[(X−µ +µ−α)2] .

Si sviluppa ora il quadrato del binomio con termini (X−µ) e (µ−α)

D = M[(X−µ)+(µ−α)]2

= M

[(X−µ)2 +(µ−α)2 +2(X−µ)(µ−α)

].

Tenendo conto che l’operatore media aritmetica è lineare otteniamo

D = M[(X−µ)2]+M

[(µ−α)2]+2M[(X−µ)(µ−α)].

102

L’espressione (µ − α) è una costante; quindi M[(µ−α)2

]= (µ − α)2 nel secondo

addendo e nel terzo addendo (µ−α) può essere portata fuori dall’operatore media

D = M[(X−µ)2]+(µ−α)2 +(µ−α)2M[(X−µ)].

Tenendo conto che la variabile scarto dalla media (X−µ) è caratterizzata da media nulla,M[(X−µ)] = 0, il terzo addendo risulta nullo, quindi

D = M[(X−µ)2]+(µ−α)2.

L’espressione risulta minima se

α = µ = µ(1) = M(X).

6.28

Dimostrazione. Riscriviamo, anche per questa dimostrazione, la funzione da minimizzareutilizzando l’operatore media aritmetica

D =1n

k

∑i=1

(xi−α)2ni = M[(X−α)2] .

Poniamo uguale a 0 la derivata della funzione obiettivo

d M[(X−α)2

]dα

= 0.

Dal momento che la media è un operatore lineare possiamo scambiare l’ordine dell’ope-ratore derivata e dell’operatore media

M[

d (X−α)2

dα

]= 0.

Ricordando la formula della derivata di una funzione composta otteniamo

M [2(X−α)(−1)] = 0.

I termini 2 e (−1) sono costanti moltiplicative e possono essere portati fuori dall’operatoremedia

−2M(X−α) = 0.

Ricordando che la media è un operatore lineare otteniamo

M(X)−M(α) = 0

α è una costante, quindi M(α) = α

M(X)−α = 0

In conclusione:α = µ = µ

(1) = M(X).6.29

Per verificare che effettivamente si tratta di un punto di minimo possiamo controllare ilsegno della derivata seconda della funzione da minimizzare in corrispondenza del puntoestremante α = µ

d2 M[(X−α)2

]dα2 = M

[d2 (X−α)2

dα2

]= M

[d [−2(X−α)]

dα

]= M(+2) = +2.

La funzione è convessa e il punto estremante è di minimo. 6.30

103

5 Proprietà associativa della media aritmetica

Consente di esprimere la media generale come media delle medie parziali.Si considerino i dati elementari

v1,v2, . . . ,vn

riuniti in h gruppi

1 2 ... h

n1 n2 ... nh

µ1 µ2 ... µh

Il singolo valore viene ora indicato con xi j: j-esima osservazione ( j = 1,2, . . . ,ni) nelgruppo i (i = 1,2, . . . ,h).

OsservazioniGli h gruppi definiscono una partizione delle n unità statistiche.Il raggruppamento in tabelle è uno dei possibili.

6.31

Definizione 9 (Proprietà associativa della media aritmetica). Sia data una popolazionesuddivisa in h gruppi e sia

µi =1ni

ni

∑j=1

xi j

la media del gruppo i-esimo.La media generale (calcolata su tutte le unità statistiche)

µ =1n

h

∑i=1

ni

∑j=1

xi j

può essere riespressa come

µ =1n

h

∑i=1

ni

ni

ni

∑j=1

xi j =

=1n

h

∑i=1

ni

(1ni

ni

∑j=1

xi j

)=

1n

h

∑i=1

µini

6.32vale a dire

µ =1n

h

∑i=1

µini =h

∑i=1

µi fi.

6.33

104

Esempio 10. Si consideri la seguente popolazione di 10 unità statistiche raggruppate in 3gruppi

1 2 3

4 5

6 7

4 6

6 8

6

8

Si calcolano in primo luogo le medie per i tre gruppi•

µ1 =14(4+5+6+7) = 5.5

•µ2 =

14(4+6+6+8) = 6

•µ3 =

12(6+8) = 7

6.34È possibile ricostruire la variabile statistica medie di gruppo

i µi ni1 5.5 42 6 43 7 2

10

le cui modalità sono le medie di gruppo, con associate come frequenze le rispettivenumerosità di gruppo.La media di tale variabile statistica risulta

µi ni µini5.5 4 226 4 247 2 14

10 60

µ =1n

3

∑i=1

µini =110

60 = 6

e coincide con la media generale calcolata su tutte le unità statistiche. 6.35

Infatti:µ =

110

(4+5+6+7+4+6+6+8+6+8) = 6

ovvero

xi ni4 25 16 47 18 2

10

xi ni xini4 2 85 1 56 4 247 1 78 2 16

10 60

µ = 6distribuzionesimmetrica

µ =1n

5

∑i=1

xini =1

1060 = 6

6.36

105

Esempio 11. Sianoµ1 il voto medio delle n1 femmineµ2 il voto medio degli n2 maschi

µ =µ1n1 +µ2n2

n1 +n2= voto medio della classe

Esempio 12. Dai dati di produzione media giornaliera alla media mensile o trimestrale(NB solo se le medie parziali sono aritmetiche!!)

6.37

OsservazioneSi consideri la formula della media aritmetica

µ =1n

h

∑i=1

µini.

Indicato conti = µini

il totale parziale; allora

µ =1n

h

∑i=1

ti =Tn

dove T è il totale generale, che associa quindi i totali parziali6.38

6 Esercizi

Esercizio 13. Definita una partizione degli abitanti di una regione in due gruppi, indicatinel seguito con 1 e 2, si sono costruiti i seguenti prospetti relativi alla distribuzione deiredditi in ciascun gruppo.

Gruppo 1Ri ni

10 a 15 180015 a 30 150030 a 50 2700

Gruppo 2Ri ni fi

10 a 15 0.1515 a 30 0.2530 a 50 0.60

1. Sapendo che il reddito medio di tutti gli abitanti della regione è 30, si determini, peril gruppo 2, il numero ni di soggetti appartenenti a ciascuna delle classi di reddito.

6.39

Esercizio 14 (T 216, 04.02.2005, 1). Con riferimento al numero dei componenti del-le 50.000 famiglie di una certa regione si sono calcolati i seguenti indici di posizione:m.geometrica = 2.7; m.quadratica = 3.8.

1. Definire un intervallo di valori che contenga il numero di abitanti della regione.6.40

106

7 Riassunto delle proprietà di alcuni indici di posizione

(se non specificato, per media si intende quella aritmetica)

mediana

• media in senso stretto• operatore lineare• minimizza la somma degli scarti assoluti

media

• media in senso stretto• operatore lineare• annulla la somma degli scarti relativi• minimizza la somma degli scarti quadratici• lascia invariato il totale

6.41

media geometrica

• media in senso stretto• lascia invariato il prodotto• ln

(µ(0)

)= M [ln(X)]

6.42

OsservazioneLa mediana è un indicatore robusto in quanto risente meno, rispetto alla media, dei valorianomali

0 1 2 3 4

0 1 2 3 9

X

Y

x0.5 = 2 = y0.5 ma M(X) = 2 < M(Y ) = 3

OsservazioneSi ribadisce il carattere generale di applicazione dei percentili: sono indicatori robusti eattraverso il grafico Box & Whiskers plot abbiamo una descrizione quasi completa deicaratteri di tipo quantitativo.

6.43

107

Sezione 7Variabilità (1)

7.1

Indice

1 Indici di variabilità 109

2 La variabilità per i caratteri qualitativi 110

3 Le situazioni estreme 1113.1 La situazione di assenza di eterogeneità . . . . . . . . . . . . . . . . . . 1113.2 La situazione di massima eterogeneità . . . . . . . . . . . . . . . . . . . 111

4 L’indice di eterogeneità di Gini 112

5 Gli indici normalizzati 113

6 L’indice di Frosini normalizzato 116

7 Utilizzo congiunto della Moda e dell’indice di eterogeneità 118

8 Esercizi 119

9 Libero Mercato, Monopolio e Oligopolio 119 7.2

1 Indici di variabilità

• indice sintetico di posizione è utile per alcuni confronti• appare tuttavia insufficiente• sintesi troppo spinta fa perdere informazioni

→ POSIZIONE+VARIABILITÀ

• interessano anche indicatori della molteplicità e della diversità dei valori di uncarattere

v1,v2, . . . ,vn

?è più costante l’impegno degli studenti maschi o quello delle femmine

?c’è più sperequazione economica in Piemonte o in Lombardia

?7.3

109

è più variabile (disperso) X oppure Y ?

4 7 10 15 18 20

0 2 3 4 7 8

X

Y

7.4

Esempio 1. Si considerino le votazioni riportate da due studenti in 25 esami

xi ni18 1224 130 12

25

yi ni24 25

25

• Come vengono qualificati i due studenti utilizzando solo una misura di posizione(media, mediana)?

• Possiamo ritenere che l’impegno dedicato alla preparazione degli esami sia lo stessoper i due studenti?

Definizione 2 (La variabilità). Si definisce variabilità l’attitudine di un fenomeno a ma-nifestarsi con molteplici valori.

7.5

2 La variabilità per i caratteri qualitativi

Con riferimento ai caratteri qualitativi si parla di mutabilità o eterogeneità

Esempio 3. Si considera il colore dei capelli di alcune scolaresche

(distribuzioni %)colore S1 S2 S3nero 0.10 0.30 0.70castano 0.25 0.30 0.20biondo 0.60 0.30 0.05altro 0.05 0.10 0.05

1 1 1

• in quale scolaresca c’è minore variabilità?• in quale scolaresca c’è maggiore variabilità?

7.6

110

3 Le situazioni estreme

3.1 La situazione di assenza di eterogeneità

Assenza di eterogeneità

• quando tutti hanno lo stesso colore dei capelli

colore finero 1castano 0biondo 0altro 0

1


1


1


1

• minima eterogeneità:∃ fi = 1, f j = 0 se j 6= i

• mutabile statistica degenere

7.7

3.2 La situazione di massima eterogeneità

Massima eterogeneità

• nel caso avessimo solo 4 soggetti

– se 1 nero, 1 castano, 1 biondo, 1 con altro colore

• e se i soggetti fossero 8?

– se 2 neri, 2 castani, 2 biondi, 2 con altro colore

colore ni finero 2 0.25castano 2 0.25biondo 2 0.25altro 2 0.25

8 1

• massima eterogeneità:

f1 = . . .= fk =1k

• equidistribuzione delle frequenze

7.8

111

Situazioni estremeRitornando all’esempio delle scolaresche

colore S1 S2 S3 S4 S5nero 0.10 0.30 0.70 0 0.25castano 0.25 0.30 0.20 1 0.25biondo 0.60 0.30 0.05 0 0.25altro 0.05 0.10 0.05 0 0.25

1 1 1 1 1

• minima variabilità:∃ fi = 1, f j = 0 se j 6= i

tutti i valori sono uguali (ad esempio S4)• massima variabilità:

f1 = . . .= fk =1k

equidistribuzione delle frequenze (S5)

7.9

4 L’indice di eterogeneità di Gini

Definizione 4 (Indice di eterogeneità di Gini).

G = 1−k

∑i=1

f 2i

OsservazioneL’indice di Gini viene usato anche per lo studio della concentrazione industriale o dimercato

7.10

Calcolo dell’indice di GiniConsideriamo la prima scolaresca S1

xi fi f 2i

x1 0.1 0.01x2 0.25 0.0625x3 0.6 0.36x4 0.05 0.0025

1 0.435

G = 1−k

∑i=1

f 2i = 1−0.435 = 0.565.

In base al valore ottenuto possiamo ritenere che sussiste un livello elevato o basso dieterogeneità?

7.11

112

5 Gli indici normalizzati

Gli indici normalizzatiIn genere, quando si costruisce uno strumento per misurare il livello I assunto da undeterminato fenomeno (temperatura, peso, variabilità, tasso di umidità), è opportunoindividuare le due situazioni estreme, corrispondenti a

• Imin: minima presenza o assenza del fenomeno oggetto di studio• Imax: massima presenza teorica del fenomeno oggetto di studio

la situazione osservata, caso reale, si posiziona in una situazione intermedia, quindi

Imin ≤ I ≤ Imax

Imin I Imax

7.12

Risulta più comodo costruire un indice che varia tra estremi prestabilitiUn indice normalizzato, IN , varia tra 0 e 1

Imin I Imax

0 1IN

• IN = 0 quando I = Imin• IN = 1 quando I = Imax

7.13Imin ≤ I ≤ Imax

Imin I Imax

0 1IN

0≤ IN ≤ 1

7.14

113

Imin ≤ I ≤ Imax

Imin I Imax

0 1IN

0≤ IN =I− Imin

Imax− Imin≤ 1

7.15

Definizione 5 (Indice normalizzato).

IN =I− Imin

Imax− Imin

IN = 0 ↔ I = Imin

IN = 1 ↔ I = Imax

Interpretazione

IN

0 0.3 0.5 0.65 0.8 0.9 1

molto basso basso medio alto altissimomedioalto

7.16

OsservazioneGli indici normalizzati consentono anche di effettuare dei confronti tra situazioni diverse.

OsservazioneSi fa presente che la scala di interpretazione riportata ha carattere puramente indicativo.Infatti, una valutazione basata sul valore di un indice normalizzato può avere implicazionidiverse a seconda della disciplina che tratta il problema oggetto di analisi (Economia,Marketing, Sociologia, Psicologia, Medicina) e dell’importanza del problema.

7.17

114

G = 1−k

∑i=1

f 2i

assenza mutabilità caso reale massima mutabilitàGmin G Gmax

xi fi f 2i

x1 0 0x2 0 0x3 1 1x4 0 0

1 1

xi fi f 2i

x1 0.1 0.01x2 0.25 0.0625x3 0.6 0.36x4 0.05 0.0025

1 0.435

xi fi f 2i

x1 0.25 0.0625x2 0.25 0.0625x3 0.25 0.0625x4 0.25 0.0625

1 0.25

Gmin = 1−1 G = 1−0.435 Gmax = 1−0.25Gmin = 0 G = 0.565 Gmax = 0.75

GN =G−Gmin

Gmax−Gmin=

0.565−00.75−0

= 0.7533

7.18

7.19

7.20

7.21

L’indice di Gini nella situazione di massima eterogeneitàxi fi f 2

ix1 f1 =

1k

1k2

x2 f2 =1k

1k2

......

...xk fk =

1k

1k2

1 k 1k2

Gmax = 1−k

∑i=1

f 2i = 1−

k

∑i=1

1k2 = 1− k

1k2 = 1− 1

k

GN =G−Gmin

Gmax−Gmin=

G−01− 1

k −0=

G1− 1

k7.22

115

6 L’indice di Frosini normalizzato

L’indice di Gini Normalizzato, GN , assume valori elevati anche in situazioni che nonpossono ritenersi prossime a quella di massima eterogeneità, risultando così poco discri-minante in situazioni ’vicine’ alla situazione di massima eterogeneità.Si consideri, a titolo esemplificativo la seguente generica mutabile statistica

xi fix1 f1 = 1− γ

x2 f2 = γ/3x3 f3 = γ/3x4 f4 = γ/3

1

al variare di γ nell’intervallo [0,0.75]. In corrispondenza degli estremi di tale intervallo sihanno, infatti, le situazioni di massima eterogeneità e di assenza di eterogeneità. 7.23

Nel seguente prospetto sono riportate 7 distribuzioni esemplificative. L’indice GN assumecorrettamente valore basso nelle situazioni a e b nelle quali le frequenze sono fortementeconcentrate in una sola categoria, ma assume valore medio/alto nelle situazioni c e d,nelle quali le frequenze sono ancora concentrate nella sola categoria x1.

a b c d e f gx1 1.0000 0.8750 0.7500 0.6250 0.5000 0.3750 0.2500x2 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500x3 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500x4 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500

GN 0.0000 0.3056 0.5556 0.7500 0.8889 0.9722 1.00007.24

Si rappresenta graficamente l’andamento di GN al variare di γ .

0.0

0.5

1.0

assenza dieterogeneita'

massimaeterogeneita'

a b c d e f g

GN

7.25

116

Una possibile soluzione è rappresentata dall’indice di Frosini normalizzato1

FN = 1−

√√√√ kk−1

(k

∑i=1

f 2i −

1k

)= 1−

√1−GN .

7.26

Il seguente prospetto riporta anche il valore di FN per le 7 distribuzioni sopra considerate.L’indice FN è caratterizzato da una struttura più lineare.

a b c d e f gx1 1.0000 0.8750 0.7500 0.6250 0.5000 0.3750 0.2500x2 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500x3 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500x4 0.0000 0.0417 0.0833 0.1250 0.1667 0.2083 0.2500

GN 0.0000 0.3056 0.5556 0.7500 0.8889 0.9722 1.0000FN 0.0000 0.1667 0.3333 0.5000 0.6667 0.8333 1.0000

7.27Si completa la rappresentazione grafica con l’andamento di FN .

0.0

0.5

1.0

assenza dieterogeneita'

massimaeterogeneita'

a b c d e f g

GN

FN

7.28

1La relazione tra FN e GN vale in quanto:

FN = 1−

√√√√ kk−1

(k

∑i=1

f 2i −

1k

)=

= 1−

√∑

ki=1 f 2

i −1k

k−1k

=

= 1−

√∑

ki=1 f 2

i −1k

1− 1k

=

= 1−

√∑

ki=1 f 2

i −1+1− 1k

1− 1k

=

= 1−

√1− 1

k −(1−∑

ki=1 f 2

i)

1− 1k

=

= 1−

√1−

1−∑ki=1 f 2

i

1− 1k

=

= 1−√

1−GN .

117

Si osserva come gli indici di eterogeneità proposti soddisfano le seguenti proprietà:• non negatività;• sono nulli nella situazione di assenza di eterogeneità;• soddisfano la proprietà di coerenza: considerate due generiche frequenze fi e f j

per le quali 0 < fi ≤ f j, se fi viene diminuita della quantità δ > 0, e corrispon-dentemente f j è aumentata della stessa quantità δ , gli indici di eterogeneità devonodiminuire, o al più restare costanti (cfr. Frosini 2009 Metodi Statistici: teoria eapplicazioni economiche e sociali. Carocci).

7.29

7 Utilizzo congiunto della Moda e dell’indice di etero-geneità

Utilizzo congiunto della Moda e dell’indice di eterogeneitàPossiamo confrontare le 5 scolaresche in base alla Moda e alla mutabilità del colore deicapelli

colore S1 S2 S3 S4 S5nero 0.10 0.30 0.70 0 0.25castano 0.25 0.30 0.20 1 0.25biondo 0.60 0.30 0.05 0 0.25altro 0.05 0.10 0.05 0 0.25

1 1 1 1 1

Moda biondo @ nero castano @G 0.565 0.72 0.465 0 0.75GN 0.7533 0.96 0.62 0 1FN 0.5033 0.8 0.3836 0 1

• la moda è rappresentativa della distribuzione quando la mutabilità non è elevata• L’indice di Frosini Normalizzato fornisce un’informazione più realistica sul livello

di eterogeneità per le scolaresche S3 ed S1.7.30

Esempio 6.xi ni fi f 2

ix1 25 0.125 0.015625x2 35 0.175 0.030625x3 100 0.5 0.25x4 40 0.2 0.04

200 1 0.33625

G = 1−k

∑i=1

f 2i = 1−0.33625 = 0.66375

Gmin = 0

Gmax = 1− 14= 0.75

GN =G−Gmin

Gmax−Gmin=

0.66375−00.75−0

= 0.885

FN = 1−√

1−GN = 1−√

1−0.885 = 0.6609

• possiamo ritenere che sussiste un livello medio/alto di eterogeneità7.31

118

8 Esercizi

Esercizio 7. [T 162, 24.06.1998, A] Una delegazione provinciale della F.I.C. (Federazio-ne Italiana Cronometristi) dispone dei dati inerenti 15 servizi di cronometraggio espletatidai suoi 8 componenti (A,B, . . . ,H) durante l’anno.Si riportano il tipo di sport (S, nelle categorie n= nuoto, s= sci, c= ciclismo), la stagionedel servizio (T , a= autunno, i= inverno, p= primavera, e= estate), la durata del servizio(D, in minuti) e l’entità del rimborso complessivamente percepito per il servizio (R, in e).

serv 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15cron B B H G F A E E B C D D B C GS n n c c n s s n s n s s c c nT a a a a i i i i i p p p p p pD 120 120 360 60 180 360 360 120 360 180 480 420 300 420 180R 20 20 45 60 30 50 70 30 60 45 60 70 40 60 30

1. Si confronti il grado di mutabilità di S e di T .7.32

Esercizio 8 (T 224, 02.02.2006, 3). Con riferimento alla seguente v.s. X :

xi nia1 30a2 ?a3 ?

1. determinare n2, n3 ed n in modo che Eterogeneità(X) = max teorico;2. posto poi n = 120 ed n2 = n3 valutare il grado di eterogeneità presente nei dati.

7.33

9 Libero Mercato, Monopolio e Oligopolio

Libero Mercato, Monopolio e OligopolioSia X una variabile statistica le cui categorie x1,x2, . . . ,xk sono le denominazioni socialidelle k imprese operanti su un mercato, mentre f1, f2, . . . , fk rappresentano le quote dimercato delle k imprese

• in una situazione di perfetta concorrenza si potrebbe ipotizzare che le impreseabbiano tutte la stessa quota di mercato

– equidistribuzione delle frequenze↔ mutabilità massima

• in una situazione di Monopolio il mercato è concentrato in una sola delle imprese

– mutabile statistica degenere↔ assenza di mutabilità

• in una situazione di Oligopolio il mercato è concentrato in poche imprese.Che valore assumerà l’indice di eterogeneità?

– possiamo aspettarci un valore elevato dell’indice di Frosini normalizzato; inuna situazione di oligopolio esistono, infatti, accordi (cartelli) tra le imprese,che comunicano tra loro e possono definire quote di mercato omogenee.

7.34

119


8.1

Indice

1 La variabilità per caratteri quantitativi 121

2 Una classe di indici di variabilità globale 1252.1 La differenza semplice media (r = 1) . . . . . . . . . . . . . . . . . . . 1262.2 La differenza quadratica media (r = 2) . . . . . . . . . . . . . . . . . . . 127

3 Una classe di indici di dispersione 1273.1 Lo scostamento medio assoluto dalla mediana (r = 1,c = x0.5) . . . . . . 1283.2 Lo scarto quadratico medio (r = 2,c = µ) . . . . . . . . . . . . . . . . . 129

4 Proprietà di minimo di D1(x0.5) e di D2(µ) 130

5 La varianza 131

6 Varianza di una trasformazione lineare 132

7 Gli indici relativi 133

8 Esercizi 135

9 Indicazioni operative sull’utilizzo delle misure di posizione e di variabilità 138 8.2

1 La variabilità per caratteri quantitativi

Si ricorda che con riferimento ai caratteri quantitativi è possibile definire una distanza dtra le modalità xi, x j assunte da due generiche unità statistiche, tale che:

1. d(xi,x j) = |x j− xi|= |xi− x j| ≥ 02. d(xi,x j) = 0↔ xi = x j3. |xi− x j| ≤ |xi− xk|+ |x j− xk|

121

xi nix1 n1x2 n2x3 n3x4 n4x5 n5

n

xi

ni

x1 x2 x3 x4 x5

8.3

Al fine di definire la variabilità di un carattare quantitativo si utilizzano degli indicatorielementari che possono essere di variabilità globale o di dispersione da un centro.

Tipologie di indicatori elementari

• indicatori elementari di variabilità globale• indicatori elementari di dispersione rispetto a un centro di riferimento c

x1

x2

x3

x4

x5

x1

x2

x3

x4

x5

c

ogni unità statisticaviene confrontatacon tutte le altre

ogni unità statisticaviene confrontata con

un valore c di riferimento

8.4

122

Definizione 1 (Indicatori elementari di variabilità globale).

x1

x2

x3

x4

x5

• |xi− x j|, i = 1, . . . ,k, j = 1, . . . ,k8.5

Indicatori elementari di variabilità globale• |xi− x j|, i = 1, . . . ,k, j = 1, . . . ,k• quante coppie è possibile formare con elementi di due gruppi, il primo costituito da

ni oggetti e il secondo da n j oggetti?• ad esempio se n1 = 3 ed n2 = 4• gruppo 1 (a,a,a) e gruppo 2 (b,b,b,b)

b b b ba (a,b) (a,b) (a,b) (a,b)a (a,b) (a,b) (a,b) (a,b)a (a,b) (a,b) (a,b) (a,b)

(n1 = 3) · (n2 = 4) = 12 coppie

• di indicatori elementari |xi−x j| calcolati con le modalità xi e x j ne esistono, quindi,ni ·n j

• il numero totale degli indicatori elementari di variabilità globale è n2, avendo con-siderato anche il confronto di ogni unità statistica con se stessa

8.6

Esempio 2.

xi ni1 23 35 2

7

1 1 3 3 3 5 51133 |xi− x j|355

123

8.7

Definizione 3 (Indicatori elementari di dispersione rispetto a un centro c).

x1

x2

x3

x4

x5

c

• |xi− c|, i = 1, . . . ,k8.8

Indicatori elementari di dispersione rispetto a un centro c

• |xi− c|, i = 1, . . . ,k• di indicatori elementari di dispersione del tipo |xi− c|, calcolati con la modalità xi,

ne esistono ni• il numero totale degli indicatori elementari di dispersione rispetto a un centro c è n

8.9

Esempio 4.

xi ni1 23 35 2

7

1 1 3 3 3 5 51133 |xi− x j|355

(49 indicatori)

xi ni1 23 35 2

7

1 1 3 3 3 5 5|xi− c|

(7 indicatori)8.10

124

Interpretazione degli indicatori elementari

indicatori elementari tutti nulli

l

assenza di variabilità

l

dati tutti eguali (v.s. degenere)

Misure di variabilitàIn corrispondenza delle due tipologie di indicatori elementari è possibile definire dellemisure di

• variabilità globale V (X)• dispersione da un centro D(X)

Tali misure sono funzione degli indicatori elementari

• sono definite come medie potenziate degli indicatori elementari8.11

Caratteristiche di base degli indici di variabilità• V (X)≥ 0,D(X)≥ 0 (non negatività)• V (X) = 0,D(X) = 0 se e solo se xi = c• monotonicità rispetto agli indicatori elementari |xi− x j| oppure |xi− c|

8.12

2 Una classe di indici di variabilità globale

Definizione 5 (Differenza media con ripetizione). Si definisce differenza media con ripe-tizione di ordine r la media potenziata di ordine r (r = 1,2, . . .) degli indicatori elementaridi variabilità globale |xi− x j|, i = 1, . . . ,k, j = 1, . . . ,k

∆r =

[1n2

k

∑i=1

k

∑j=1|xi− x j|rnin j

]1/r

(r = 1,2, . . .)

Sono dette ’con ripetizione’ perchè vengono conteggiate anche le differenze |xi− xi|= 0.8.13

ProprietàEssendo ∆r una media in senso stretto sono rispettate le caratteristiche degli indici divariabilità

• condizione di Cauchy

min |xi− x j|= 0≤ ∆r ≤max |xi− x j|

quindi:

– ∆r ≥ 0 (non negatività)

– ∆r = 0 se e solo se xi = c

• condizione di monotonicità

∆r è funzione monotona crescente rispetto a |xi− x j|

125

• proprietà moltiplicativa

Se Y = bX allora ∆r(Y ) = ∆r(bX) = b∆r(X).

Inoltre

• limite superiore medie potenziate

limr→+∞

∆r = max |xi− x j|= xk− x1 = R

dove R = Range o campo di variazione• invarianza per traslazione

se Y = X +b allora ∆r(Y ) = ∆r(X +b) = ∆r(X).8.14

8.15Invarianza per traslazioneSi consideri Y = X +1, ad esempio:

xi ni2 34 47 3

10

yi ni3 35 48 3

10

ni

2 4 73 5 8

le distanze interne tra le modalità sono le stesse per X e Y8.16

2.1 La differenza semplice media (r = 1)

Definizione 6.

∆1 =1n2

k

∑i=1

k

∑j=1|xi− x j|nin j

OsservazioneLa versione ’normalizzata’ della differenza semplice media viene utilizzata in EconomiaPolitica e in Scienze delle Finanze come indicatore di concentrazione della ricchezza.

8.17

126

2.2 La differenza quadratica media (r = 2)

Definizione 7.

∆2 =

[1n2

k

∑i=1

k

∑j=1

(xi− x j)2nin j

]1/2

OsservazioneÈ collegata a σ , il più importante indice di dispersione;si ha, infatti

∆2 =√

2 · (scarto quadratico medio) =√

2 ·σ8.18

3 Una classe di indici di dispersione

Definizione 8 (Le differenze medie di ordine r). Si considera la media potenziata diordine r (r = 1,2, . . .) degli indicatori elementari di dispersione dal centro di riferimentoc, |xi− c|, i = 1, . . . ,k

Dr(c) =

[1n

k

∑i=1|xi− c|rni

]1/r

= (M [|X− c|r])1/r (r = 1,2, . . .)

solitamente come centro c si può considerare:

• un percentile (xp)• la mediana (x0.5)• la media aritmetica (µ)

8.19

ProprietàEssendo Dr(c) una media in senso stretto sono rispettate le caratteristiche degli indici divariabilità

• condizione di Cauchy

(min |xi− c| ≥ 0)≤ Dr(c)≤max |xi− c|

quindi:

– Dr(c)≥ 0 (non negatività)

– Dr(c) = 0 se e solo se xi = c

• condizione di monotonicità

Dr(c) è funzione monotona crescente rispetto a |xi− c|.• proprietà moltiplicativa

se Y = bX allora Dr(bc)Y = Dr(bc)bX = bDr(c)X

Inoltre

• invarianza per traslazione

se Y = X +b allora Dr(c+b)Y = Dr(c+b)(X+b) = Dr(c)X

8.20

8.21

127

Invarianza per traslazioneSi consideri Y = X +1, ad esempio:

xi ni2 34 47 3

10

µX = 4.3

yi ni3 35 48 3

10

µY = 5.3

ni

2 4 73 5 8

le distanze tra le modalità e la media sono le stesse per X e Y8.22

3.1 Lo scostamento medio assoluto dalla mediana (r = 1,c = x0.5)

Definizione 9.

D1(x0.5) =1n

k

∑i=1|xi− x0.5|ni

ovveroD1(x0.5) = M [|X− x0.5|]

8.23

Esempio 10. Calcoliamo D1(x0.5) per la serie statistica

xi ni2 34 47 3

10

In primo luogo si deve determinare il valore della mediana

xi ni Ni2 3 34 4 77 3 10

x0.5 =x(5)+ x(6)

2= 4

128

Si calcolano poi gli scostamenti assoluti dalla mediana e li si moltiplica per le frequenze

xi ni |xi− x0.5| |xi− x0.5|ni2 3 2 64 4 0 07 3 3 9

10 15

D1(x0.5) =1

1015 = 1.5

8.24

3.2 Lo scarto quadratico medio (r = 2,c = µ)

Definizione 11.

D2(µ) =

[1n

k

∑i=1

(xi−µ)2ni

]1/2

= σ

ovvero

D2(µ) =

√M[(X−µ)2

]= σ

OsservazioneÈ collegato alla differenza quadratica media

∆2 =√

2 ·σ

per r = 2 l’indice di variabilità globale è direttamente proporzionale all’indice di disper-sione riferito alla media.

8.25

Esempio 12. Con riferimento alla serie statistica

xi ni xini2 3 64 4 167 3 21

10 43

la media aritmetica risultaµ = M(X) =

110

43 = 4.3

Si calcolano gli scostamenti al quadrato da µ e li si moltiplica per le frequenze

xi ni (xi−µ)2 (xi−µ)2ni2 3 5.29 15.874 4 0.09 0.367 3 7.29 21.87

10 38.10

Dividendo il totale ottenuto per la numerosità delle unità statistiche si ottiene il quadratodello scarto quadratico medio

σ2 = M

[(X−µ)2]= 1

n

k

∑i=1

(xi−µ)2ni =110

38.10 = 3.81

σ = D2(µ) =√

M [(X−µ)2] =√

3.81 = 1.95198.26

129

4 Proprietà di minimo di D1(x0.5) e di D2(µ)

Uso combinato delle misure di posizione e di variabilitàx0.5 e D1(x0.5)

µ e σ = D2(µ)

Si ricorda che, in base al criterio di scelta della media per minimizzazione del danno:

D =1n

k

∑i=1|xi−α|ni = min↔ α = x0.5

D =1n

k

∑i=1

(xi−α)2ni = min↔ α = µ

valgono, quindi, le seguenti proprietà di minimo

D1(x0.5) = M [|X− x0.5|]≤M [|X−α|] , ∀α ∈ℜ

σ2 = M

[(X−µ)2]≤M

[(X−α)2] , ∀α ∈ℜ

8.27

130

5 La varianza

Definizione 13 (Varianza).

[D2(µ)]2 =

1n

k

∑i=1

(xi−µ)2ni =k

∑i=1

(xi−µ)2 fi = σ2 =Var(X) = σ

2X

σ2 =Var(X) = M

[(X−µ)2]

Formula operativaσ

2 =Var(X) = M(X2)−µ

2

8.28

Dimostrazione. Sviluppando il quadrato che figura nella definizione

M[(X−µ)2

]= M

(X2−2µX +µ

2)e ricordando che M(·) è un operatore lineare e che µ è una costante, abbiamo

M(X2)−2µM(X)+µ

2 = M(X2)−2µ

2 +µ2 = M

(X2)−µ

2.

8.29

Esempio 14. Per calcolare la varianza della serie statistica

xi ni xini2 3 64 4 167 3 21

10 43

µ = M(X) =110

43 = 4.3

una volta ottenuta la media, è sufficiente calcolare il momento secondo M(X2)

xi ni xini x2i ni

2 3 6 124 4 16 647 3 21 147

10 43 223

M(X2) =1n

k

∑i=1

x2i ni =

110

223 = 22.3

e applicare la formula operativa

Var(X) = σ2 = M[(X−µ)2] =

= M(X2)−µ2 =

= momento secondo−media2 =

= 22.3−4.32

= 22.3−18.49 = 3.81.8.30

131

6 Varianza di una trasformazione lineare

Teorema 15. SeY = aX +b

alloraM(Y ) = aM(X)+b (operatore lineare)

Var(Y ) = a2Var(X) (non è un operatore lineare)

Dimostrazione. Si applichi la definizione di varianza alla variabile statistica Y e si espri-mano Y e µY = M(Y ) in funzione di X e µX = M(X):

Var(Y ) = M[(Y −µY )2] = M

[aX +b− (aµx +b)]2

=

= M[aX +b−aµx−b]2

=

= M[aX−aµx]

2=

= M[a(X−µx)]

2=

= M[a2(X−µx)

2]== a2M

[(X−µx)

2]= a2Var(X).

8.31

Esempio 16. Si calcolino media e varianza della seguente serie statistica

xi ni2 103 124 225 6

•

xi ni xini x2i ni

2 10 20 403 12 36 1084 22 88 3525 6 30 150

50 174 650

µ = M(X) = 150 174 = 3.48

M(X2) = 150 650 = 13

• Var(X) = M(X2)−µ2 = 13−3.482 = 13−12.1104 = 0.8896.

Sapendo che Y = 12 X +4 si calcolino M(Y ) e Var(Y )

• M(Y ) = 12 M(X)+4 = 1

2 3.48+4 = 5.74

• Var(Y ) =( 1

2

)2Var(X) = 1

4 0.8896 = 0.2224.8.32

132

7 Gli indici relativi

Indici relativiIn generale:

• gli indici, I, dipendono dall’unità di misura e dall’ordine di grandezza del fenomeno• non è possibile effettuare confronti

Definizione 17 (Indice relativo).

IR =I

opportuno indice= numero puro

l’indice a denominatore ha la stessa unità di misura e lo stesso ordine di grandezza di I.

Definizione 18 (Coefficiente di variazione).

CV =σ

µ

È un indice relativo: numero puro. Può essere definito solo per variabili statistiche cheassumono valori positivi. 8.33

Esempio 19. Si consideri il peso di 4 soggetti misurato alla nascita, variabile X , e all’etàdi 30 anni, variabile Y .

1 2 3 4xi 3 2.5 3.2 5yi 73 57 69 85

Quale tra le due variabili presenta maggiore variabilità?

Confrontando le medie aritmetiche

M(X) =14(3+2.5+3.2+5) = 3.425

M(Y ) =14(73+57+69+85) = 71

come ragionevolmente ci si può aspettare, il livello medio di Y è superiore a quello di X . 8.34

Calcoliamo ora le varianze e i coefficienti di variazione

M(X2) =14(32 +2.52 +3.22 +52) = 12.6225

M(Y 2) =14(732 +572 +692 +852) = 5141

Var(X) = M(X2)−µ2X = 0.8919

Var(Y ) = M(Y 2)−µ2Y = 100

CV (X) =σX

µX=

√0.89193.425

=0.94443.425

= 0.2757

CV (Y ) =σY

µY=

√10071

=1071

= 0.1408

Dal confronto dei coefficienti di variazione si evince che il livello di variabilità di X (pesoda bambini) è superiore a quello di Y (peso da adulti). 8.35

Esempio 20. Volendo confrontare peso e altezza di n individui possiamo calcolare iseguenti indicatori

133

unità di misuraindicatore peso altezzamedia aritmetica µ kg cmvarianza σ2 kg2 cm2

scarto quadratico medio σ kg cmcoefficiente di variazione CV = σ

µ

kgkg = 1 cm

cm = 1

Il confronto degli indici di posizione per variabili con differenti unità di misure non hasenso.Il coefficiente di variazione, che non dipende dall’unità di misura, rende possibile ilconfronto in termini di variabilità. 8.36

Esempio 21. Volendo sintetizzare i redditi di una famiglia e il prodotto interno lordonazionale negli ultimi 10 anni possiamo calcolare i seguenti indicatori

ordine di grandezza in eindicatore famiglia nazionemedia aritmetica µ 103 109

varianza σ2 106 1018

scarto quadratico medio σ 103 109

coefficiente di variazione CV = σ

µ

103

103 = 1 109

109 = 1

Non ha alcun senso confrontare il reddito medio della famiglia con il PIL medio.Il coefficiente di variazione, che non dipende dall’ordine di grandezza, rende possibile ilconfronto in termini di variabilità. 8.37

Teorema 22 (CV di una trasformazione lineare). Siano X > 0 e

Y = aX +b

con a > 0 e b tale che anche Y > 0. Allora:• se b < 0 vale CV (Y )>CV (X),• se b = 0 vale CV (Y ) =CV (X),

(b = 0 corrisponde a una sola trasformazione di scala)• se b > 0 vale CV (Y )<CV (X).

Dimostrazione. Se Y = aX +b abbiamo

µY = aµX +b

Var(Y ) = a2Var(X)

σY = aσX

Quindi:CV (Y ) =

σY

µY=

aσX

aµX +b.

8.38Analogamente al coefficiente di variazione (CV ) è possibile definire un indice relativo,che denominiamo coefficiente di scostamento (CS), a partire dall’indice di dispersione diordine 1, D1(x0.5), scostamento medio assoluto dalla mediana.

Definizione 23 (Coefficiente di scostamento).

CS =D1(x0.5)

x0.5

È un indice relativo: numero puro. Può essere definito solo per variabili statistiche cheassumono valori positivi. 8.39

134

8 Esercizi

Esercizio 24 (T 224, 02.02.2006, 2). Determinare i valori di x1 ed n1 in modo che nellaseguente tabella:

xi nix1 n130 30

1. M(X2) = 500, Var(X) = 100 e X risulti simmetrica.8.40

Esercizio 25 (T 180, 14.09.2000, 1). Lo spessore X delle lamine prodotte da una mac-china è compreso tra 15.2 e 16.5 mm.Si individuino le ampiezze delle 4 classi (Ii) in cui è ripartito l’intervallo (15.1;16.5] inmodo tale che:

I1 I2 I3 I4fi 0.05 0.09 0.72 0.14di 0.25 0.45 2.40 0.20

1. Si costruisca l’istogramma della variabile X .2. Si identifichi il valore della mediana e si calcolino il CV e il CS di X , utilizzando ai

fini del calcolo di D1(x0.5) i valori centrali delle classi.3. Supponendo che dalla produzione vengano scartate le lamine con spessore minore

di 15.3 mm o superiore di 16 mm, si calcoli, sulla base del grafico prima costruito,la percentuale di lamine eliminate.

8.41

Esercizio 26 (T 248, 29.01.2009, 1). Il seguente prospetto riporta i valori rilevati in corri-spondenza a 8 unità statistiche con riferimento a un carattere qualitativo X e a un caratterequantitativo Y :

X a b b c a a c cY 30 20 24 50 40 50 40 30

1. Si ricostruisca la mutabile statistica X e se ne dia una rappresentazione grafica.2. Si riassumano con opportuni indici di posizione e di variabilità le distribuzioni X e

Y , commentando opportunamente i risultati ottenuti.3. Si indichi l’intervallo dei possibili valori che può assumere la media armonica di Y .4. Si definiscano le relazioni esistenti rispettivamente tra le medie e le varianze di Y e

di W = 100−2Y e si calcolino quindi media e varianza di W . -8.42

Esercizio 27 (P 001, 10.03.1995, 1). Data la variabile statistica X con distribuzione difrequenze

x j 1 2 4 7n j 8 10 6 40

calcolare M(X) e Var(X). Calcolare inoltre la media aritmetica e la varianza delle v.s.

Y = 6+X , Z = 7X , W = X3.8.43

Esercizio 28 (P 001, 10.03.1995, 4). Date le v.s. X e Y caratterizzate dalle seriazioni

xi ni10 a 15 2115 a 25 3825 a 50 5150 a 75 20

yi ni100 a 110 30110 a 150 18150 a 200 21200 a 250 21

fornire un’adeguata rappresentazione grafica delle due distribuzioni e confrontarne mediae variabilità.

8.44

135

Soluzione 29 (Esercizio 27). Procediamo, in primo luogo, al calcolo della media aritme-tica di X, M(X) = 1

n ∑ki=1 xini, e della varianza di X

xi ni xini x2i ni

1 8 8 82 10 20 404 6 24 967 40 280 1960

64 332 2104

OtteniamoM(X) =

164

332 = 5.1875

e, utilizzando la formula operativa della varianza:

Var(X) = M[(X−µ)2

]=

= M(X2)− [M(X)]2 =

=164

2104−5.18752 =

= 32.875−26.9102 = 5.9648.

Per ricavare la media aritmetica e la varianza delle variabili statistiche Y = 6+ X eZ = 7X, ricordiamo che l’operatore media aritmetica è un operatore lineare e, quindi,

M(aX +b) = aM(X)+b,

mentre per l’operatore varianza vale

Var(aX +b) = a2Var(X).

Abbiamo, quindi:

M(Y ) = M(6+X) = 6+M(X) = 6+5.1875 = 11.1875M(Z) = M(7X) = 7M(X) = 7 ·5.1875 = 36.3125

Var(Y ) =Var(6+X) =Var(X) = 5.9648

Var(Z) =Var(7X) = 72Var(X) = 49 ·5.9648 = 292.2752.

Per ottenere media e varianza di W = X3 occorre costruire la variabile statistica W,trasformando le modalità xi di X in x3

i , e procedere con i calcoli(si osserva come W non sia una trasformazione lineare di X)

wi = x3i ni wini w2

i ni1 8 8 88 10 80 640

64 6 384 24576343 40 13720 4705960

64 14192 4731184

Abbiamo:

M(W ) = M(X3) =1

6414192 = 221.75,

Var(W ) = M(W 2)− [M(W )]2 =

=1

644731184−221.752 =

= 73924.75−49173.0625 = 24751.6875.

136

8.458.46

8.47Soluzione 30 (Esercizio 28). Siamo in presenza di un carattere quantitativo con valoriraggruppati in classi. Occorre, quindi, procedere al calcolo delle densità di frequenzaper costruire gli istogrammi delle due distribuzioni.

xi ni di10 a 15 21 4.2015 a 25 38 3.8025 a 50 51 2.0450 a 75 20 0.80

10 15 25 50 75

4.2

3.8

2.04

0.8

yi ni di100 a 110 30 3.00110 a 150 18 0.45150 a 200 21 0.42200 a 250 21 0.42

100 150 200 250

3

0.450.420.42

Per procedere al confronto di media e variabilità, procediamo al calcolo della mediaaritmetica e del coefficiente di variazione di X e di Y , considerando le serie statisticheottenute sostituendo alle classi i corrispondenti valori centrali.

xi ni xini x2i ni

12.5 21 262.5 3281.2520 38 760 15200.00

37.5 51 1912.5 71718.7562.5 20 1250 78125.00

130 4185 168325.00

M(X) = 1130 4185 = 32.1923,

Var(X) = M(X2)− [M(X)]2 == 1

130 168325−32.19232 == 1294.8077−1036.3447 = 258.4630.

CV (X) = σXµX

= 16.076832.1923 = 0.4994.

yi ni yini y2i ni

105 30 3150 330750130 18 2340 304200175 21 3675 643125225 21 4725 1063125

90 13890 2341200

M(Y ) = 190 13890 = 154.3333,

Var(Y ) = M(Y 2)− [M(Y )]2 == 1

90 2341200−154.33332 == 26013.3333−23818.7778 = 2194.5556.

CV (Y ) = σYµY

= 46.8461154.3333 = 0.3035.

Possiamo, quindi, concludere che:

• il livello medio di Y è superiore a quello di X

µX = 32.1923, µY = 154.3333;

• la variabile X presenta un livello di variabilità superiore a Y

CV (X) = 0.4994, CV (Y ) = 0.3035.8.48

8.49

137

9 Indicazioni operative sull’utilizzo delle misure di posi-zione e di variabilità

Nelle ultime Sezioni sono stati presentati diversi indici sintetici di posizione e variabilitàche consentono di riassumere una distribuzione.

La scelta di quali indicatori sia più opportuno utilizzare è legata, in primo luogo, allatipologia dei caratteri oggetto di studio.

In presenza di un carattere qualitativo sconnesso si può utilizzare come indice sinte-tico di posizione solo la moda. Se il carattere è ordinato è possibile avvalersi anche deipercentili. In entrambe le situazioni la misura di variabilità propria è l’indice di Frosininormalizzato. 8.50

In presenza di dati metrici disponiamo di una scelta più ampia di indici di posizionee di variabilità. Si ricorda innanzitutto il carattere generale di applicazione dei percen-tili che godono dell’importante proprietà di essere indicatori robusti. x0.25, x0.50 e x0.75rappresentano gli elementi base per la costruzione del grafico Box & Whiskers plot, checonsente di effettuare una descrizione quasi completa dei caratteri di tipo quantitativo conanche l’individuazione dell’eventuale presenza di valori anomali. Dal Box & Whiskersplot è, inoltre, possibile desumere due misure di variabilità: la differenza interquartilex0.75− x0.25 e il range xmax− xmin.Si rimanda alla Sezione 11.3 per un esempio di confronto tra distribuzioni basato sull’a-nalisi dei grafici Box & Whiskers plot. 8.51

Tra le misure di variabilità globale ricordiamo come la versione normalizzata di ∆1sia stata proposta da Gini quale misura di concentrazione dei redditi e della ricchezza.Per la misura di variabilità globale di ordine 2 vale, invece, ∆2 =

√2σ . In base a tale

proprietà lo scarto quadratico medio σ , misura di dispersione di ordine 2 rispetto allamedia aritmetica, risulta essere proporzionale a ∆2. Lo scarto quadratico medio può,quindi, essere, implicitamente, considerato anche funzione degli indicatori elementari divariabilità globale.

Dal criterio di scelta della media per minimizzazione del danno seguono indicazioniper l’utilizzo congiunto degli indici di posizione e variabilità (media aritmetica µ e scartoquadratico medio σ ) oppure (mediana x0.50 e scostamento medio assoluto dalla medianaM [|X− x0.5|]).

Nella Sezione 10.3 si mostrerà come sia possibile una ricostruzione approssimata del-la distribuzione a partire dai soli indicatori media aritmetica e scarto quadratico medio(diseguaglianza di Tchebychev). 8.52

Infine, per effettuare confronti in termini di variabilità tra distribuzioni che assumonovalori positivi e sono caratterizzate da differenti unità di misura o da differenti ordini digrandezza è possibile utilizzare una delle seguenti due misure relative (numeri puri):

• coefficiente di variazioneCV =

σ

µ;

• coefficiente di scostamento

CS =M [|X− x0.5|]

x0.5.

La prima misura è la più nota; la seconda ha il pregio di essere funzione di un indice diposizione robusto. Per una presentazione di ulteriori indicatori robusti di variabilità sirimanda a Rousseeuw PJ, Croux C 1993 Alternatives to the Median Absolute Deviation.Journal of the American Statistical Association, 88, 1273-1283. 8.53

138


9.1

Indice

1 Ulteriori considerazioni su media e varianza di una trasformazione lineare 1391.1 X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1401.2 X∗ = X−µX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1411.3 Z = X−µX

σX= 1

σXX− µX

σX= X∗

σX(variabile statistica standardizzata) . . . . 142

1.4 U = XσX

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1431.5 W = 2X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.2

1 Ulteriori considerazioni su media e varianza di unatrasformazione lineare

ConsiderazioniSe

Y = aX +b

alloraM(Y ) = aM(X)+b operatore lineare

Var(Y ) = a2Var(X) non è un operatore lineare9.3

Si considerano, a titolo di esempio, le seguenti trasformazioni lineari di una seriazionestatistica X

1.X∗ = X−µX

2.Z =

X−µX

σX

3.U =

XσX

4.W = 2X

9.4

139

1.1 X

valori centrali X ni fi ai di xini x2i ni

3 2 a 4 4 0.2 2 0.1 12 366 4 a 8 8 0.4 4 0.1 48 2889 8 a 10 8 0.4 2 0.2 72 648

20 1 132 972

M(X) = 6.6 = µ

Var(X) = 48.6−6.62 = 5.04sqm(X) = σX = 2.245

−5 0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

9.5

140

1.2 X∗ = X−µX

valori centrali X∗ ni fi ai di x∗i ni x∗i2ni

-3.6 −4.6 a −2.6 4 0.2 2 0.1 -14.4 51.84-0.6 −2.6 a 1.4 8 0.4 4 0.1 -4.8 2.882.4 1.4 a 3.4 8 0.4 2 0.2 19.2 46.08

20 1 0 100.8

M(X∗) = 0 = µ

Var(X∗) = 5.04−02 = 5.04sqm(X∗) = σX∗ = 2.245o più semplicementeM(X∗) = M(X)−M(X) = 0Var(X∗) = 12 ·Var(X) =Var(X)

−5 0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

9.6

141

1.3 Z = X−µXσX

= 1σX

X− µXσX

= X∗σX

(variabile statistica standardizzata)

valori centrali Z ni fi ai di zini z2i ni

-1.6036 −2.049 a −1.1581 4 0.2 0.8909 0.2245 -6.4143 10.2857-0.2673 −1.1581 a 0.6236 8 0.4 1.7817 0.2245 -2.1381 0.57141.069 0.6236 a 1.5145 8 0.4 0.8909 0.449 8.5524 9.1429

20 1 0 20

M(Z) = 0 = µ

Var(Z) = 1−02 = 1sqm(Z) = σZ = 1o più semplicementeM(Z) = M(X)/σ −µ/σ = µ/σ −µ/σ = 0Var(Z) =Var(X)/σ2 = σ2/σ2 = 1

−5 0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

9.7

142

1.4 U = XσX

valori centrali U ni fi ai di uini u2i ni

1.3363 0.8909 a 1.7817 4 0.2 0.8909 0.2245 5.3452 7.14292.6726 1.7817 a 3.5635 8 0.4 1.7817 0.2245 21.3809 57.14294.0089 3.5635 a 4.4544 8 0.4 0.8909 0.449 32.0713 128.5714

20 1 58.7975 192.8571

M(U) = 2.9399 = µ

Var(U) = 9.6429−2.93992 = 1sqm(U) = σU = 1o più semplicementeM(U) = M(X)/σ

Var(U) =Var(X)/σ2 = σ2/σ2 = 1

−5 0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

9.8

143

1.5 W = 2X

valori centrali W ni fi ai di wini w2i ni

6 4 a 8 4 0.2 4 0.05 24 14412 8 a 16 8 0.4 8 0.05 96 115218 16 a 20 8 0.4 4 0.1 144 2592

20 1 264 3888

M(W ) = 13.2 = µ

Var(W ) = 194.4−13.22 = 20.16sqm(W ) = σW = 4.49o più semplicementeM(W ) = 2 ·M(X)Var(W ) = 22Var(X) = 4 ·Var(X)

−5 0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

9.9

Definizione 1 (Variabile statistica standardizzata). Data una variabile statistica X conmedia µX e varianza σ2

X si definisce variabile statistica standardizzata la seguente variabilestatistica

Z =X−µX

σX

Applicando le proprietà dell’operatore media e della varianza si dimostra che

M(Z) = 0 e Var(Z) = 1

La variabile statistica standardizzata

• non ha unità di misura• non ha ordine di grandezza• risulta invariante rispetto a eventuali trasformazioni lineari operate su X

Se Y = aX +b abbiamo, infatti:

Y −µY

σY=

aX +b− (aµX +b)aσX

=aX−aµX

aσX=

a(X−µX )

aσX=

X−µX

σX.

9.10

144


10.1

Indice

1 La varianza di un miscuglio (h gruppi) 1451.1 σ2

Between . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1461.2 σ2

Within . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1461.3 Applicazioni del risultato di scomposizione della varianza . . . . . . . . . 1491.4 Il Rapporto di Correlazione . . . . . . . . . . . . . . . . . . . . . . . . . 150

2 Esercizi 153

3 La diseguaglianza di Tchebychev 154 10.2

1 La varianza di un miscuglio (h gruppi)

Si considerino i dati elementariv1,v2, . . . ,vn

riuniti in h gruppi1 2 . . . h

n1 n2 . . . nh

µ1 µ2 . . . µhσ2

1 σ22 . . . σ2

h

(il raggruppamento in tabelle è uno dei possibili).

Il singolo valore viene ora indicato con xi j:j-esima osservazione ( j = 1,2, . . . ,ni) nel gruppo i (i = 1,2, . . . ,h) 10.3

• media gruppo i-esimo

µi =1ni

ni

∑j=1

xi j

• varianza gruppo i-esimo

σ2i =

1ni

ni

∑j=1

(xi j−µi)2

10.4In base alla proprietà associativa della media aritmetica

µ =1n

k

∑i=1

µini

la media generale è la media delle medie di gruppo.

145

Teorema 1 (Scomposizione della varianza). La varianza di tutte le unità statistiche è parialla somma di varianza between e varianza within

σ2 = σ

2B +σ

2W

10.5

1.1 σ2Between

Idea riguardo alla diversità dei gruppi:quanto sono diversi i gruppi tra di loro

• quanto sono diverse le medie di gruppo µi• varianza delle medie di gruppo µi

Definizione 2 (σ2Between).

σ2B =

1n

h

∑i=1

(µi−µ)2ni

10.6

1.2 σ2Within

Idea riguardo alla variabilità all’interno dei gruppi:quanto sono variabili i gruppi al loro interno

• media delle varianze dei gruppi σ2i

Definizione 3 (σ2Within).

σ2W =

1n

h

∑i=1

σ2i ni

10.7

Dimostrazione.

σ2 =

1n

h

∑i=1

ni

∑j=1

(xi j−µ)2 =1n

h

∑i=1

ni

∑j=1

(xi j−µi +µi−µ)2 =

=1n

h

∑i=1

ni

∑j=1

[(xi j−µi)+(µi−µ)]2 =

=1n

h

∑i=1

ni

∑j=1

[(xi j−µi)

2 +(µi−µ)2 +2(xi j−µi)(µi−µ)]=

=1n

h

∑i=1

ni

∑j=1

(xi j−µi)2 +

1n

h

∑i=1

ni

∑j=1

(µi−µ)2 +1n

h

∑i=1

ni

∑j=1

2(xi j−µi)(µi−µ) =

=1n

h

∑i=1

ni1ni

ni

∑j=1

(xi j−µi)2 +

1n

h

∑i=1

ni

∑j=1

(µi−µ)2 +1n

h

∑i=1

ni

∑j=1

2(xi j−µi)(µi−µ) =

=1n

h

∑i=1

niσ2i +

1n

h

∑i=1

(µi−µ)2

ni

∑j=1

1

ni

+2n

h

∑i=1

(µi−µ)

ni

∑j=1

(xi j−µi)

0

=

=1n

h

∑i=1

niσ2i +

1n

h

∑i=1

(µi−µ)2ni +2n

h

∑i=1

(µi−µ) ·0 =

=1n

h

∑i=1

σ2i ni +

1n

h

∑i=1

(µi−µ)2ni = σ2Within +σ

2Between

10.8

146

Esempio 4. Si consideri la seguente popolazione di unità statistiche raggruppate in 3gruppi

1 2 34 5 4 6 66 7 6 8 8

Abbiamo

µ1 =14(4+5+6+7) = 5.5

µ2 =14(4+6+6+8) = 6

µ3 =12(6+8) = 7

e con riferimento alla proprietà associativa della media aritmetica:

µ =1n

3

∑i=1

µini =110

60 = 6

10.9

A partire dalla variabile statistica medie di gruppo

i µi ni1 5.5 42 6 43 7 2

10

le cui modalità sono le medie di gruppo, con frequenze le numerosità di gruppo, possiamocalcolare media e varianza

µi ni µini µ2i ni

5.5 4 22 1216 4 24 1447 2 14 98

10 60 363

µ =1n

h

∑i=1

modalità · frequenze =1n

3

∑i=1

µini =110

60 = 6

σ2B =

1n

3

∑i=1

(µi−µ)2ni =1n

3

∑i=1

µ2i ni−µ

2 =110

363−62 = 36.3−36 = 0.3

la varianza delle medie di gruppo è la varianza Between. 10.10

Calcoliamo ora le varianze nei tre gruppi:

•

σ21 =

14(42 +52 +62 +72)−5.52 =

14

126−30.25 = 31.5−30.25 = 1.25

•σ

22 =

14(42 +62 +62 +82)−62 =

14

152−36 = 38−36 = 2

•σ

23 =

12(62 +82)−72 =

12

100−49 = 50−49 = 1.

147

10.11È possibile ricostruire la variabile statistica varianze di gruppo

i σ2i ni

1 1.25 42 2 43 1 2

10

le cui modalità sono le varianze di gruppo, con associate come frequenze le rispettivenumerosità di gruppo.La media di tale variabile statistica risulta

σ2i ni σ2

i ni1.25 4 52 4 81 2 2

10 15

σ2W =

1n

h

∑i=1

modalità · frequenze =1n

3

∑i=1

σ2i ni =

110

15 = 1.5.

10.12

La varianza generale calcolata su tutte le unità statistiche può essere ottenuta come

σ2 = σ

2B +σ

2W = 0.3+1.5 = 1.8

Si può, infatti, verificare che

σ2 =

110

(42 +52 +62 +72 +42 +62 +62 +82 +62 +82)−62

=1

10378−36 = 37.8−36 = 1.8

ovvero

xi ni x2i ni

4 2 325 1 256 4 1447 1 498 2 128

10 378

σ2 = M(X2)−µ

2 =1

10378−62 = 37.8−36 = 1.8

10.13

148

1.3 Applicazioni del risultato di scomposizione della varianza

Il risultato di scomposizione della varianza

σ2 = σ

2Between +σ

2Within

trova largo impiego nelle analisi di Marketing per rispondere, ad esempio, al seguentequesito:è opportuno effettuare una segmentazione delle unità statistiche in funzione della variabiledi raggruppamento utilizzata nello scomporre la varianza?

Esempi

• Studio del livello di spesa in funzione della fascia di età oppure della regionegeografica.

• Definizione della strategia di comunicazione aziendale: pianificare un’unica cam-pagna o adottare comunicazioni diverse in funzione, ad esempio, dell’età o dellazona di appartenenza?

10.14Il risultato di scomposizione della varianza consente, infatti, di verificare se il comporta-mento delle unità statistiche può essere ritenuto sostanzialmente diverso tra i gruppi.

• La varianza Between, varianza delle medie di gruppo, misura quanto sono tra lorodiverse le medie di gruppo µie, quindi, quanto diverso è il comportamento tra i soggetti appartenenti a diversigruppi.

• La varianza Within, media delle varianze di gruppo, fornisce una sintesi del livellodi variabilità presente in ciascun gruppo: una sintesi di quanto le medie di grupposono rappresentative dei valori all’interno di ciascun gruppo.

10.15

Quando ha senso effettuare una segmentazione delle unità statistiche?Devono essere verificate entrambe le seguenti condizioni:

1. la varianza Between deve assumere valore grande

σ2 ≥ σ

2B 0

2. la varianza Within deve essere piccola

σ2 σ

2W ≥ 0

• medie di gruppo tra loro diverse• medie di gruppo rappresentative dei rispettivi gruppi

(omogeneità dei valori all’interno di ciascun gruppo)10.16

149

1.4 Il Rapporto di Correlazione

Un indice sintetico che consente di stabilire se è opportuno effettuare una segmentazionedelle unità statistiche è il Rapporto di Correlazione(normalizzazione della varianza Between)

Definizione 5 (Rapporto di correlazione).

η2 =

σ2B

σ2

Proprietà• η2 = 0↔ σ2

B = 0medie di gruppo tutte uguali

• η2 = 1↔ (σ2B = σ2 e σ2

W = 0)medie di gruppo diverse e fortemente rappresentative delle distribuzioni di gruppo,che risultano degeneri in quanto le varianze di gruppo sono tutte pari a 0

10.17Con riferimento all’esempio precedente abbiamo ottenuto

σ2B = 0.3 σ

2W = 1.5 σ

2 = 1.8

quindi

η2 =

0.31.8

= 0.1667

il rapporto di correlazione assume un valore molto basso;non ha, quindi, senso effettuare una segmentazione delle unità statistiche in funzione dellavariabile di raggruppamento che è stata presa in considerazione. 10.18

Un’analisi grafica preliminare è sempre utile al fine di esaminare la possibilità di effet-tuare una segmentazione. Possiamo rappresentare i valori assunti dalle unità statisticheappartenenti ai 3 gruppi

1 2 34 5 4 6 66 7 6 8 8

01

23

45

67

89

10

Gruppo 1 Gruppo 2 Gruppo 3

10.19

Possiamo aggiungere al grafico precedente le medie di gruppo

150

01

23

45

67

89

10


10.20

Dall’analisi del grafico si evince un’elevata dispersione dei valori di alcuni gruppi dallerispettive medie

01

23

45

67

89

10


→ possibile sintomo che le medie non sono rappresentative 10.21

151

Un’efficace analisi grafica può anche essere condotta confrontando i Box & WhiskersPlot delle distribuzioni di gruppo, qui riferiti a esempi diversi da quello precedentementediscusso, con una numerosità adeguata delle unità statistiche.

Esempio 6 (Distribuzione dello stipendio rispetto al genere).

0 1

1020

3040

10.22

Esempio 7 (Distribuzione dello stipendio rispetto al titolo di studio).

1 2 3 4 5

1020

3040

10.23

152

Esempio 8 (Distribuzione dello stipendio rispetto al genere & titolo di studio).

0 1 0 2 0 3 0 4 0 5 1 1 1 2 1 3 1 4 1 5

1020

3040

10.24

2 Esercizi

Esercizio 9 (T 206, 25.09.2003, 1). La qualità dei prodotti di un’azienda produttricedi materiali edili, strutturata su due differenti linee produttive (Li; i = 1,2), è misurataattraverso la resistenza a pressione (Y ) rilevata sui provini prodotti dalle due linee.Nel seguente prospetto sono riportati, per ciascuna delle due linee, la media e il coeffi-ciente di variazione di Y , calcolati su un certo numero di provini:

linea n provini µi CViL1 50 32 0.065L2 100 29 0.073

1. Calcolare media e varianza di Y sul totale dei 150 provini.2. Valutare, tramite un opportuno indice, se possiamo ritenere diversi i livelli medi di

resistenza dei prodotti nelle due linee.10.25

Esercizio 10 (T 258-3, 15.07.2010, 1). Con riferimento a 80 soggetti si riportano le di-stribuzioni del tempo in minuti, Y , dedicato alla visita di una mostra, distinte rispetto allivello di conoscenza artistica (’visitatori esperti’ e ’visitatori occasionali’):


10 a 20 0.4020 a 25 0.20

1.00


10 a 20 0.0820 a 25 0.16

1.00

1. Si rappresentino graficamente le distribuzioni delle frequenze relative per le duetipologie di visitatori e le si confronti mediante opportuni indici di posizione e divariabilità;

2. sapendo che la media di Y , riferita a tutte le 80 unità statistiche, è pari a 11.625 eche il numero di soggetti esperti è pari a 30 si calcoli, applicando il risultato dellascomposizione della varianza, il valore della varianza della variabile Y riferita atutte le 80 unità statistiche. -

10.26

153

3 La diseguaglianza di Tchebychev

Definizione 11 (Diseguaglianza di Tchebychev). Sia X una variabile statistica con mediaµ = M(X) e varianza σ2 =Var(X).Assegnato un qualsiasi valore t > 1 si consideri l’intervallo dei valori di X , centratorispetto alla media µ e di raggio tσ

(µ− tσ ,µ + tσ).

La frequenza relativa, riferita alle unità statistiche che assumono valore al di fuori di taleintervallo, è al più eguale a 1

t2

∑i:|xi−µ|≥tσ

fi ≤1t2 .

10.27Di conseguenza la frequenza relativa, riferita alle unità statistiche che assumono valoreall’interno dell’intervallo, sarà almeno pari a 1− 1

t2

∑i:|xi−µ|≤tσ

fi ≥ 1− 1t2 .

Valori tipicit 1

t2 1− 1t2

2 0.25 0.753 0.1111 0.88894 0.0625 0.93755 0.04 0.96

10.28

154

Esempio 12.

µµ − tσ µ + tσ

• l’area in GRIGIO è al più pari a 1t2

• l’area in BIANCO è almeno pari a 1− 1t2

10.29

Esempio 13.

10 15 20 25

0.00

0.05

0.10

0.15

0.20

0.25

µX = 16.6986 σX = 2.9653 t = 2

• l’area in GRIGIO è al più pari a 122 = 0.25 = 25%

• l’area in BIANCO è almeno pari a 1− 122 = 0.75 = 75%

10.30

155

Esempio 14.

350 400 450

µX = 375.8302 σX = 23.3231 t = 2.5

• l’area in GRIGIO è al più pari a 12.52 = 0.16 = 16%

• l’area in BIANCO è almeno pari a 1− 12.52 = 0.84 = 84%

10.31

Esempio 15.

77.0 77.5 78.0 78.5

µX = 78.0939 σX = 0.3815 t = 2.5

• l’area in GRIGIO è al più pari a 12.52 = 0.16 = 16%

• l’area in BIANCO è almeno pari a 1− 12.52 = 0.84 = 84%

10.32

156

Sezione 11Indici di forma

11.1

Indice

1 Asimmetria 1571.1 Simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1571.2 Asimmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1611.3 Due particolari situazioni di asimmetria . . . . . . . . . . . . . . . . . . 1621.4 Caratterizzazione indici di posizione (1) . . . . . . . . . . . . . . . . . . 1631.5 Caratterizzazione indici di posizione (2) . . . . . . . . . . . . . . . . . . 163

2 Misure di asimmetria 164

3 Considerazioni conclusive sui Box & Whiskers plot 167

4 Curtosi 1684.1 Tipologie curtosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

5 Esercizi 170 11.2

1 Asimmetria

1.1 Simmetria

Definizione 1 (funzione (continua) simmetrica). Una funzione f (x) si definisce simme-trica rispetto a un centro c se ∀k > 0 vale:

f (c− k) = f (c+ k)

c c c+kc−k

11.3

157

Esempio 2. Anche la seguente funzione (continua a intervalli) è simmetrica rispetto alcentro c

c c+kc−k

11.4

Esempio 3. Anche la seguente funzione (di variabile discreta, ovvero definita su uninsieme di valori discreti) è simmetrica rispetto al centro c

c c+kc−k11.5

Definizione 4 (Variabile statistica simmetrica). Una variabile statistica X si definiscesimmetrica rispetto al centro c se:

• per ogni xi = c− k• esiste un valore corrispondente x j = c+ k (simmetrico)

tale chef (xi) = f (x j)

X simmetrica→M(X) = cSi ricorda che la media aritmetica è il baricentro (punto di equilibrio delle frequenze) diogni distribuzione;

158

in presenza di una variabile statistica X con distribuzione simmetrica rispetto a c vale

M(X) = c = baricentro

11.6

X simmetrica→ x0.5 = cOsservando il grafico di una variabile statistica simmetrica

cc

si evince che (almeno) metà delle unità statistiche hanno valore non superiore a c e (al-meno) metà delle unità statistiche hanno valore non inferiore a c; il punto c può, quindi,essere interpretato come la mediana della distribuzione.

11.7

X simmetrica→Moda = cSe la moda esiste, coincide con il centro di simmetria

c c

11.8

X simmetrica→M[(X−µ)2r+1

]= 0, r = 0,1,2, . . .

Esplicitando l’espressione del momento centrale di ordine dispari rispetto alla mediaaritmetica abbiamo

M[(X−µ)2r+1]= k

∑i=1

(xi−µ)2r+1 fi = 0, r = 0,1,2, . . .

cc

Scarti di eguale entità ma con segno opposto sono ponderati con le medesime frequenze,quindi si compensano.Si ricordi per r = 0 l’interpretazione della media aritmetica come baricentro di una distri-buzione di frequenze, M(X−µ) = 0.

11.9

159

x0.5xp x1−p

X simmetrica→ x0.5− xp = x1−p− x0.5, ovvero x0.5 =12 (xp + x1−p) con 0≤ p < 0.5

La frequenza delle unità statistiche con modalità minori o eguali a xp coincide con quelladelle unità statistiche con modalità maggiori o eguali a x1−p.

11.10

Riepilogo

•simmetria → M(X) = x0.5 = c

•M(X) = x0.5

?→ simmetria

Il fatto che la media aritmetica coincida con la mediana è solo un sintomo del fattoche la distribuzione possa essere simmetrica.Si considerino, a titolo di esempio, le seguenti due distribuzioni

xi ni1 8

10 318 9

20

yi ni7 5

15 425 235 545 4

20

Entrambe le distribuzioni non sono simmetriche, ma vale x0.5 = µX = 10 e y0.5 =µY = 25.

•simmetria → M

[(X−µ)2r+1]= 0, r = 0,1,2, . . .

•M[(X−µ)2r+1]= 0, r = 0,1,2, . . . → simmetria

Se tutti i momenti centrali rispetto alla media sono nulli allora la distribuzione èsimmetrica.

– Il momento centrale di ordine 1 rispetto alla media, M(X−µ), è sempre nullo,a prescindere dalla forma della distribuzione.

– Se verifico che il momento centrale di ordine 3 rispetto alla media, M[(X−µ)3

],

è nullo, ho solo un sintomo del fatto che la distribuzione possa essere simme-trica.

•

simmetria→ x0.5− xp = x1−p− x0.5 ovvero x0.5 =12(xp + x1−p),0≤ p < 0.5

11.11

11.12

160

1.2 Asimmetria

Esempio 5. Una funzione non simmetrica si definisce asimmetrica.

11.13

11.14

161

1.3 Due particolari situazioni di asimmetria

Definizione 6 (Asimmetria positiva). Una distribuzione unimodale si definisce asimme-trica positiva quando 1

2 (xp + x1−p)> x0.5 per ogni 0≤ p < 0.5.Una distribuzione asimmetrica positiva è, quindi, caratterizzata da una coda destra piùpesante (lunga) della sinistra (fat/heavy right tail). È anche detta obliqua verso destra.

x0.5xp x1−p

11.15

Definizione 7 (Asimmetria negativa). Una distribuzione unimodale si definisce asimme-trica negativa quando 1

2 (xp + x1−p)< x0.5 per ogni 0≤ p < 0.5.Una distribuzione asimmetrica negativa è, quindi, caratterizzata da una coda sinistra piùpesante (lunga) della destra (fat/heavy left tail). È anche detta obliqua verso sinistra.

x0.5xp x1−p

11.16

162

1.4 Caratterizzazione indici di posizione (1)

Nel caso di una distribuzione asimmetrica positiva vale il seguente ordinamento:

Moda < x0.5 < µ

x0.5Moda µ

11.17

1.5 Caratterizzazione indici di posizione (2)

Nel caso di una distribuzione asimmetrica negativa vale il seguente ordinamento:

µ < x0.5 < Moda

x0.5 Modaµ

11.18

163

2 Misure di asimmetria

Definizione 8 (Indice di asimmetria di Gini - Confronto Normalizzato tra media e media-na).

µ− x0.5

D1(x0.5)=

µ− x0.5

M[|X− x0.5|]• distribuzione asimmetrica positiva → 0 < µ−x0.5

M[|X−x0.5|]≤+1

• distribuzione asimmetrica negativa → −1≤ µ−x0.5M[|X−x0.5|]

< 0

• distribuzione simmetrica → µ−x0.5M[|X−x0.5|]

= 0

(cfr. Frosini 1990 Lezioni di Statistica. Parte prima, Vita e Pensiero, Milano) 11.19

Definizione 9 (Indice di Fisher (skewness)).

γ1 =M[(X−µ)3

]σ3 = M

[(X−µ

σ

)3]

È un indice frequentemente utilizzato in ambito finanziario. Si tratta di un indice relativo.

OsservazioneDalla seconda formulazione dell’indice si evince che γ1 è il momento terzo della variabilestandardizzata. Quindi se Y = a+bX , abbiamo:

γ1(Y ) = γ1(a+bX) = γ1(X).

11.20

OsservazioneL’indice di Fisher è solo sintomo di simmetria/asimmetria !!

• se γ1 > 0→ tendenza alla asimmetria positiva• se γ1 = 0→ tendenza alla simmetria• se γ1 < 0→ tendenza alla asimmetria negativa

È stato mostrato in letteratura, come l’indice γ1 possa assumere valore nullo anche inpresenza di asimmetria positiva o negativa.Gli indici considerati sono solo sintomo di simmetria/asimmetria !!Un valore positivo dell’indice di Gini indica, ad esempio, che la distribuzione è sicu-ramente asimmetrica e che non sarà caratterizzata da asimmetria negativa secondo laDefinizione 7 riportata sopra.

OsservazioneL’indice di Fisher può, inoltre, non rispettare la definizione di ordinamento tra distribu-zioni asimmetriche descritta in Frosini 1990 Lezioni di Statistica. Parte prima, Vita ePensiero, Milano.

11.21

Definizione 10 (Ordinamento tra distribuzioni asimmetriche). Date due distribuzioni X eY entrambe asimmetriche positive (negative), allora Y presenta asimmetria superiore a Xse yp− y0.5 ≥ xp− x0.5 (ovvero yp− y0.5 ≤ xp− x0.5) per ogni 0 < p < 1.

11.22

Esempio 11. Si calcolino le misure di asimmetria µ−x0.5M[|X−x0.5|]

e γ1 con riferimento allaseguente variabile statistica

xi ni Ni1 1 12 2 33 4 74 3 10

10

164

La mediana risulta:x0.5 =

x(5)+ x(6)2

= 3.

11.23

Calcolo dello scostamento assoluto dalla mediana

xi ni |xi− x0.5| |xi− x0.5|ni1 1 2 22 2 1 23 4 0 04 3 1 3

10 7

D1(x0.5) =1n

h

∑i=1|xi− x0.5|ni =

110

7 = 0.7.

11.24

Calcolo di media e varianzaxi ni xini x2

i ni1 1 1 12 2 4 83 4 12 364 3 12 48

10 29 93

M(X) = µ = 2.9M(X2) = 9.3Var(X) = σ2 = M(X2)−µ2 = 9.3−2.92 = 9.3−8.41 = 0.89σ = 0.9434.

Otteniamo, quindiµ− x0.5

M[|X− x0.5|]=

2.9−30.7

=−0.1429.

Sintomo di distribuzione caratterizzata da asimmetria negativa. 11.25

Calcolo di

M[(X−µ)3]= 1

n

k

∑i=1

(xi−µ)3ni

xi ni (xi−µ) (xi−µ)3 (xi−µ)3ni1 1 −1.9 −6.859 −6.8592 2 −0.9 −0.729 −1.4583 4 0.1 0.001 0.0044 3 1.1 1.331 3.993

10 −4.320

M[(X−µ)3]= 1

10(−4.32) =−0.432

γ1 =M[(X−µ)3

]σ3 =

−0.4320.94343 =− 0.432

0.8396=−0.5145

indizio di asimmetria negativa. 11.26

Si può controllare come sia debolmente verificata la condizione sui percentili per unadistribuzione caratterizzata da asimmetria negativa; si confronta in figura l’andamento di12 (xp + x1−p) rispetto a x0.5.

165

0.0 0.1 0.2 0.3 0.4 0.5

01

23

45

x0.5

p11.27

Esempio 12 (Contro-esempio).

classi xi ni0 a 10 5 14

10 a 20 15 920 a 30 25 1230 a 40 35 8

• µ = 18.2558• M

[(X−µ)3

]= 193.4221

• x0.5 = 18.8889, M [|X− x0.5|] = 10.0388• σ = 11.1482• γ1 = 0.1396• µ−x0.5

M[|X−x0.5|]=−0.0631.

11.28Gli indici considerati danno informazioni discordanti. Si può controllare come, nel pre-sente caso, non sia verificata la condizione sui percentili per la definizione di asimmetrianegativa o positiva; si confronta in figura l’andamento di 1

2 (xp + x1−p) rispetto a x0.5.La distribuzione può solo essere qualificata come asimmetrica.

0.0 0.1 0.2 0.3 0.4 0.5

1015

2025

30

x0.5

p

11.29

166

3 Considerazioni conclusive sui Box & Whiskers plot

Si ricorda che possono essere utilizzati per avere una idea sintetica della distribuzionee per effettuare dei confronti. A tal fine occorrerà, quindi, tenere conto delle seguenticaratteristiche, riassunte nel Box & Whisker plot:

• livello medio della distribuzione, descritto da

x0.25, x0.5 e x0.75;

• presenza di valori anomali, che sono posizionati oltre i baffi;• variabilità della distribuzione, descritta da

x0.75− x0.25 e xmax− xmin;

• eventuale asimmetria della distribuzione, confrontando

x0.75− x0.5 e x0.5− x0.25.11.30

Riprendiamo l’Esempio su ’altezza della navata’ e lunghezza totale delle cattedrali inglesi.

g r

1520

2530

Distribuzione 'altezza della navata'

g r

6080

120

160

Distribuzione 'lunghezza totale'

Altezza della navata. Il valore della mediana per le cattedrali con stile gotico è simile aquello delle cattedrali con stile romanico (circa 23 metri). La distribuzione dell’altezzadelle cattedrali con stile romanico è caratterizzata da una minore variabilità, la differenzainterquartile risulta circa pari a 3 metri, mentre per quelle in stile gotico è di circa 8 metri.Entrambe le distribuzioni non sembrano presentare sintomi di asimmetria.

Lunghezza totale. Le cattedrali con stile romanico hanno generalmente una dimensionesuperiore a quelle in stile gotico: almeno il 75% di queste ultime ha una lunghezza infe-riore a 153 metri, valore mediano della lunghezza delle cattedrali in stile romanico. Lalunghezza delle cattedrali con stile gotico è caratterizzata da una maggiore variabilità, ladifferenza interquartile risulta circa pari a 60 metri, mentre per quelle in stile romanicoil valore è di circa 30 metri. La distribuzioni per le cattedrali in stile romanico sembrapresentare una asimmetria negativa; in effetti, anche per la lunghezza delle cattedrali instile gotico abbiamo x0.75− x0.5 < x0.5− x0.25, ma solo per quelle in stile romanico valexmax− x0.5 < x0.5− xmin.

Sono, quindi, confermate le peculiarità dei due stili architettonici. Le cattedrali in stilegotico hanno, generalmente, un aspetto più slanciato rispetto a quelle in stile romani-co. L’elevato livello di variabilità, rilevato per gli edifici in stile gotico, che caratterizzaentrambe le caratteristiche considerate, può essere giustificato dalla presenza, in misu-ra pressoché uniforme, di cattedrali di piccola, media e grande dimensione. Non sonopresenti dati anomali. 11.31

167

Esercizio 13. Si commentino i seguenti Box & Whiskers plot

g r

0.15

0.20

0.25

0.30

Distribuzione rapporto altezza/'lunghezza totale' della navata

Bath

Ripon

che descrivono la distribuzione del rapporto, W , tra l’altezza, Y , e la lunghezza totale,X , delle navate delle cattedrali inglesi in funzione del loro stile architettonico (gotico oromanico)

wi =yi

xi=

altezza della navata della i-esima cattedralelunghezza totale della navata della i-esima cattedrale

, i = 1,2, . . . ,25.

11.32

4 Curtosi

Il concetto trova particolare utilizzo in finanza, ad esempio con riferimento alle serie deiprezzi relativi dei titoli o delle valute.Si confronta la forma della distribuzione con quella del modello Normale, che verràpresentato nella sezione sul calcolo delle Probabilità.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

11.33

168

4.1 Tipologie curtosi

Definizione 14. Distribuzione leptocurtica Una distribuzione si definisce leptocurticaquando presenta, rispetto alla Normale, una frequenza superiore nei valori sulle code enei valori intorno alla media (fat/heavy tails).

−5 0 5

0.0

0.1

0.2

0.3

distribuzione Normale

µ

11.34

Definizione 15. Distribuzione platicurtica Una distribuzione si definisce platicurtica quan-do presenta, rispetto alla Normale, una frequenza superiore nei valori intermedi tra lamedia e le code.

−5 0 5

0.00

0.05

0.10

0.15

0.20

0.25

0.30

distribuzione Normale

µ

11.35

169

Definizione 16 (Indici di curtosi (kurtosis)).

γ2 =M[(X−µ)4

]σ4 = M

[(X−µ

σ

)4]

β2 =M[(X−µ)4

]σ4 −3 = M

[(X−µ

σ

)4]−3

• se la distribuzione è leptocurtica↔ γ2 > 3• se la distribuzione è platicurtica↔ γ2 < 3• se la distribuzione è mesocurtica↔ γ2 = 3

• se la distribuzione è leptocurtica↔ β2 > 0• se la distribuzione è platicurtica↔ β2 < 0• se la distribuzione è mesocurtica↔ β2 = 0

11.36

OsservazioneLa seconda formulazione degli indici fa riferimento al momento quarto della variabilestandardizzata.Quindi, se Y = a+bX , abbiamo

γ2(Y ) = γ2(X) e β2(Y ) = β2(X).

OsservazioneUna distribuzione si definisce mesocurtica se ha lo stesso indice di curtosi della Normaleγ2 = 3 ovvero β2 = 0.

11.37

5 Esercizi

Esercizio 17 (T 206, 25.09.2003, 3). Data la seguente distribuzione di frequenze relativedella variabile statistica X :

xi 10 35 50 A Bfi 0.1 f2 0.3 f4 f5

1. Si determinino i valori di A, B, f2, f4 e f5 in modo che X risulti simmetrica rispettoalla mediana pari a 50.

2. Calcolare il valore dei seguenti momenti centrali: µ5 =M[(X−µ)5

], µ7 =M

[(X−µ)7

]e µ9 = M

[(X−µ)9

].

3. Si calcolino la varianza e l’indice di asimmetria delle variabili statistiche:

Y = X−2 e W = 3X .11.38

Esercizio 18. Sia γ1(X) l’indice di asimmetria di una variabile statistica XSi ricavi l’espressione dell’indice di asimmetria della variabile statistica

Y = a+b ·X

in funzione di γ1(X).11.39

170

Esercizio 19 (T 231, 11.01.2007, 3). Si vuole studiare il numero di prodotti venduti infunzione del loro prezzo Y e del modo X in cui sono stati pubblicizzati (c1 = a mezzo stam-pa o c2 = a mezzo televisione). Nella seguente tabella vengono riportate le distribuzionidi frequenze relative condizionate riguardanti le v.s. Y |X = ci (i = 1,2):

Y |X = ci 0 a 10 10 a 20 20 a 30c1 0.5 0 0.5 1c2 0.1 0.8 0.1 1

1. Sapendo che le frequenze marginali assolute di X sono pari a 150 e 250, si rico-struisca la distribuzione delle frequenze congiunte.

2. Calcolare la moda ed un opportuno indice di mutabilità normalizzato per la v.s. X .3. Dopo aver rappresentato graficamente la distribuzione di frequenza della v.s. Y , se

ne calcoli la mediana, la media, la varianza e l’indice di asimmetria.4. Sia W = 2+ 3Y ; utilizzando le opportune proprietà si calcolino M(W ), Var(W ) e

l’indice di asimmetria di W .11.40

Esercizio 20 (T 250, 04.06.2009, 1). È data la seguente seriazione X :

i hi−1 a hi ni1 10 a 16 102 16 a 30 203 30 a h3 10

1. Si calcoli il valore da attribuire ad h3, sapendo che la densità di frequenza (assoluta)della terza classe risulta pari a 1.31579 e si dia una rappresentazione grafica delladistribuzione X .

2. Si calcolino media aritmetica, varianza e coefficiente di variazione di X .3. Si indichi, almeno approssimativamente, il valore assunto dalla media potenziata di

X di ordine −1000.4. Si indichi, senza effettuare calcoli e giustificando la risposta, se la distribuzione di

X è simmetrica.5. Si calcoli il valore da attribuire ad h3 nell’ipotesi che M(X) = 23. -

11.41

171

Sezione 12Rapporti statistici

12.1

Indice

1 Introduzione 173

2 Rapporti Statistici 175

3 Rapporti di composizione 175

4 Rapporti di densità 176

5 Indici di penetrazione relativi 176

6 Indici inter-popolazione 177

7 Indici inter-temporali 1787.1 Numeri indici a base fissa e a base mobile . . . . . . . . . . . . . . . . . 1787.2 Cambiamento di base (NIBF) . . . . . . . . . . . . . . . . . . . . . . . . 1807.3 Trasformazione NIBF in NIBM . . . . . . . . . . . . . . . . . . . . . . 1807.4 Variazione relativa media . . . . . . . . . . . . . . . . . . . . . . . . . . 1817.5 Passaggio da NIBM a NIBF . . . . . . . . . . . . . . . . . . . . . . . . 1827.6 Indicazioni utili per l’analisi delle serie finanziarie . . . . . . . . . . . . . 1837.7 Numeri Indici composti . . . . . . . . . . . . . . . . . . . . . . . . . . . 1847.8 Numeri Indici dei prezzi . . . . . . . . . . . . . . . . . . . . . . . . . . 1847.9 Numeri Indici di borsa . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

8 Rapporti di durata e ripetizione 187

9 Rapporti statistici tipici delle scienze del turismo 1889.1 Propensione turistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1889.2 Offerta turistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1889.3 Flussi turistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

10 Esercizi 189 12.2

1 Introduzione

Nelle scienze economiche e sociali vengono trattate misure di:

• conteggio (N)• quantità (Q)• prezzo/valore unitario

173

• valore globaledove:

• valore globale = N· prezzo unitario• valore globale = Q· prezzo unitario

In molte circostanze è più opportuno ricorrere a misure relative (ad esempio ’pro-capite’).

Si ricorda come le misure relative possano essere definite solo per caratteri misurati suscala per rapporti.

Consideriamo, quindi, le manifestazioni di una generica grandezza G, definita su scalaper rapporti, riferita alla popolazione P al tempo t:

G(P, t)

12.3

Definizione 1 (Cross section). Le manifestazioni di

G(P, t) = G(P)

per un t prefissato, al variare di P costituiscono una cross section. Si osservano piùpopolazioni nel medesimo riferimento temporale t.

Esempio 2. Il Prodotto Interno Lordo delle nazioni dell’area Euro nel 2013. 12.4

Definizione 3 (Serie storica). Le manifestazioni di

G(P, t) = G(t) = xt

per P prefissato, al variare di t costituiscono una serie storica.

Riferimento temporale• istante t→ serie storica di stock

x0,x1,x2, . . . ,xT

(esempio: prezzo, popolazione residente, . . .)• intervallo (t−1, t]→ serie storica di flusso

x1,x2, . . . ,xT

(esempio: produzione, vendite, nascite, . . .)12.5

Rapporti tra due grandezze(per i confronti)

•R1 =

abitantichilometri quadrati

=Nt

km2

•R2 = consumo per abitante =

Qt

Nt•

R3 = produzione per ettaro =Qt

ha•

R4 = fatturato per addetto =Vt

Nt•

R5 = ROI, Return On Investment =Rt

It... 12.6

174

OsservazioneNei precedenti rapporti R2, R3, R4 e R5:

• a numeratore figura una grandezza di flusso,• mentre a denominatore figura una grandezza di stock;

Occorre prestare particolare attenzione a tali situazioni e domandarsi, in particolare, aquale istante temporale è attribuita la grandezza a denominatore ed, eventualmente, comerenderla il più possibile rappresentativa di tutto l’intervallo temporale a cui è riferito ilnumeratore.

Ad esempio, una vendita di titoli con elevata rischiosità potrebbe avere una forte influenzasulla valutazione ROI. 12.7

2 Rapporti Statistici

Si presentano nel seguito i seguenti rapporti statistici

• rapporti di composizione• rapporti di densità (assoluti)• indici di penetrazione relativi (rapporti di rapporti)• indici inter-popolazione• indici inter-temporali• rapporti di durata (giacenza media di magazzino)• rapporti di ripetizione (rotazione stock)• alcuni rapporti statistici tipici delle scienze del turismo

12.8

3 Rapporti di composizione

Definizione 4. Data una popolazione P, i sottoinsiemi P1,P2, . . . ,Ph, Pi ⊂ P, i = 1,2, . . . ,h,costituiscono una partizione di P se:

1.⋃h

i=1 Pi = P2. Pi∩Pj =∅

12.9

quoziente =PARTETUTTO

175

Definizione 5. Data una popolazione P, una partizione di P e una grandezza G misurata

1. sugli elementi di P2. in uno stesso istante/intervallo temporale t

si definisce rapporto di composizione il rapporto

Ri =G(Pi, t)G(P, t)

quindih

∑i=1

Ri = 1 (oppure 100)

Le frequenze relative fi sono un esempio di rapporti di composizione. 12.10

4 Rapporti di densità

Definizione 6. Data una popolazione P, e due grandezze G, H, con H misura di ’dimen-sione’ di P si definisce rapporto di densità il rapporto

G(P, t)H(P, t)

.

12.11

Esempio 7. Ricettività alberghiera Italia (1998)Alberghi Camere N. medio N. medio

Esercizi N. % N. % camere letti????? 90 0.3% 8390 0.9% 93 177???? 2450 7.2% 175753 18.3% 72 135??? 12401 36.7% 450908 46.9% 36 74?? 10094 29.9% 210893 21.9% 21 39? 8767 25.9% 115001 12.0% 13 24

Tutti 33802 100.0% 960945 100.0% 28 55↑ ↑ ↑ ↑rapporti di composizione rapporti di densità

Fonte: Federalberghi, Primo rapporto sul sistema alberghiero in Italia, 1998

OsservazioneIl numero medio di camere è un rapporto di densità:

G(P, t)H(P, t)

• G(P, t): numero totale di camere della popolazione P (o del sottoinsieme Pi)• H(P, t): numero totale di alberghi della popolazione P (o del sottoinsieme Pi)

12.12

5 Indici di penetrazione relativi

Gli indici di penetrazione relativi vengono calcolati come rapporti fra

• quote di mercato• % di composizione• consumi pro-capite

176

e sono utilizzati per effettuare confronti. Sono grandezze relative a partire dalle quali èpossibile derivare gli scostamenti percentuali da una specifica situazione di riferimento.L’esempio successivo riguarda il confronto tra le propensioni al consumo di una bevandain diverse zone di vendita 12.13

Esempio 8. Consumi giornalieri di birra popolazione 15-65 anni

(a) (b) (c) (d) (e) ( f )popol ·1000 litri ·1000 cc indice

zona n % n % pro-capite penetrazioneNO 10261 26.4 279.1 28.5 27.2 1.08NE 7259 18.7 204.7 20.9 28.2 1.12Centro 7412 19.1 240.1 24.5 32.4 1.28SI 13916 35.8 256.1 26.1 18.4 0.73Italia 38848 100.0 980.0 100.0 25.2 1.00

↑ ↑ ↑

rapporti di composizionerapporti

di densitàFonte: Indagini campionarie INRAN

Osservazioni• (e)Italia e ( f )Italia sono medie ponderate

• (e) = (c)(a) ( f ) = (d)

(b) =(c)

(c)Italia(a)

(a)Italia

=(c)(a)

(c)Italia(a)Italia

= (e)(e)Italia

• nel Centro Italia si registra un consumo pro-capite superiore del 28% rispetto allamedia nazionale (heavy consumers);

• nel Sud Italia e Isole si registra, invece, un consumo pro-capite inferiore del 27%rispetto alla media nazionale (light consumers).

12.14

6 Indici inter-popolazione

Definizione 9. Data una grandezza G espressa su scala per rapporti• riferita a due popolazioni P ed S• rilevata nello stesso (istante/periodo) t

si definisce indice interpopolazione relativo alla popolazione S con riferimento a P

PIS =G(S; t)G(P; t)

(poco usati: non utili per i confronti!!) 12.15

Esempio 10.consumo di vino in Franciaconsumo di vino in Italia

(nell’anno t)Se, ad esempio, nell’anno 2003 fosse risultato

consumo di vino in Franciaconsumo di vino in Italia

=V (F,2003)V (I,2003)

= 1.05

si sarebbe concluso che per ogni litro di vino consumato in Italia si erano consumati 1.05litri di vino in Francia 12.16

Esempio 11.consumo di vino pro/capite in Franciaconsumo di vino pro/capite in Italia

(più informativo)12.17

177

7 Indici inter-temporali

Definizione 12. Con riferimento a una serie storica, relativa a una grandezza G espressasu scala per rapporti, e riferita a un’unica popolazione P, si definisce numero indice altempo t (istante o periodo) con riferimento a t0

t0 It =G(P; t)G(P; t0)

=xt

xt0

(t0 è detto base).

Tipologie• base fissa (t0)

montante unitario (grandezza relativa) rispetto a t0• base mobile (t0 = t−1)

montante unitario (grandezza relativa) rispetto a t−112.18

7.1 Numeri indici a base fissa e a base mobile

Definizione 13 (Numeri indici a base fissa).

G(P; t)G(P; t0)

=xt

xt0= t0 It , (t = 0,1, . . . ,T )

dove t0 è un prefissato istante o periodo di riferimento (si utilizza anche la notazione It, t0 ).

Definizione 14 (Numeri indici a base mobile).

G(P; t)G(P; t−1)

=xt

xt−1= t−1It , (t = 1,2, . . . ,T )

dove t−1 è l’istante o periodo precedente a t (si utilizza anche la notazione It, t−1).12.19

OsservazioneSi possono ottenere le variazioni relative rispetto alla base nel modo seguente:

• base fissaxt − xt0

xt0=

xt

xt0−1, (t = 0,1, . . . ,T )

• base mobilext − xt−1

xt−1=

xt

xt−1−1, (t = 1,2, . . . ,T )

(eventualmente esprimibili anche come percentuale)12.20

Esempio 15. Ricettività alberghiera mondiale

n.camere · 1000 (base 1994 = 100) base mobileanno Europa America NIBF NIBF NIBM NIBM

Europa America Europa America1994 5492 4494 100.00 100.00 − −1995 5653 4540 102.93 101.02 102.93 101.021996 5942 4598 108.19 102.31 105.11 101.281997 6030 4670 109.80 103.92 101.48 101.571998 6130 4700 111.62 104.58 101.66 100.64

Fonte: OMT; Horwath International, Arthur Andersen; 1998, stime

178

Osservazionebase = periodo di stabilità con riferimento alla dinamica della quantità G

12.21

Costruzione dei numeri indici per l’Europa con base fissa riferita all’anno 1994 (t0 =1994)

t0=1994It =G(t)

G(1994)

ad esempio:

t0=1994I1997 =G(1997)G(1994)

=60305492

= 1.0980

ovverox1997 : x1994 = 1994I1997 : 1

Il numero indice per l’anno 1997 riferito all’anno base 1994 risulta pari a 1.0980: lagrandezza relativa è 1.0980.Quindi tra il 1994 e il 1997 si è osservato un incremento complessivo pari al 9.80% =(1.0980−1) ·100%

anno = t xt t0=1994It interpretazione1994 5492 5492

5492 = 11995 5653 t0=1994I1995 =

56535492 = 1.0293 dal 1994 al 1995 +2.93%

1996 5942 t0=1994I1996 =59425492 = 1.0819 dal 1994 al 1996 +8.19%

1997 6030 t0=1994I1997 =60305492 = 1.0980 dal 1994 al 1997 +9.80%

1998 6130 t0=1994I1998 =61305492 = 1.1162 dal 1994 al 1998 +11.62%

12.22

su scala centesimalenumeri indici con base 1994 = 100

numeri indicicon base 1994 = 1

numeri indicicon base 1994 = 100

anno = t xt t0=1994It t0=1994It ·1001994 5492 5492

5492 = 1 1001995 5653 t0=1994I1995 =

56535492 = 1.0293 102.93

1996 5942 t0=1994I1996 =59425492 = 1.0819 108.19

1997 6030 t0=1994I1997 =60305492 = 1.0980 109.80

1998 6130 t0=1994I1998 =61305492 = 1.1162 111.62

12.23

Costruzione dei numeri indici a base mobile (t0 = t−1) per l’Europa

t0=t−1It =G(t)

G(t−1)

ad esempio, da:

1996I1997 =G(1997)G(1996)

=60305942

= 1.0148

si può concludere che tra il 1996 e il 1997 si è registrato un incremento pari a 1.48%.

anno = t xt t−1It t−1It ·100 interpretazione1994 5492 − −1995 5653 1994I1995 =

56535492 = 1.0293 102.93 dal 1994 al 1995 +2.93%

1996 5942 1995I1996 =59425653 = 1.0511 105.11 dal 1995 al 1996 +5.11%

1997 6030 1996I1997 =60305942 = 1.0148 101.48 dal 1996 al 1997 +1.48%

1998 6130 1997I1998 =61306030 = 1.0166 101.66 dal 1997 al 1998 +1.66%

12.24

179

7.2 Cambiamento di base (NIBF)

Cambio di base da t0 a t1

• avendo i dati originari, posso ricalcolare

t1 It =G(t)G(t1)

• partendo, invece, dagli indici con base fissa t0 abbiamo

t1 It =G(t)G(t1)

=G(t)/G(t0)G(t1)/G(t0)

=

G(t)G(t0)G(t1)G(t0)

=t0 Itt0 It1

12.25

Cambiamento di base per i numeri indici Europa con base fissa riferita all’anno 1994(t0 = 1994), nuova base 1995 (t1 = 1995)

anno = t xt t0=1994It t1=1995It1994 5492 1 t1=1995I1994 =

54925653 = 1

1.0293 = 0.97151995 5653 1.0293 t1=1995I1995 =

56535653 = 1.0293

1.0293 = 11996 5942 1.0819 t1=1995I1996 =

59425653 = 1.0819

1.0293 = 1.05111997 6030 1.0980 t1=1995I1997 =

60305653 = 1.0980

1.0293 = 1.06671998 6130 1.1162 t1=1995I1998 =

61305653 = 1.1162

1.0293 = 1.0844

12.26

7.3 Trasformazione NIBF in NIBM

È possibile ottenere la serie dei numeri indici a base mobile anche disponendo solo deinumeri indici con base fissa t0; infatti, a partire dai dati originari abbiamo:

t−1It =G(t)

G(t−1)=

G(t)/G(t0)G(t−1)/G(t0)

=

G(t)G(t0)

G(t−1)G(t0)

=t0 It

t0 It−1

se disponiamo della serie dei numeri indici a base fissa t0(rapporto di NIBF contigui)

anno = t xt t0=1994ItG(t)

G(t−1) = t−1It t−1It =t0 It

t0 It−1

1994 5492 1 − −1995 5653 1.0293 1994I1995 =

56535492 = 1.0293 t0 I1995

t0 I1994= 1.0293

1 = 1.0293

1996 5942 1.0819 1995I1996 =59425653 = 1.0511 t0 I1996

t0 I1995= 1.0819

1.0293 = 1.0511

1997 6030 1.0980 1996I1997 =60305942 = 1.0148 t0 I1997

t0 I1996= 1.0980

1.0819 = 1.0149

1998 6130 1.1162 1997I1998 =61306030 = 1.0166 t0 I1998

t0 I1997= 1.1162

1.0980 = 1.0166

12.27

180

7.4 Variazione relativa media

Si consideri, ad esempio, 1994I1998, numero indice al tempo 1998 con base 1994 (gran-dezza relativa al tempo 1998 rispetto alla base 1994). 1994I1998 può essere espresso infunzione dei numeri indici a base mobile t−1It , t = 1995, . . . ,1998 (grandezze relative altempo t rispetto a t−1)

1994I1998 = 1994I1995 · 1995I1996 · 1996I1997 · 1997I1998

G(1998)G(1994)

=G(1995)G(1994)

· G(1996)G(1995)

· G(1997)G(1996)

· G(1998)G(1997)

Si desidera ottenere la media α dei numeri indici a base mobile (grandezza relativa mediariferita a una unità temporale)In base al criterio di scelta della media secondo Chisini abbiamo

1994I1998 = 1994I1995 · 1995I1996 · 1996I1997 · 1997I1998 = α ·α ·α ·α = α4

Risolvendo rispetto ad α si ottiene

α = 4√

1994I1995 · 1995I1996 · 1996I1997 · 1997I1998.

La grandezza relativa media risulta la media geometrica dei numeri indici a base mobile. 12.28

Osservazione

α = 4

√G(1995)G(1994)

· G(1996)G(1995)

· G(1997)G(1996)

· G(1998)G(1997)

= 4

√G(1998)G(1994)

= 4√

1994I1998

Esempio 16. Con riferimento all’esempio dei numeri indici per l’Europa si ottiene

4√

1994I1998 =4

√61305492

=4√1.1162 = 1.11620.25 = 1.0279

si può, quindi, concludere che tra il 1994 e il 1998 si è registrato un incremento medioannuale (variazione relativa media) del numero delle camere pari al 2.79%.

12.29

Definizione 17 (Grandezza relativa media e variazione relativa media). Si consideri laserie storica delle k+ 1 osservazioni xt , . . . ,xt+k e i corrispondenti numeri indici a basemobile t It+1, . . . , t+k−1It+k; si definisce grandezza relativa media la media geometrica deik numeri indici a base mobile

α = k

√k

∏i=1

t+i−1It+i =k√

t It+1 · . . . · t+k−1It+k =k√

t It+k

corrispondente alla radice di ordine k del numero indice a base fissa t It+k.La variazione relativa media risulta:

α−1

e, in termini percentuali,100 · (α−1)

12.30

181

7.5 Passaggio da NIBM a NIBF

Si ricordi cheG(t)

G(t−1)=

t0 Itt0 It−1

= t−1It (NIBM)

da cuit0 It = t0 It−1 · t−1It

mat0 It−1 = t0 It−2 · t−2It−1

quindit0 It = t0 It−2 · t−2It−1 · t−1It

e, continuando ricorsivamente fino a t0 It0 = 1, si ottiene . . . 12.31

• per t > t0

t0 It = t0 It0+1 · t0+1It0+2 ·prodotto

NIBM fino a · t−3It−2 · t−2It−1 · t−1It

vale a dire

(NIBF) t0 It =t

∏j=t0+1

j−1I j (NIBM)

• per t = t0t0 It0 = 1

• per t < t0, dalla formula per la trasformazione da NIBF in NIBM

t−1It =t0 It

t0 It−1ovvero da t0 It = t0 It−1 · t−1It

ricavo

t0 It−1 =t0 It

t−1Itper cui, noto t0 It , ottengo, a ritroso, gli indici a base fissa da quelli a base mobile

12.32

Costruzione NIBF (t0 = 1994) e (t0 = 1996) per l’Europa a partire dai NIBM

anno = t t−1It 1994It1994 − 11995 1994I1995 = 1.0293 1994I1995 = 1.02931996 1995I1996 = 1.0511 1994I1996 = 1994I1995 · 1995I1996 = 1.0293 ·1.0511 = 1.08191997 1996I1997 = 1.0148 1994I1997 = 1994I1996 · 1996I1997 = 1.0818 ·1.0148 = 1.09791998 1997I1998 = 1.0166 1994I1998 = 1994I1997 · 1997I1998 = 1.0979 ·1.0166 = 1.1161

anno = t t−1It 1996It1994 − 1996I1994 = 1996I1995

1994I1995= 0.9514

1.0293 = 0.92431995 1994I1995 = 1.0293 1996I1995 = 1996I1996

1995I1996= 1

1.0511 = 0.95141996 1995I1996 = 1.0511 11997 1996I1997 = 1.0148 1996I1997 = 1.01481998 1997I1998 = 1.0166 1996I1998 = 1996I1997 · 1997I1998 = 1.0148 ·1.0166 = 1.0316

OsservazioneLe precedenti trasformazioni valgono solo per indici rapporto (grandezze relative).

Nel caso i numeri indici siano espressi in scala centesimale occorre adattare oppor-tunamente le formule precedenti, oppure, più semplicemente, passare ai numeri indicirapporto.

12.33

182

7.6 Indicazioni utili per l’analisi delle serie finanziarie

Sia pt , t = 0,1,2, . . . ,T , la serie storica delle quotazioni di un titolo azionario o dei tassidi cambio tra due valute.Si ricorda come dalla serie dei numeri indici a base mobile

t−1It =pt

pt−1,

prezzi relativi o montanti unitari, sia possibile ricavare i rendimenti (variazioni relative)come (

pt

pt−1−1).

Come si è visto, tra numeri indici a base mobile consecutivi sussiste una relazione di tipomoltiplicativo

pT

p0=

p1

p0· p2

p1· . . . · pT

pT−1;

di conseguenza, al fine di ottenere il prezzo relativo medio si considera, in base al criteriodi scelta della media secondo Chisini, la media geometrica dei prezzi relativi. 12.34

Ricordiamo come, insieme al livello medio, sia importante considerare anche un indica-tore di variabilità.

Definizione 18 (Volatilità finanziaria). Si definisce volatilità finanziaria la variabilità deiprezzi relativi (o, equivalentemente, dei rendimenti).

Per misurare la volatilità dei prezzi relativi non è opportuno utilizzare la varianza, perchéindice di dispersione rispetto alla media aritmetica. 12.35

Si osserva a tale proposito che, per una generica variabile statistica X > 0, vale la se-guente relazione tra la media geometrica µ(0)(X) e la media aritmetica della trasformatalogaritmica M [ln(X)]

µ(0)(X) = expM [ln(X)]

ovveroln(

µ(0)(X)

)= M [ln(X)] .

È allora possibile utilizzare la varianza di ln(X), Var [ln(X)], come misura indiretta dellavolatilità dei prezzi relativi

(X = pt

pt−1

).

Per questo motivo si è soliti considerare, in ambito finanziario, la trasformata logaritmicadella serie dei prezzi relativi

ln( t−1It) = ln(

pt

pt−1

)= ln(pt)− ln(pt−1).

12.36

OsservazioneDa

µ(0) = exp

M[

ln(

pt

pt−1

)]si ottiene il tasso di rendimento medio come

100 ·(

µ(0)−1

)% = 100 ·

(exp

M[

ln(

pt

pt−1

)]−1)

%.

12.37

183

7.7 Numeri Indici composti

I numeri indici che sono stati considerati finora sono detti numeri indici semplici in quantosono riferiti a un’unica serie storica.Spesso si ha a che fare con più serie storiche(ad esempio le serie storiche dei prezzi di un paniere di prodotti o di un portafoglio diazioni).A partire da ciascuna serie storica è possibile ottenere una serie di numeri indici semplici.Un numero indice composto è una sintesi di numeri indici semplici.

Esempio 19. A partire dalle variazioni dei prezzi di più prodotti si desidera ottenere unamisura della variazione del livello generale dei prezzi.Si osserva come la variazione nel livello generale dei prezzi venga, talvolta, utilizzatacome misura dell’inflazione, che però rappresenta la perdita del potere di acquisto.

12.38

7.8 Numeri Indici dei prezzi

• media ponderata dei prezzi relativi degli h prodotti scelti come rappresentativi deiconsumi di una collettività

i pt

i p0

• come coefficienti di ponderazione si possono utilizzare i valori delle merci scam-biate:

– nel periodo 0 (base): iv0 = i p0 · iq0

– nel periodo t (corrente): ivt = i pt · iqt

Si può, quindi, considerare una serie statistica avente una delle seguenti strutture

xi ni...

...i pti p0 iv0 = i p0 · iq0...

...v0

xi ni...

...i pti p0 ivt = i pt · iqt...

...vt

12.39

pane latte burro0 pane p0 latte p0 burro p0t pane pt latte pt burro pt

prezzirelativi

pane ptpane p0

latte ptlatte p0

burro ptburro p0

valori (0) pane p0 · paneq0 latte p0 · latteq0 burro p0 · burroq0valori (t) pane pt · paneqt latte pt · latteqt burro pt · burroqt

Si vuole calcolare una media delle modalità prezzi relativi

xi =i pt

i p0

utilizzando quali coefficienti di ponderazione (frequenze) i valori riferiti all’anno baseoppure all’anno corrente

ni = iv0 = i p0 · iq0 oppure ni = ivt = i pt · iqt

12.40

184

Definizione 20. Si definisce indice dei prezzi di Laspeyres (1884), la media aritmeticadei ’prezzi relativi’ riferiti ai singoli prodotti

xi =i pt

i p0

calcolata utilizzando come frequenze (pesi) i valori scambiati al tempo 0 (base)

ni = iv0 = i p0 · iq0

p0 IL

t =1n

h

∑i=1

xini =1

∑hi=1 i p0 iq0

h

∑i=1

i pt

i p0i p0 iq0 =

∑hi=1 i pt iq0

∑hi=1 i p0 iq0

Si osserva come il valore del paniere dei beni venga aggiornato solo in occasione di uneventuale cambiamento di base. 12.41

Definizione 21. Si definisce indice dei prezzi di Paasche (1874), la media armonica dei’prezzi relativi’ riferiti ai singoli prodotti

xi =i pt

i p0

calcolata utilizzando come frequenze (pesi) i valori scambiati al tempo t (corrente)

ni = ivt = i pt · iqt

p0 IP

t =

1n

h

∑i=1

x−1i ni

−1

=

1

∑hi=1 i pt iqt

h

∑i=1

i p0

i pti pt iqt

−1

=∑

hi=1 i pt iqt

∑hi=1 i p0 iqt

Si osserva come il valore del paniere dei beni debba essere aggiornato a ogni periodo dirilevazione 12.42

Si osserva come, con riferimento ai prodotti usualmente consumati, sussista un legamenegativo tra le variazioni dei prezzi e le variazioni delle quantità (la funzione di domandadei prodotti è convessa).In tali situazioni l’indice dei prezzi di Laspeyres sovrastima la reale variazione dei prezzi,mentre l’indice di Paasche la sottostima.Fisher ha proposto la seguente misura ’ideale’ ottenuta come media geometrica dei pre-cedenti indici.

Definizione 22. Indice dei prezzi di Fisher (1922)

p0 IF

t =√

p0 IL

t ·p0 IP

t

OsservazioneLa procedura per il cambiamento di base si complica nel caso di numeri indici composti.Ad esempio, sul sito dell’Istat sono pubblicati opportuni coefficienti di conversione.

12.43

Esempio 23. Si considerino i dati riferiti a 4 prodotti

i 1 2 3 4p0 10 15 8 14pt 12 20 9 18q0 1000 2000 1500 500qt 800 2100 1200 900

Si calcolino gli indici sintetici dei prezzi di Laspeyres, Paasche e Fisher

185

12.44

Indice dei prezzi di Laspeyresxi = i pt

i p0ni = i p0 · iq0 xini

1210 = 1.2 10 ·1000 = 10000 120002015 = 1.3333 15 ·2000 = 30000 4000098 = 1.125 8 ·1500 = 12000 135001814 = 1.2857 14 ·500 = 7000 9000

59000 74500

p0 IL

t = M(X) =1

5900074500 = 1.2627

la variazione relativa nel livello generale dei prezzi, secondo l’Indice di Laspeyres, è del+26.27%.Si osserva come tale valore sia compreso tra la minima e massima variazione registratanel prezzo dei singoli prodotti [12.50%,33.33%].

12.45

Indice dei prezzi di Paaschexi = i pt

i p0ni = i pt · iqt

nixi

1210 = 1.2 12 ·800 = 9600 80002015 = 1.3333 20 ·2100 = 42000 3150098 = 1.125 9 ·1200 = 10800 96001814 = 1.2857 18 ·900 = 16200 12600

78600 61700

p0 IP

t =[M(X−1)]−1

=1

1n ∑

ki=1

1xi

ni=

11

78600 61700=

7860061700

= 1.2739

Indice dei prezzi di FisherIFisher =

√p0 IL

t ·p0 IP

t =√

1.6086 = 1.2682

OsservazioneLa presente situazione non si riferisce a prodotti di abituale consumo, infatti p

0 ILt assume

valore inferiore a p0 IP

t .12.46

7.9 Numeri Indici di borsa

Si considera un paniere di azioni e si calcola l’evoluzione dei prezzi al termine di ogniminuto di contrattazione.

La struttura dell’indice Mibtel è simile a quella dell’indice di Laspeyres

0It =∑

hi=1

i pti p0 ic i p0 ic iq0

∑hi=1 i p0 ic iq0

=∑

hi=1 i pt iq0

∑hi=1 i p0 ic iq0

dove ic è un fattore correttivo delle quotazioni che tiene conto delle operazioni sul capitalesociale

(ad esempio aumenti di capitale sociale con eventuali opzioni di sottoscrizione da effet-tuare nell’intervallo temporale (0, t)) 12.47

186

8 Rapporti di durata e ripetizione

Sono riferiti a una grandezza caratterizzata da flussi in entrata e in uscita nel corso del tem-po. Per una trattazione più esaustiva si rimanda a Santamaria (2006) Statistica descrittiva.Applicazioni economiche e aziendali, Vita e Pensiero.

Esempio 24. Tipiche grandezze aziendali per le quali vengono tipicamente calcolati irapporti in oggetto sono:

• le giacenze di magazzino: scorte finali = scorte iniziali + acquisti − vendite,• i flussi di cassa: consistenza finale = consistenza iniziale + entrate − uscite,• i conti correnti: saldo finale = saldo iniziale + depositi − prelevamenti,• il turnover del personale: organico finale = organico iniziale + assunzioni/reintegri− pensionamenti/dimissioni/licenziamenti.

12.48Sia ora [0,T ] un intervallo temporale, caratterizzato da una relativa stabilità (stazionarie-tà) delle grandezze oggetto di indagine, e si indichino con G0 e GT l’ammontare delleconsistenze (stock) agli istanti temporali 0 e T e con et , ut le entrate e le uscite (flussi)registrate negli intervalli (t−1, t] con t = 1, . . . ,T .

Definizione 25. I rapporti di durata sono definiti come

d =12 (G0 +GT )

12 ∑

Tt=1(et +ut)

.

12.49

OsservazioneLa grandezza a numeratore fornisce una stima della consistenza media per il periodo [0,T ]e il denominatore una stima della movimentazione media nello stesso periodo. Tenendopresente che Gτ = G0 +∑

τt=1(et −ut) con τ = 1, . . . ,T , è possibile calcolare la seguente

stima più precisa della media delle consistenze

G0 +1

T +1

T

∑t=1

(T − t +1) · (et −ut).

Un valore d del rapporto indica che il periodo di permanenza medio della generica unitàentrata (prodotto acquistato, unità depositata) risulta pari a dT .Ad esempio, con riferimento a una grandezza con rilevazione giornaliera per la qualeT = 30 (1 mese) se d = 0.5 allora la permanenza (durata) media risulta di 15 giorni(15 = 0.5 ·30). 12.50

OsservazioneSi osserva come in presenza di un sistema di contabilità analitica molto dettagliata siapossibile ottenere stime molto più precise della durata (permanenza) media.

Definizione 26. Si definisce rapporto di ripetizione (rep) il reciproco del rapporto didurata d

rep =1d.

Tale rapporto indica il numero medio di volte che la grandezza si è rinnovata nell’inter-vallo [0,T ]. 12.51

187

9 Rapporti statistici tipici delle scienze del turismo

Con riferimento a un assegnato intervallo temporale si considerano degli indicatori idoneia misurare i seguenti aspetti:

• propensione turistica• offerta turistica• flussi turistici

Per una trattazione più dettagliata si veda Pasetti (2002) Statistica del Turismo, Carocci. 12.52

9.1 Propensione turistica

Una misura della propensione della popolazione di una certa area a svolgere viaggi è il

tasso lordo di propensione turistica =n. complessivo viaggi effettuati dai residenti

popolazione residente (media)·100

È possibile determinare la quota della popolazione di una certa area che ha effettuatoalmeno un viaggio nell’intervallo temporale oggetto di analisi.

tasso netto di propensione turistica=n. persone che hanno effettuato almeno un viaggio


Le misure precedenti possono anche essere specificate in funzione:

• della durata del viaggio,• della destinazione,• del tipo di alloggio.

12.53

9.2 Offerta turistica

Una misura della dimensione ricettiva (in termini di posti letto) relativa a una certa areageografica è il

tasso semplice di funzione ricettiva =n. posti letto disponibili


che può anche essere specificato in funzione della tipologia degli esercizi commerciali

• esercizi alberghieri,• esercizi complementari.

La seguente misura tiene conto anche della dimensione della superficie dell’area geogra-fica considerata

tasso composto di funzione ricettiva =n. posti letto disponibili

(popolazione residente (media)) · superficie·100.

12.54

9.3 Flussi turistici

Si premettono le definizioni di arrivo turistico e di presenze turistiche.

Definizione 27. Si definisce arrivo turistico l’ingresso del soggetto nel territorio o luogoconsiderato, indipendentemente dalla durata del soggiorno.

188

Definizione 28. Si definiscono presenze turistiche il numero complessivo di notti trascor-se (bed nights).

12.55È possibile determinare la permanenza media, vale a dire il numero medio di notti tra-scorse come segue

permanenza media =presenze turistiche

arrivi turisticiIn base al criterio di scelta della media secondo Chisini, la permanenza media coincide,quindi, con la media aritmetica della variabile statistica numero di notti trascorse, rilevatain corrispondenza delle unità statistiche arrivate in una certa località. 12.56

Una misura del livello di produttività turistica di una certa regione è il

tasso di funzione turistica =presenze turistiche

(popolazione (media)) ·365·100

I seguenti rapporti statistici danno una misura del livello di utilizzazione di una strutturaricettiva:

indice di utilizzazione lorda =presenze turistiche

(n. letti) ·365·100

indice di utilizzazione netta =presenze turistiche

(n. letti) ·g·100

dove g sono i giorni di apertura della struttura ricettiva.Consideriamo, infine, il tasso di turismo proprio che corrisponde alla quota di pernot-tamenti con motivazione vacanza rispetto al totale dei pernottamenti registrati in unalocalità

tasso di turismo proprio =n. pernottamenti per vacanze

n. pernottamenti totali·100.

12.57

10 Esercizi

Esercizio 29 (T 239, 10.01.2008, 2). Sapendo che per un aggregato macroeconomico ilnumero indice riferito al tempo 2006 con base 2005 è pari a 2005I2006 = 0.95 e che trail 2006 e il 2007 l’aggregato ha subito una variazione percentuale del +5% si determini2005I2007, numero indice riferito all’istante temporale 2007 con base 2005. -

12.58

Esercizio 30 (T 241, 14.02.2008, 2). Sapendo che il valore di un aggregato macroeco-nomico nel 2006 è 80, che il numero indice riferito al tempo 2006 con base 2005 è paria 2005I2006 = 1.2 e che tra il 2006 e il 2007 l’aggregato ha subito una variazione assolutadi −20 si determini 2005I2007, numero indice riferito all’istante temporale 2007 con base2005. -

12.59

Esercizio 31 (T 249, 12.02.2009, 2). Si riporta l’evoluzione temporale dei prezzi e dellequantità scambiate di 2 prodotti a e b, tra il 2000 e il 2002.

a ba pt aqt b pt bqt

2000 330 10 80 102001 345 aq2001 80 bq20012002 390 10 85 10

1. Si calcoli l’indice dei prezzi di Laspeyres al tempo 2002 con base 2000.

189

2. Supponendo che l’indice dei prezzi di Fisher, p2000IF

2001, al tempo 2001 con base2000, sia risultato pari a 1.033, valore inferiore a quello dell’indice di Laspeyres, siindichi l’intervallo dei possibili valori dell’indice di Paasche. -

12.60

Esercizio 32 (T 252, 02.07.2009, 4). Con riferimento alla seguente serie storica si co-struisca la serie dei numeri indici a base mobile e si calcoli 2I4 interpretando il valoreottenuto.

t 1 2 3 4 5Xt 2.3 2.7 2.3 1.8 2.4 −

12.61

Esercizio 33 (T 255, 14.01.2010, 2). Sapendo che per un aggregato macroeconomi-co il numero indice riferito al tempo 2003 con base 2000 è pari a 2000I2003 = 1.49 eche il numero indice riferito al tempo 2003 con base 2002 è pari a 2002I2003 = 1.21 sideterminino:

1. la variazione relativa subita dall’aggregato tra il 2000 e il 2002;2. il tasso medio annuo di variazione tra il 2000 e il 2003. -

12.62

Esercizio 34 (T 257, 11.02.2010, 2). Il consumo pro-capite di gelato in Italia ha presen-tato, negli ultimi 5 anni, le seguenti variazioni % annuali

2004 2005 2006 2007 2008+1.2% +8% +8% +2% −8%

1. Scelto come base il 2003 (= 100) ricostruire la serie dei numeri indici a base fissa.2. Sapendo che nel 2003 si è manifestato un consumo pro-capite di 33kg, indicare il

consumo del 2008.3. Indicare l’aumento % complessivo registratosi tra il 2006 e il 2008. -

12.63

Esercizio 35 (T 265_1, 22.09.2011, 2). Il prospetto seguente riporta la serie dei numeriindice a base mobile per una determinata grandezza macroeconomica X :

t 2002 2003 2004 2005 2006 2007t−1It − 0.8545 0.7173 0.7585 0.9441 0.6775

1. Sapendo che il valore della grandezza X nel 2002 era 77 si ricostruiscano i valoridella serie storica.

2. Si calcoli il tasso medio di variazione della serie tra il 2003 e il 2006.3. Si indichi il valore mediano delle variazioni relative subite dalla grandezza X negli

anni considerati. -12.64

Esercizio 36 (T 264_2, 23.06.2011, 2). È data la serie storica dei numeri indici con basemobile (su scala centesimale) del prezzo di un kg di pane:

anno 2006 2007 2008 2009 2010t−1It − 106 104 102 101

1. Si ricostruisca la serie storica dei prezzi sapendo che nel 2006 il pane costava 0.75euro.

2. Si ricostruisca la serie storica dei numeri indici a base fissa (2006 = 100).3. Si determini il tasso medio di variazione del prezzo del pane tra il 2006 e il 2010.

-12.65

190

Esercizio 37 (T 264_3, 07.07.2011, 2). Si consideri la serie storica dei prezzi del prodottoA nel periodo 2001–2005.

anno 2001 2002 2003 2004 2005pA 20 25 20 30 40

1. Si ricostruisca la serie dei numeri indici a base fissa (2003=100).2. Si calcolino, interpretandone il significato, i seguenti numeri indici: 2002I2001 e

2003I2005. -12.66

Esercizio 38 (T 258-1, 03.06.2010, 2). Sapendo che per un aggregato macroeconomi-co il numero indice riferito al tempo 2003 con base 2000 è pari a 2000I2003 = 1.49 eche il numero indice riferito al tempo 2005 con base 2003 è pari a 2003I2005 = 1.22 sideterminino:

1. il numero indice riferito al tempo 2005 con base 2000;2. il tasso medio di variazione subito dall’aggregato tra il 2000 e il 2005. -

12.67

Esercizio 39 (T 258-3, 15.07.2010, 2). Con riferimento alla seguente serie dei prezzidi un prodotto tra il 1998 il 2002 si costruiscano le serie dei numeri indici a base fissa(2000 = 100) e a base mobile e sulla base di quest’ultima si calcoli il tasso medio divariazione del prezzo di tale prodotto tra il 1999 e il 2001.

t 1998 1999 2000 2001 2002pt 130 135 140 145 150 −

12.68

Esercizio 40 (T 262, 03.02.2011, 2). Con riferimento ai prezzi di un prodotto nel perio-do 2004–2008 sono disponibili alcuni elementi della serie dei numeri indici a base fissa2004 = 100 e della serie dei numeri indici a base fissa 2006 = 100.

Anni NIBF(2004 = 100) NIBF(2006 = 100) NIBM2004 1002005 102.52006 106 1002007 109.18 1032008 109

1. Si ricostruiscano le due serie complete dei NIBF dei prezzi e si costruisca la seriedei NI a base mobile.

2. Si calcoli il tasso d’incremento medio dei prezzi tra il 2004 e il 2007. -12.69

Esercizio 41 (T 263, 17.02.2011, 2). Si consideri la serie dei numeri indici a base mobiledei prezzi del prodotto A nel periodo 2004–2007.

anno 2004 2005 2006 2007NIBMA − 105 105 105

1. Si ricostruisca la serie dei numeri indici a base fissa (2004 = 100).2. Si costruisca la serie dei numeri indici a base mobile per i prezzi del prodotto B,

sapendo che nel periodo considerato i prezzi di B sono costantemente risultati ildoppio dei prezzi di A. -

12.70

191

Esercizio 42 (T 264_1, 09.06.2011, 3). Il seguente prospetto riporta i prezzi e le quantitàscambiate per i prodotti A e B negli anni 1990, 2000 e 2010.

anno A pt Aqt B pt Bqt1990 100 111 200 1012000 150 142 922010 260 123 600 83

1. Si indichi quale valore deve assumere il prezzo del prodotto B nel 2000 affin-ché l’indice dei prezzi di Laspeyres al tempo 2000 con base 1990 risulti pari ap1990IL

2000 = 1.5.2. Si calcoli l’indice dei prezzi di Paasche al tempo 2010 con base 1990, commentando

il risultato ottenuto. -12.71

Esercizio 43 (T 265, 08.09.2011, 2). Il prospetto seguente riporta la produzione di energiaelettrica in TWh per le fonti energetiche rinnovabili nel periodo 2002–2007:

t 2002 2003 2004 2005 2006 2007rinnovabili 49.0 48.0 55.7 49.9 52.2 49.4

1. Si ricostruisca la serie dei numeri indici a base mobile.2. Si calcoli il tasso medio di crescita nel periodo considerato. -

12.72

Esercizio 44 (T 266, 12.01.2012, 3). Si riporta l’evoluzione temporale del prezzo di unprodotto tra il 2001 e il 2005.

t 2001 2002 2003 2004 2005pt 330 342 390 405 420

1. Si costruisca la serie dei numeri indici a base mobile per i prezzi del prodotto.2. Si interpreti il valore assunto dal numero indice 2002I20033. Si calcoli il tasso medio di variazione dei prezzi tra il 2002 e il 2005. -

12.73

Esercizio 45 (T 267, 26.01.2012, 3). Con riferimento alla seguente serie storica Wt

anno 2008 2009 2010 2011Wt 800 850 900 1000

1. Si costruisca la serie dei numeri indici a base fissa, con base 2008 = 100.2. Si interpreti l’ultimo valore della serie sopra calcolata.3. Si costruisca la serie dei numeri indici a base mobile.4. Si calcoli quale dovrebbe essere il valore W2012 in modo che il tasso medio di

crescita nel periodo 2008–2012 risulti pari al 6%. -12.74

Esercizio 46 (T 268, 09.02.2012, 2). Si consideri la seguente serie dei numeri indice abase fissa riguardante l’andamento della serie Zt .

anno 2008 2009 2010 2011NIBF 1 1.1 0.9 1.2

1. Si costruisca la serie dei numeri indici a base mobile.2. Si interpreti l’ultimo valore della serie sopra calcolata.3. Si calcoli il valore Z2011 sapendo che Z2009 = 47. -

12.75

192

Esercizio 47 (T 269_1, 07.06.2012, 2). Si consideri la seguente serie dei numeri indice abase fissa (2008) riguardante l’andamento della serie Zt .

anno 2008 2009 2010 2011NIBF(2008) 1 1.1 0.9 1.2

1. Si costruisca la serie dei numeri indici con base fissa 2010.2. Si interpreti il primo valore della serie sopra calcolata.3. Si calcoli il tasso medio di variazione tra il 2008 e il 2011.4. Si calcoli il valore Z2007 sapendo che Z2008 = 47. -

12.76

Esercizio 48 (T 269_2, 28.06.2012, 2). Si consideri la serie storica delle quotazioni di ungenerico titolo Qt .

anno 1 2 3 4 5Qt 114 86 101 113 86

1. Si costruisca la serie dei numeri indici con base mobile.2. Si calcoli e interpreti il valore del numero indice al tempo 5 con base 1.3. Si calcoli il tasso medio di variazione per l’intero periodo considerato. -

12.77

Esercizio 49 (T 269_3, 12.07.2012, 2). Il prospetto seguente riporta la serie dei numeriindice a base mobile, NIBM, per una determinata grandezza macroeconomica X (seriestorica di flusso)

t 2002 2003 2004 2005 2006 2007t−1It − 0.8545 0.7173 0.7585 0.9441 0.6775

1. Sapendo che il valore della grandezza X nel 2007 era 22.90 si ricostruiscano i valoridella serie storica.

2. Si rappresenti graficamente la serie storica X .3. Si calcoli il tasso medio di variazione della serie tra il 2003 e il 2006.4. Si indichi la peggiore variazione relativa subita dalla grandezza X negli anni consi-

derati. -12.78

Esercizio 50 (T 270, 06.09.2012, 1). Si consideri la variabile Xt = numerosità dellapopolazione italiana, in milioni di unità, misurata tra il 1861 e il 2001.

Anno 1861 1881 1901 1921 1941 1961 1981 2001Xt 22 28 33 39 43 51 56 58

1. Si costruisca la serie dei numeri indici con base mobile.2. Si interpreti il valore dell’ultimo degli indici sopra calcolati.3. Si calcoli il tasso di crescita medio della popolazione italiana tra il 1901 e il 2001.

-12.79

Esercizio 51 (T 270-1, 20.09.2012, 1). Si consideri la variabile Xt = numerosità dellapopolazione italiana, in milioni di unità, misurata tra il 1861 e il 2001.

Anno 1861 1881 1901 1921 1941 1961 1981 2001Xt 22 28 33 39 43 51 56 58

1. Si costruisca la serie dei numeri indici con base fissa 1861.2. Si interpreti il valore del numero indice al tempo 1881 con base 1861.

193

3. Si calcoli il tasso di crescita medio annuo della popolazione italiana tra il 1861 e il1881. -

12.80

Esercizio 52 (T 271, 10.01.2013, 2). Si consideri la seguente serie storica delle venditedi un’azienda tra il 2006 e il 2010.

t 2006 2007 2008 2009 2010xt 205 290 315 340 225

1. Si costruisca la corrispondente serie dei numeri indici a base mobile.2. Si calcoli il tasso medio di variazione tra il 2008 e il 2010, commentando il risultato

ottenuto. -12.81

Esercizio 53 (T 272, 24.01.2013, 2). Della serie storica Xt delle vendite di un’azienda trail 2006 e il 2010 abbiamo le seguenti informazioni:

t NIBM NIBF2006 1002007 1132008 1162009 1062010 131

1. Si riempiano le caselle vuote della tabella e sapendo che x2010=650 si calcoli x2006.2. Si calcoli il tasso medio di variazione tra il 2007 e il 2010, commentando il risultato

ottenuto. -12.82

Esercizio 54 (T 273, 07.02.2013, 2). Dati i seguenti NIBM delle vendite di un’aziendatra il 2001 e il 2005:

t 2001 2002 2003 2004 2005NIBM 0.94 1.12 1.06 1.11

1. Si calcolino i numeri indice a base fissa (base 2001).2. Si calcoli il tasso medio di variazione tra il 2001 e il 2005 esprimendolo in valore

percentuale.3. Per ottenere un tasso medio di variazione tra il 2001 e il 2006 del 7% che valore

dovrebbe avere 2001I2006? -12.83

Esercizio 55 (T 274-1, 06.06.2013, 2). Dati i seguenti NIBF (base 2001) delle vendite diun’azienda tra il 2001 e il 2005:

t 2001 2002 2003 2004 2005NIBF 1.00 0.94 1.12 1.06 1.11

1. Si calcolino i numeri indice a base mobile.2. Si calcoli il tasso medio di variazione tra il 2003 e il 2005 esprimendolo in valore

percentuale.3. Sapendo che tra il 2005 e il 2006 vi è stato un calo delle vendite del 10% si

determinino 2005I2006 e il valore delle vendite nel 2006. -12.84

Esercizio 56 (T 274, 27.06.2013, 2). Si consideri la serie NIBF (base 2006) relativa allaspesa delle Amministrazioni Pubbliche rilevata tra il 2005 e il 2009:

t 2005 2006 2007 2008 2009NIBF 0.9705 1.0000 1.0164 0.7607 1.0951

194

1. Si calcolino i numeri indice a base mobile.2. Si calcoli il tasso medio di variazione tra il 2006 e il 2009 esprimendolo in valore

percentuale.3. Si calcoli il Numero Indice del 2006 con base l’anno 2009 interpretando il valore

ottenuto. -12.85

Esercizio 57 (T 274-2, 11.07.2013, 2). Si consideri la serie NIBM relativa alla spesa delleAmministrazioni Pubbliche rilevata tra il 2005 e il 2009:

t 2005 2006 2007 2008 2009NIBM 1.0304 1.0164 0.7484 1.4397

1. Sapendo che x2009 = 334 si calcoli il valore di x2005. -12.86

Esercizio 58 (T 275, 05.09.2013, 2). Si consideri la seguente serie storica degli indici abase mobile relativa ai costi di un’azienda tra il 2008 e il 2012:

t 2008 2009 2010 2011 2012NIBM 1.20 0.55 0.85 1.05

1. Si costruisca la serie dei numeri indici a base fissa con base 2008.2. Si calcoli l’indice a base fissa: 2010I2012 e si commenti il risultato.3. Si calcoli il tasso medio di variazione tra il 2010 e il 2012 e lo si confronti con

l’indice calcolato al precedente punto. -12.87

Esercizio 59 (T 275-1, 16.09.2013, 2). Si consideri la seguente serie storica dei costi diun’azienda tra il 2008 e il 2012:

t 2008 2009 2010 2011 2012xt 200 240 110 170 210

1. Si costruisca la serie dei numeri indici a base mobile.2. Si calcoli l’indice a base fissa: 2012I2010 e si commenti il risultato.3. Si calcoli il tasso medio di variazione tra il 2009 e il 2012 commentando il risultato

ottenuto.4. Sapendo che 2012I2013 = 1 si calcolino i costi del 2013. -

12.88

Esercizio 60 (T 276, 16.01.2014, 2). Con riferimento alla seguente serie di Numeri Indicea Base Mobile:

t 2008 2009 2010 2011 2012NIBM 0.92 0.95 1.05 1.08

1. Si ricostruisca la serie storica dei dati xt sapendo che x2010 = 90.2. Si calcoli il tasso medio di variazione nel periodo 2008-2012 interpretando il risul-

tato ottenuto.3. Si calcoli il numero indice al tempo 2012 con base 2010 e si commenti il risultato.

-12.89

Esercizio 61 (T 277, 30.01.2014, 2). Il prospetto seguente riporta i prezzi medi annui di2 beni di uso quotidiano nel periodo 2002−2006:

t 2002 2003 2004 2005 2006bene A 99.4 117.3 129.8 149.3 158.1bene B 77.0 65.8 47.2 35.8 33.8

195

1. Costruire la serie dei numeri indici a base fissa con base 2003 per il bene A.2. Calcolare il tasso medio di variazione per il prezzo del bene B tra il 2002 e il 2005,

interpretando il risultato.3. Note le quantità Aq2003 = 1500 e Bq2003 = 8500, calcolare l’indice di Laspeyres dei

prezzi al 2006 con base 2003. -12.90

Esercizio 62 (T 278, 13.02.2014, 2). Della seguente serie storica sono note solo alcuneinformazioni.

t 1 2 3 4 5xt 200 x2 180 x4 160

1. Si ricostruisca la serie storica sapendo che tra il tempo 1 e il tempo 2 vi è stato unincremento di 21 e che tra t = 3 e t = 4 vi è stata una diminuzione del 5%.

2. Si costruiscano le serie dei numeri indici a base fissa, con base t = 1, e a basemobile.

3. Si calcoli il tasso medio di variazione di xt tra l’istante temporale 1 e l’istante 3,interpretando il risultato. -

12.91

Esercizio 63 (T 288, 11.02.2016, 2). La seguente tabella riporta la serie dei NIBF di untitolo azionario quotato sul mercato finanziario:

t 2011 2012 2013 2014 2015NIBF 0.95 1.05 1 0.95 0.9

1. Si identifichi l’anno base e si interpreti il significato del numero indice a base fissariferito al tempo 2015.

2. Calcolare, mostrandone il procedimento, la serie dei NIBM.3. Sapendo che il prezzo nel 2015 era 100, calcolare il prezzo del titolo nel 2011.4. Calcolare il tasso medio di variazione annuo nell’intervallo 2012-2015, commen-

tandone il risultato. -12.92

Esercizio 64 (T 289-1, 09.06.2016, 2). Si consideri il seguente prospetto:

t xt NIBF(2010 = 1) NIBM2008 42009 1002010 1 0.52011 1002012 2

1. Si completi il prospetto con i dati mancanti.2. Si calcoli e si commenti il numero indice 2008I2010. -

12.93

Esercizio 65 (T 290, 08.09.2016, 2). A partire dalla serie storica delle vendite, in n. pezzi,Y (i), i = 1,2, . . . ,5, di un certo prodotto in 5 successivi anni, si è costruita la seguentetabella, dove ∆i = Y (i)−Y (i−1), mentre 1Ii sono i numeri indici con base i = 1:

i 1 2 3 4 5∆i - 697 696 211 6001Ii 1 1.043 1.086 1.099 1.136

1. Fornire il significato di 1I2, numero indice riferito al tempo 2 con base 1.2. Calcolare, mostrandone il procedimento, la serie dei NIBM.3. Calcolare il valore di Y (1).4. Calcolare il tasso medio di variazione annuo tra il secondo (i = 2) e il quinto anno

(i = 5), interpretando il risultato. -12.94

196

Sezione 13Analisi statistica bivariata

13.1

Indice

1 Introduzione 1971.1 Problemi asimmetrici e problemi simmetrici . . . . . . . . . . . . . . . . 197

2 Studio di un caso 1982.1 Distribuzioni marginali . . . . . . . . . . . . . . . . . . . . . . . . . . . 1982.2 Distribuzioni condizionate Y |X . . . . . . . . . . . . . . . . . . . . . . . 1992.3 Distribuzioni condizionate X |Y . . . . . . . . . . . . . . . . . . . . . . . 199

3 Formalizzazione simbolica v.s. doppia 199

4 Indipendenza stocastica 2014.1 Distribuzioni condizionate . . . . . . . . . . . . . . . . . . . . . . . . . 2014.2 Definizione di indipendenza stocastica . . . . . . . . . . . . . . . . . . . 2024.3 Quadro riassuntivo indipendenza stocastica . . . . . . . . . . . . . . . . 202

5 Dipendenza funzionale 203

6 Studio della dipendenza 205 13.2

1 Introduzione

Si considera lo studio congiunto di due caratteri per accertare la presenza di relazioni didipendenza tra di essi.

• ripartizione quote mercato prima e dopo campagna pubblicitaria• studio customer satisfaction: analisi questionari per area geografica• impresa con diverse dipendenze con produzione simile: analisi di produttività

Nell’ambito della statistica inferenziale si studiano dei metodi che consentono l’attribu-zione di una interpretazione probabilistica al valore degli indicatori (cfr. χ2) che attengo-no a una data situazione. 13.3

1.1 Problemi asimmetrici e problemi simmetrici

Definizione 1 (Problema asimmetrico). Un problema ha carattere asimmetrico quandosolo una variabile può essere considerata "dipendente" dall’altra

Y dipende da X oppure X dipende da Y.

Si osserva come vale solo una delle due precedenti proposizioni.

197

Definizione 2 (Problema simmetrico). Un problema ha carattere simmetrico quando ilrapporto di dipendenza è bi-direzionale

X ↔ Y.

In questo caso le due variabili si dicono concomitanti.13.4

2 Studio di un caso

Con riferimento alle variabili X = ’provenienza del cliente’ e Y = ’secondo piatto’ si rilevala distribuzione congiunta dei 250 secondi serviti la scorsa domenica in un ristorante diuna località turistica

X \ Y y1 y2 y3 y4 y5 ni•Europa 30 20 15 15 20 100America 5 40 10 15 30 100

Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

y1 = carne arrostoy2 = carne alla grigliay3 = pesce crudoy4 = pesce alla grigliay5 = selvaggina 13.5

È anche possibile ottenere la variabile statistica doppia con le frequenze congiunte relative

fi j =ni j

n

X \ Y y1 y2 y3 y4 y5 fi•Europa 0.12 0.08 0.06 0.06 0.08 0.40America 0.02 0.16 0.04 0.06 0.12 0.40

Asia 0.02 0.04 0.08 0.04 0.02 0.20f• j 0.16 0.28 0.18 0.16 0.22 1

13.6

2.1 Distribuzioni marginaliX \ Y y1 y2 y3 y4 y5 ni•

Europa 30 20 15 15 20 100America 5 40 10 15 30 100

Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

X ni• fi•Europa 100 0.40America 100 0.40

Asia 50 0.20n 250 1

Y n• j f• jy1 40 0.16y2 70 0.28y3 45 0.18y4 40 0.16y5 55 0.22n 250 1

13.7

198

2.2 Distribuzioni condizionate Y |XX \ Y y1 y2 y3 y4 y5 ni•

Europa 30 20 15 15 20 100America 5 40 10 15 30 100

Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

Y |X=x1 n1 j f .cond.r.= n1 jn1•

y1 30 0.30y2 20 0.20y3 15 0.15y4 15 0.15y5 20 0.20n1• 100 1


y1 5 0.05y2 40 0.40y3 10 0.10y4 15 0.15y5 30 0.30n2• 100 1


y1 5 0.10y2 10 0.20y3 20 0.40y4 10 0.20y5 5 0.10n3• 50 1

13.8

2.3 Distribuzioni condizionate X |YX \ Y y1 y2 y3 y4 y5 ni•

Europa 30 20 15 15 20 100America 5 40 10 15 30 100

Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

X |Y=y1 ni1 f .cond.r.= ni1n•1

Europa 30 0.75America 5 0.125

Asia 5 0.125n•1 40 1



Asia 10 0.14n•2 70 1



Asia 20 0.44n•3 45 1



Asia 10 0.25n•4 40 1



Asia 5 0.09n•5 55 1

13.9

3 Formalizzazione simbolica v.s. doppia

X\Y y1 . . . y j . . . yk ni•x1 n11 . . . n1 j . . . n1k n1•...

......

......

xi ni1 . . . ni j . . . nik ni•...

......

......

xh nh1 . . . nh j . . . nhk nh•n• j n•1 . . . n• j . . . n•k n

199

da questa derivano:

• 2 variabili statistiche marginali• 2 famiglie di variabili statistiche condizionate

Xx1 n1•...

...xi ni•...

...xh nh•

n

Yy1 n•1...

...y j n• j...

...yk n•k

n

X |y jx1 n1 j...

...xi ni j...

...xh nh j

n• j

Y |xiy1 ni1...

...y j ni j...

...yk nik

ni•13.10

in corrispondenzav.s. doppia relativa

fi j =ni j

nv.s. marginali relative

Xxi fi•x1

n1•n = f1•

......

xini•n = fi•

......

xhnh•n = fh•

1

Yy j f• jy1

n•1n = f•1

......

y jn• jn = f• j

......

ykn•kn = f•k

113.11

v.s. condizionate relative

X |y jxi f .cond.rel.x1

n1 jn• j

=f1 jf• j

......

xini jn• j

=fi jf• j

......

xhnh jn• j

=fh jf• j

1

( j = 1,2, . . . ,k)

Y |xiy j f .cond.rel.y1

ni1ni•

= fi1fi•

......

y jni jni•

=fi jfi•

......

yknikni•

= fikfi•

1

(i = 1,2, . . . ,h)

13.12

200

4 Indipendenza stocastica

Si consideri un campione di 100 famiglie, estratte tra quelle che hanno figli adulti, per lequali sono state rilevate le variabili:

X = professione paterna Y = scolarità dei figli

X\Y elementari diploma laurea ni•operaio 3 2 5 10

impiegato 9 6 15 30dirigente 18 12 30 60

n• j 30 20 50 100

distribuzioni marginali

X ni• fi•O 10 0.1I 30 0.3D 60 0.6

100 1

Y n• j f• jE 30 0.3D 20 0.2L 50 0.5

100 113.13

4.1 Distribuzioni condizionateX\Y elementari diploma laurea ni• fi•

operaio 3 2 5 10 0.1impiegato 9 6 15 30 0.3dirigente 18 12 30 60 0.6

n• j 30 20 50 100f• j 0.3 0.2 0.5

Y |x1 n1 j f .cond.r.E 3 0.3D 2 0.2L 5 0.5

n1• 10 1

Y |x2 n2 j f .cond.r.E 9 0.3D 6 0.2L 15 0.5

n2• 30 1

Y |x3 n3 j f .cond.r.E 18 0.3D 12 0.2L 30 0.5

n3• 60 1

X |y1 ni1 f .cond.r.O 3 0.1I 9 0.3D 18 0.6

n•1 30 1

X |y2 ni2 f .cond.r.O 2 0.1I 6 0.3D 12 0.6

n•2 20 1

X |y3 ni3 f .cond.r.O 5 0.1I 15 0.3D 30 0.6

n•3 50 1

Le distribuzioni condizionate relative non dipendono dalla condizione.Le distribuzioni condizionate assolute (righe/colonne) sono proporzionali.I caratteri si dicono statisticamente (stocasticamente) indipendenti 13.14

Con riferimento al precedente esempio le distribuzioni delle frequenze condizionate rela-tive sono fra loro identiche.

Quindi, sulla base dei dati disponibili, anche se questo problema è asimmetrico, possiamoaffermare che:

• non sussiste dipendenza della professione paterna dal livello di scolarità dei figli• non sussiste dipendenza del livello di scolarità dei figli rispetto alla professione

paterna13.15

201

4.2 Definizione di indipendenza stocastica

Definizione 3 (Indipendenza stocastica). Data la v.s. (m.s.) doppia (X ,Y ) le componentiX e Y sono stocasticamente (statisticamente) indipendenti se:

1. tutte le condizionate X |y j ( j = 1,2, . . . ,k) hanno la stessa distribuzione percentuale2. tutte le condizionate Y |xi (i = 1,2, . . . ,h) hanno la stessa distribuzione percentuale3. sono somiglianti alle rispettive marginali

ni j

n• j=

ni•n

= fi•, ∀i ( j = 1, . . . ,k)

ni j

ni•=

n• j

n= f• j, ∀ j (i = 1, . . . ,h)

13.16

4.3 Quadro riassuntivo indipendenza stocastica

X |y jsomigliante a∼ X , ∀ j Y |xi

somigliante a∼ Y, ∀ini j

n• j=

ni•n

←→ ←→ni j

ni•=

n• j

n

l

ni j =ni• ·n• j

n, ∀i, j

(condizione di fattorizzazione)

13.17

Esempio 4. (colore dei capelli)|(zona geografica)

colore Z1 Z2 Z3nero 0.10 0.30 0.70

castano 0.25 0.30 0.20biondo 0.60 0.30 0.05altro 0.05 0.10 0.05

1 1 1

condizionate relative diverse→ non indipendenza

OsservazioneQui le marginali non possono essere ricostruite, perché?

13.18In definitiva i caratteri X e Y sono indipendenti se

ni j =ni• ·n• j

n= ni j, ∀i, j

Si osservi come ni j

n=

ni•n

n• j

n= fi• · f• j

quindi, condizione di indipendenza è anche

fi j =ni•n

n• j

n= fi• · f• j = fi j, ∀i, j

Definizione 5 (Notazione frequenze teoriche indipendenza stocastica).

ni j = frequenze osservateni j = frequenze teoriche nella situazione

di indipendenza stocastica

202

13.19

OsservazioneL’indipendenza stocastica è una condizione simmetrica

(X indip Y ↔ Y indip X)

OsservazioneNella situazione di indipendenza stocastica, le frequenze congiunte ni j non assumononecessariamente valori interi.

13.20

Nel seguito si considereranno solo tabelle ammissibili

Definizione 6 (Tabelle ammissibili).

X\Y y j

xi ni j ni•

n• j n

ni• > 0, ∀in• j > 0, ∀ j

Non figurano righe/colonne con elementi tutti nulli (nessun totale di riga/colonna è nullo).

OsservazioneLa presenza di frequenze congiunte ni j nulle implica la non-indipendenza.

13.21

5 Dipendenza funzionale

A ogni modalità della variabile esplicativa corrisponde una sola modalità della variabiledipendente

Definizione 7 (Dipendenza funzionale di Y da X). Sussiste dipendenza funzionale di Yda X , y = g(x), se le distribuzioni condizionate Y |xi sono degeneri

1. k ≤ h2. a ogni xi corrisponde un solo y j

Esempio 8.X\Y y1 y2 y3

Europa x1 n11 0 0America x2 0 n22 0Asia x3 n31 0 0A f rica x4 0 0 n43

13.22

Definizione 9 (Dipendenza funzionale di X da Y ). Sussiste dipendenza funzionale di Xda Y , x = f (y), se le distribuzioni condizionate X |y j sono degeneri

1. h≤ k2. a ogni y j corrisponde un solo xi

Esempio 10.X\Y y1 y2 y3 y4

Europa x1 n11 0 0 0America x2 0 n22 0 n24Asia x3 0 0 n33 0

203

13.23

Definizione 11 (Dipendenza funzionale biettiva). Sussiste dipendenza funzionale biettivase

1. le distribuzioni Y |xi sono degeneri2. le distribuzioni X |y j sono degeneri

In tale situazione la tabella è quadrata e si ha una frequenza non nulla per riga/colonna.

Esempio 12.X\Y y1 y2 y3

Europa x1 0 n12 0America x2 n21 0 0Asia x3 0 0 n33

13.24

Esempio 13 (Tabelle relative a situazioni di dipendenza funzionale).


Asia 0 0 50 0 0 50n• j 30 70 50 45 55 250

• sussiste dipendenza funzionale di X da Y• ma non sussiste dipendenza funzionale di Y da X

X \ Y y1 y2 y3 ni•Europa 30 0 0 30America 0 70 0 70

Asia 0 0 50 50n• j 30 70 50 150

• sussiste dipendenza funzionale di Y da Xe contemporaneamente

• sussiste dipendenza funzionale di X da Y13.25

Esercizio 14. Determinare le frequenze congiunte ni j in modo da realizzare la situazionedi dipendenza funzionale di Y da X

X \ Y y1 y2 ni•x1 n11 n12 10x2 n21 n22 5x3 n31 n32 15n• j 10 20 30

SoluzioneX \ Y y1 y2 ni•

x1 10 0 10x2 0 5 5x3 0 15 15n• j 10 20 30

a ogni modalità di X deve corrispondere una e una sola modalità della Y13.26

204

Controllo delle distribuzioni condizionateY |X=x1 n1 j f .cond.r.= n1 j

n1•y1 10 1y2 0 0n1• 10 1


y1 0 0y2 5 1n2• 5 1


y1 0 0y2 15 1n3• 15 1

tutte le distribuzioni condizionate Y |xi sono degeneri:sussiste una relazione di dipendenza funzionale di Y (variabile dipendente) rispetto a X(variabile esplicativa)

13.27

6 Studio della dipendenza

attraverso:

• connessioneprincipalmente per caratteri qualitativi

• modelli di regressione(se la variabile dipendente è quantitativa)per descrivere al meglio un carattere in funzione dell’altro

considereremo pertanto:

• indici di connessionedistanza dall’indipendenza stocastica

• indici di dipendenzaaccostamento dei modelli teorici ai dati

13.28

Esercizio 15 (T 182, 18.01.2001, 1). In una località turistica invernale L1 sono presenti30 alberghi.Nel prospetto di sinistra si riporta la distribuzione congiunta del livello di soddisfacimen-to, S, rispetto alla categoria alberghiera, A, espresso da un campione di 200 turisti.Nel prospetto di destra si riportano, in corrispondenza di ciascuna categoria alberghiera,con riferimento al medesimo campione di 200 turisti, le distribuzioni delle frequenze, ri-levate nel 1999, della permanenza media in giorni, G, del soggiorno, condizionate rispettoalla categoria alberghiera, A.

A \ S non sodd. indi f f . sodd.?? 18 6 36??? 12 43 45???? 8 12 20

G|A ?? ??? ????1.5 0.50 0.70 0.603.0 0.30 0.15 0.257.5 0.20 0.15 0.15

1.00 1.00 1.00

1. Si rappresentino graficamente le distribuzioni A|G= 3.0 e A|G= 7.5 e si dica, senzaeffettuare calcoli e motivando la risposta, se sussiste indipendenza stocastica fra Ae G.

2. Si confrontino con opportuni indici di posizione e di variabilità le distribuzioniG|A = ?? e G|A = ???.

13.29

205

Sezione 14Connessione (1)

14.1

Indice

1 La connessione e le sue misure 207

2 Indici di connessione 208

3 Distanze elementari: le contingenze 208

4 Indice χ2 di Pearson 2094.1 L’indice χ2 come funzione delle contingenze relative . . . . . . . . . . . 2104.2 Formula operativa dell’indice χ2 . . . . . . . . . . . . . . . . . . . . . . 2104.3 Normalizzazione dell’indice χ2 . . . . . . . . . . . . . . . . . . . . . . . 210

5 Calcolo indice χ2 2115.1 Calcolo indice χ2 con le contingenze assolute . . . . . . . . . . . . . . . 2115.2 Calcolo indice χ2 con la formula operativa . . . . . . . . . . . . . . . . . 2125.3 Normalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

6 Interpretazione dei rapporti di contingenza 2146.1 Relazione tra distribuzione marginale e distribuzioni condizionate . . . . 215

7 Esercizi 216 14.2

1 La connessione e le sue misure

Definizione 1 (Connessione). Si ha connessione tra due caratteri X e Y se X e Y non sonostocasticamente indipendenti

connessione = non indipendenza stocastica

ovvero la mutabile (variabile) statistica doppia (X ,Y ) è caratterizzata da distribuzionicondizionate non somiglianti

perchédistribuzioni condizionate somiglianti = indipendenza

Y |x1 ∼ Y |x2 ∼ . . .∼ Y |xh ∼ Y

X |y1 ∼ X |y2 ∼ . . .∼ X |yk ∼ X

14.3

207

2 Indici di connessione

Misura della variabilità fra le distribuzioni condizionatema ancheDistanza dalla situazione di indipendenza stocastica

Si confrontano

ni j ni•

n• j ntabella osservata

ni j ni•

n• j ntabella teorica

OsservazioneLa tabella teorica di indipendenza è unica!!Le due tabelle hanno in comune le distribuzioni marginali che consentono di determinarein maniera univoca le frequenze congiunte nella situazione di indipendenza stocastica

ni j =ni•n• j

n

14.4

3 Distanze elementari: le contingenze

Definizione 2 (Contingenze assolute).

ci j = ni j− ni j

proprietàh

∑i=1

ci j = 0,k

∑j=1

ci j = 0,h

∑i=1

k

∑j=1

ci j = 0

Definizione 3 (Rapporti di contingenza).

ni j

ni j

Definizione 4 (Contingenze relative).

ni j− ni j

ni j=

ni j

ni j−1

Se sussiste indipendenza stocastica

ci j = ni j− ni j = 0 eni j

ni j= 1, ∀i, j

per cui le contingenze relative sono nulle. 14.5

208

Esempio 5.X\Y y1 y2 y3x1 3 3 3 9x2 1 2 3 6x3 6 0 9 15

10 5 15 30

ni j

X\Y y1 y2 y3x1 3 1.5 4.5 9x2 2 1 3 6x3 5 2.5 7.5 15

10 5 15 30

ni j

contingenze assolute ci jy1 y2 y3

x1 0 1.5 −1.5 0x2 −1 1 0 0x3 1 −2.5 1.5 0

0 0 0 0

rapporti di contingenzay1 y2 y3

x1 1 2 0.6667x2 0.5 2 1x3 1.2 0 1.2

100(contingenze relative)%y1 y2 y3

x1 0 +100% −33.33%x2 −50% +100% 0x3 +20% −100% +20%

14.6

Esempio 6.3 8 1 124 1 2 77 5 1 13

14 14 4 32

ni j

5.2500 5.2500 1.5000 123.0625 3.0625 0.8750 75.6875 5.6875 1.6250 13

14 14 4 32

ni j

contingenze assolute ci j−2.2500 2.7500 −0.5000 0

0.9375 −2.0625 1.1250 01.3125 −0.6875 −0.6250 0

0 0 0 0

rapporti di contingenza0.5714 1.5238 0.66671.3061 0.3265 2.28571.2308 0.8791 0.6154

100(contingenze relative)%−42.86% +52.38% −33.33%+30.61% −67.35% +128.57%+23.08% −12.09% +38.46%

14.7

4 Indice χ2 di Pearson

Definizione 7.

χ2 =

h

∑i=1

k

∑j=1

c2i j

ni j=

h

∑i=1

k

∑j=1

(ni j− ni j)2

ni j

dove

• ni j sono le frequenze congiunte osservate• ni j sono le frequenze teoriche nella situazione di indipendenza stocastica

14.8

209

4.1 L’indice χ2 come funzione delle contingenze relative

χ2 =

h

∑i=1

k

∑j=1

(ni j− ni j)2

ni j

=h

∑i=1

k

∑j=1

n2i j + n2

i j−2ni jni j

ni j=

h

∑i=1

k

∑j=1

n2

i j

ni j+

n2i j

ni j−

2ni jni j

ni j

=h

∑i=1

k

∑j=1

n2i j

ni j+

h

∑i=1

k

∑j=1

n2i j

ni j−2

h

∑i=1

k

∑j=1

ni jni j

ni j

=h

∑i=1

k

∑j=1

ni jni j

ni j+

h

∑i=1

k

∑j=1

ni j

+n

−2h

∑i=1

k

∑j=1

ni j

−2n

; quindi

χ2 =

h

∑i=1

k

∑j=1

ni jni j

ni j−n = n

h

∑i=1

k

∑j=1

fi jni j

ni j−1

= n

h

∑i=1

k

∑j=1

fi jni j

ni j−

h

∑i=1

k

∑j=1

fi j

= n

h

∑i=1

k

∑j=1

fi j

(ni j

ni j−1)

= n

h

∑i=1

k

∑j=1

fi jni j− ni j

ni j

14.9

4.2 Formula operativa dell’indice χ2

χ2 =

h

∑i=1

k

∑j=1

ni jni j

ni j−n

=h

∑i=1

k

∑j=1

n2i j

ni•n• jn

−n

= nh

∑i=1

k

∑j=1

n2i j

ni•n• j−n

χ2 = n

h

∑i=1

k

∑j=1

n2i j

ni•n• j−1

14.10

4.3 Normalizzazione dell’indice χ2

Se sussiste indipendenza stocastica ni j = ni j e, quindi, χ2 = 0:

χ2min = 0

Si dimostra che nella situazione di dipendenza funzionale χ2 = χ2max:

χ2max = n ·min(h−1,k−1)

dove h e k sono rispettivamente il numero di modalità delle variabili X e Y (numero dirighe e colonne nella tabella a doppia entrata).In conclusione, l’indice normalizzato risulta

χ2N =

χ2−χ2min

χ2max−χ2

min=

χ2

χ2max

=χ2

n ·min(h−1,k−1)

210

14.11

OsservazioneDall’espressione χ2 = n

∑

hi=1 ∑

kj=1 fi j

ni jni j−1

, presente nella penultima riga della slide

14.9, si desume come χ2 possa interpretarsi come

n · media dei rapporti di contingenza−1.

La quantità in parentesi esprime una sintesi dell’eccesso relativo di frequenza presentenella tabella osservata rispetto alla situazione di indipendenza stocastica.

14.12

OsservazioneL’indice χ2

N risulta poco risolvente nelle situazioni vicine all’indipendenza stocastica, eassume valori bassi anche in situazioni che si discostano da tale situazione limite.È quindi preferibile considerare la radice quadrata dell’indice

χN =√

χ2N

che risulta più facilmente interpretabile.L’indice χN è citato in letteratura come statistica V di Cramér e come misura di effect size.

OsservazioneLa formulazione dell’indice χ2 (assoluto) che è stata presentata, è solitamente utilizzatanell’ambito della Statistica inferenziale.

Una trattazione più approfondita dello studio della connessione è presente in Zanella A1992 Lezioni di Statistica. Parte seconda. Strutture dei dati in due o più dimensioni. Laconnessione, Vita e Pensiero. 14.13

5 Calcolo indice χ2

5.1 Calcolo indice χ2 con le contingenze assolute

X\Y y1 y2 y3x1 3 3 3 9x2 1 2 3 6x3 6 0 9 15

10 5 15 30

ni j

X\Y y1 y2 y3x1 3 1.5 4.5 9x2 2 1 3 6x3 5 2.5 7.5 15

10 5 15 30

ni j

y1 y2 y3x1 0 1.5 −1.5 0x2 −1 1 0 0x3 1 −2.5 1.5 0

0 0 0 0

ci j = ni j− ni j

y1 y2 y3x1 0 1.5 0.5 2x2 0.5 1 0 1.5x1 0.2 2.5 0.3 3

(ni j−ni j)2

ni j

χ2 =

h

∑i=1

k

∑j=1

(ni j− ni j)2

ni j= 6.5

211

14.14

5.2 Calcolo indice χ2 con la formula operativa

X\Y y1 y2 y3x1 3 3 3 9x2 1 2 3 6x3 6 0 9 15

10 5 15 30

ni j

y1 y2 y3x1 0.1000 0.2000 0.0667 0.3667x2 0.0167 0.1333 0.1000 0.2500x3 0.2400 0.0000 0.3600 0.6000

n2i j

ni•n• j

χ2 = n

h

∑i=1

k

∑j=1

n2i j

ni•n• j−1

= 30 · (1.2167−1) = 30 ·0.2167 = 6.5

14.15

5.3 Normalizzazione

Abbiamo

χ2N =

χ2

n ·min(h−1,k−1)=

6.530 ·min(3−1,3−1)

=6.5

30 ·min(2,2)=

6.530 ·2

=6.560

= 0.1083

eχN =

√χ2

N =√

0.1083 = 0.3291.

Tra le variabili in gioco sussiste, quindi, un livello basso di connessione. 14.16

Esempio 8. Si riprenda l’analisi del caso con cui si è aperta la Sezione precedente (X =’provenienza’, Y = ’secondo’)


Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

La situazione teorica di indipendenza stocastica ni j =ni• ·n• j

nrisulta


Asia 8 14 9 8 11 50n• j 40 70 45 40 55 250

14.17

Le contingenze assolute ci j = ni j− ni j risultano

X \ Y y1 y2 y3 y4 y5Europa 14 −8 −3 −1 −2America −11 12 −8 −1 8

Asia −3 −4 11 2 −6

212

Le contingenze relative espresse in termini percentuali, 100(

ni j−ni jni j

)%= 100

(ni jni j−1)

%,risultano

X \ Y y1 y2 y3 y4 y5Europa +87.50% −28.57% −16.67% −6.25% −9.09%America −68.75% +42.86% −45.44% −6.25% +36.36%

Asia −37.50% −28.57% +122.22% +25% −54.55%14.18

Utilizzando la definizione dell’indice χ2 si calcolano c2i j = (ni j− ni j)

2

X \ Y y1 y2 y3 y4 y5Europa 196 64 9 1 4America 121 144 64 1 64

Asia 9 16 121 4 36

e(ni j− ni j)

2

ni j

X \ Y y1 y2 y3 y4 y5Europa 12.25 2.2857 0.5 0.0625 0.1818America 7.5625 5.1428 3.5556 0.0625 2.9091

Asia 1.125 1.1429 13.4444 0.5 3.272753.9976

14.19

Utilizzando la formula operativa si calcolanon2

i j

ni•n• j

X \ Y y1 y2 y3 y4 y5Europa 0.225 0.05714286 0.05 0.05625 0.07272727America 0.00625 0.22857143 0.02222222 0.05625 0.16363636

Asia 0.0125 0.02857143 0.17777778 0.05 0.009090911.21599026

χ2 = n

h

∑i=1

k

∑j=1

n2i j

ni•n• j−1

= 250 · (1.21599026−1) = 53.9976

OsservazioneI calcoli precedenti sono stati effettuati utilizzando 8 cifre significative allo scopo diottenere il medesimo risultato finale.

14.20

Normalizzazione

χ2 =

h

∑i=1

k

∑j=1

(ni j− ni j)2

ni j= 53.9976

Con riferimento all’esempio in esame: h = 3,k = 5 :

χ2max = n ·min(h−1,k−1) = 250 ·min(3−1,5−1)

= 250 ·min(2,4) = 250 ·2 = 500

χ2N =

χ2

χ2max

=53.9976

500= 0.108.

eχN =

√χ2

N =√

0.108 = 0.3286.

Tra le variabili in gioco sussiste, quindi, un livello basso di connessione.14.21

213

6 Interpretazione dei rapporti di contingenza

Si riprende l’esempio sulla distribuzione dei 250 ’secondi’ serviti a clienti di diversaorigine geografica.


Asia 5 10 20 10 5 50n• j 40 70 45 40 55 250

X\Y y1 y2 y3 y4 y5x1 16 28 18 16 22x2 16 28 18 16 22x3 8 14 9 8 11

ni j

Si considerino le distribuzioni condizionate

Y |X y1 y2 y3 y4 y5Europa 0.30 0.20 0.15 0.15 0.20 1America 0.05 0.40 0.10 0.15 0.30 1

Asia 0.10 0.20 0.40 0.20 0.10 1f req.marg.rel. 0.16 0.28 0.18 0.16 0.22 1

X |Y y1 y2 y3 y4 y5 f req.marg.rel.Europa 0.750 2/7 15/45 0.375 20/55 0.4America 0.125 4/7 10/45 0.375 30/55 0.4

Asia 0.125 1/7 20/45 0.25 5/55 0.21 1 1 1 1 1

14.22

Rapporti di contingenza:

ni j

ni j=

ni jni•n• j

n

=

ni jni•n• jn

=f (y j|xi)

f (y j)=

ni jn• jni•n

=f (xi|y j)

f (xi)

• Confrontando le frequenze osservate ni j con le frequenze teoriche nella situazionedi indipendenza stocastica ni j abbiamo una misura relativa della frequenza con-giunta osservata rispetto a quella che si avrebbe nella situazione di indipendenzastocastica.Ad esempio n11

n11= 30

16 = 1.875: il consumo di ’carni arrosto’ da parte di clientieuropei è superiore dell’87.5% rispetto a quello che si avrebbe nella situazione diindipendenza stocastica.

14.23

• Se rapportiamo le frequenze condizionate relative f (y j|xi) alle frequenze marginalirelative f (y j) (prima tabella di distribuzioni condizionate) confrontiamo il compor-tamento di Y nella distribuzione condizionata xi rispetto al comportamento ’medio’di Y (cfr. infra).Ad esempio

f (y1|x1)

f (y1)=

0.300.16

= 1.875

nella composizione dei secondi consumati dai clienti europei il consumo di ’carniarrosto’ è superiore dell’87.5% rispetto a quello che si ha nella composizione deisecondi di tutti i clienti (media di riferimento).

14.24

• Se rapportiamo le frequenze condizionate relative f (xi|y j) alle frequenze margi-nali relative f (xi) (seconda tabella di distribuzioni condizionate) confrontiamo ilcomportamento di X nella distribuzione condizionata y j rispetto al comportamento’medio’ di X (cfr. infra).

214

Ad esempiof (x1|y1)

f (x1)=

0.750.4

= 1.875

nella composizione geografica dei clienti che hanno consumato ’carni arrosto’ lafrazione di clienti europei è superiore dell’87.5% rispetto alla composizione geo-grafica di tutti i clienti (media di riferimento).

14.25

6.1 Relazione tra distribuzione marginale e distribuzioni condizio-nate

Le frequenze marginali di Y possono essere ottenute come media ponderata delle frequen-ze condizionate Y |xi.

n• j = n1 j +n2 j + . . .+nk j

n• j = n1 jn1•n1•

+n2 jn2•n2•

+ . . .+nk jnk•nk•

n• j =n1 j

n1•n1•+

n2 j

n2•n2•+ . . .+

nk j

nk•nk•

e dividendo per n abbiamo

n• j

n=

n1 j

n1•

n1•n

+n2 j

n2•

n2•n

+ . . .+nk j

nk•

nk•n

f• j =n1 j

n1•f1•+

n2 j

n2•f2•+ . . .+

nk j

nk•fk•

Ad esempio,

0.16 =1

250(0.30 ·100+0.05 ·100+0.10 ·50)

0.16 = 0.30 ·0.4+0.05 ·0.4+0.10 ·0.2

14.26

Una considerazione analoga vale per le frequenze marginali di X , che possono essereottenute come media ponderata delle frequenze condizionate X |y j.

ni• = ni1 +ni2 + . . .+nih

ni• = ni1n•1n•1

+ni2n•2n•2

+ . . .+nihn•hn•h

ni• =ni1

n•1n•1 +

ni2

n•2n•2 + . . .+

nih

n•hn•h

e dividendo per n abbiamo

ni•n

=ni1

n•1

n•1n

+ni2

n•2

n•2n

+ . . .+nih

n•h

n•hn

fi• =ni1

n•1f•1 +

ni2

n•2f•2 + . . .+

nih

n•hf•h

Ad esempio,

0.4 =1

250

(0.75 ·40+

27·70+

1545·45+0.375 ·40+

2055·55)

0.4 = 0.75 ·0.16+27·0.28+

1545·0.18+0.375 ·0.16+

2055·0.22

14.27

215

7 EserciziEsercizio 9 (T 248, 29.01.2009, 2). Con riferimento a n unità statistiche si sono raccolti alcunidati in una tabella a doppia entrata:Determinare, motivando le risposte, i valori delle frequenze assolute mancanti in modo tale cheχ2 = 0.

X \ Y y1 y2 y3 ni•x1 21 2x2 14n• j 37

X \ Y y1 y2 y3 ni•x1 20 30x2 10 3 15n• j

X \ Y y1 y2 y3 ni•x1x2 21 0 15n• j

-

14.28

Esercizio 10 (T 253, 03.09.2009, 2). Si consideri la seguente tabella delle frequenze congiuntedel carattere quantitativo X e del carattere qualitativo ordinato Y

X \ Y y1 y2 y3 ni•1 2 n12 n13 n1•x2 n21 n22 n23 n2•

n•1 n•2 n•3 14

1. Si completi la tabella (modalità e frequenze) in modo tale che χ2 = χ2max e che per la variabile

Y si verifichi la condizione n•1 = n•3. -14.29

Esercizio 11 (T 250, 04.06.2009, 2). Si completi la seguente tabella in modo che siano soddi-sfatte, se possibile, le condizioni indicate:

X \ Y y1 y2 y3x1 19x2 8x3 3

1. χ2N = 1 e χ2

max = 90

2. χ2N = 0 e χ2

max = 180 -14.30

Esercizio 12. Nei prospetti seguenti sono riassunti tre scenari che descrivono la distribuzione deiclienti presenti su un mercato dove opera l’agenzia A, riclassificati mediante le variabili X , concategorie x1 = ’clienti agenzia A’ e x2 = ’clienti della concorrenza’, e Y = ’tipologia di viaggio’,con categorie y1 = ’low cost’, y2 = ’medium cost’ e y3 = ’high cost’.Si commentino i tre scenari attraverso lo studio delle contingenze assolute e delle contingenze rela-tive e il calcolo di una misura di connessione, tenendo presente che la clientela target dell’agenziaA è del tipo ’high cost’.

X \ Y y1 y2 y3x1 200 500 800x2 5000 2000 1500

X \ Y y1 y2 y3x1 780 375 345x2 4420 2125 1955

X \ Y y1 y2 y3x1 800 500 200x2 1500 2000 5000

- -14.31

216

Sezione 15Connessione (2)

15.1

Indice

1 Analisi grafica: costruzione di un Mosaic Plot 217

2 Student Admissions at UC Berkeley 2202.1 Odds e Odds Ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

3 Analisi di dati multidimensionali: the Titanic data 225

4 Studio della connessione per problemi asimmetrici 226

5 Analisi delle distribuzioni condizionate 227

6 L’indice τ di Goodman-Kruskal 228

7 Esercizi 229 15.2

1 Analisi grafica: costruzione di un Mosaic Plot

X \ Y Economia Giurisprudenza Ingegneriaumanistica 20 40 15 75scienti f ica 35 35 30 100

tecnica 25 15 35 7580 90 80 250

Se si vuole rappresentare la Facoltà scelta, Y , come dipendente dalla tipologia di diplomasuperiore X , occorre considerare

1. la distribuzione delle frequenze marginali relative di X2. le distribuzioni delle frequenze condizionate relative Y |xi, i = 1,2,3

X fi•u 0.30s 0.40t 0.30

1.00

Y |x=un1 jn1•

E 0.2667G 0.5333I 0.2000

1.0000

Y |x=sn2 jn2•

E 0.35G 0.35I 0.30

1.0000

Y |x=tn3 jn3•

E 0.3333G 0.2000I 0.4667

1.000015.3

217

Nei prospetti seguenti si riportano anche le frequenze cumulate Fi, anche se non hannosenso in presenza di caratteri qualitativi sconnessi, solo come ausilio alla costruzione delgrafico.

X fi• (Fi•)u 0.30 0.30s 0.40 0.70t 0.30 1.00

1.00

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 115.4

X fi• (Fi•)u 0.30 0.30s 0.40 0.70t 0.30 1.00

1.00

u

s

t

0.3

0.7

1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 115.5

218

Y |x=un1 jn1•

(f .c.r.cum.

)E 0.27 0.27G 0.53 0.80I 0.20 1.00

1.00

Y |x=sn2 jn2•

(f .c.r.cum.

)E 0.35 0.35G 0.35 0.70I 0.30 1.00

1.00

Y |x=tn3 jn3•

(f .c.r.cum.

)E 0.33 0.33G 0.20 0.53I 0.47 1.00

1.00

u

s

t

0.3

0.7

1E G I

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 115.6

Y |x=un1 jn1•

(f .c.r.cum.

)E 0.27 0.27G 0.53 0.80I 0.20 1.00

1.00

Y |x=sn2 jn2•

(f .c.r.cum.

)E 0.35 0.35G 0.35 0.70I 0.30 1.00

1.00

Y |x=tn3 jn3•

(f .c.r.cum.

)E 0.33 0.33G 0.20 0.53I 0.47 1.00

1.00

u

s

t

E G I

15.7

Esercizio 1. Costruire il mosaic plot per le distribuzioni condizionate X |Yj ’tipologia diprovenienza’ per ciascuna Facoltà.

In questo caso la rappresentazione delle distribuzioni condizionate segue una strutturaverticale e non orizzontale. 15.8

219

2 Student Admissions at UC Berkeley

(from the R help system)

This data set is frequently used for illustrating Simpson’s paradox, see Bickel et al. (1975).At issue is whether the data show evidence of sex bias in admission practices.There were 2691 male applicants, of whom 1198 (44.5%) were admitted, compared with1835 female applicants of whom 557 (30.4%) were admitted.This gives a sample odds ratio of 1.84, indicating that males were almost twice as likelyto be admitted.In fact, graphical methods or log-linear modelling show that the apparent associationbetween admission and sex stems from differences in the tendency of males and femalesto apply to the individual departments (females used to apply more to departments withhigher rejection rates).See the home page of Michael Friendly (http://www.math.yorku.ca/SCS/friendly.html)for further information.Bickel, P. J., Hammel, E. A., and O’Connell, J. W. (1975) Sex bias in graduate admissions:Data from Berkeley. Science, 187, 398-403. 15.9

Distribuzione congiunta:Admitted Rejected

Male 1198 1493Female 557 1278

Distribuzioni marginali:freq

Male 2691Female 1835

freqAdmitted 1755Rejected 2771

Distribuzione congiunta (frequenze relative fi j):Admitted Rejected

Male 0.2647 0.3299Female 0.1231 0.2824

Distribuzioni marginali (frequenze relative fi•, f• j):freq

Male 0.5946Female 0.4054

freqAdmitted 0.3878Rejected 0.6122

15.10

2.1 Odds e Odds Ratio

Definizione 2 (Odds). Con riferimento a una variabile statistica Y dicotomica, (con duesole modalità y1 e y2) si definisce odds il rapporto tra le frequenze (relative) assunte da y1e y2.Esempio 3. Considerando i risultati del test di ammissione abbiamo 1198

1493 =1198

1198+14931493

1198+1493=

0.44520.5548 = 0.8025 per i maschi e 557

1278 =557

557+12781278

557+1278= 0.3035

0.6965 = 0.4358 per le femmine.15.11

Definizione 4 (Odds ratio). Con riferimento a una variabile statistica doppia (X ,Y ) conY dicotomica si definisce odds ratio il rapporto tra due odds definiti sulle distribuzionicondizionate Y |X .Esempio 5. Considerando i risultati dei test di ammissione abbiamo( 0.4452

0.5548

)( 0.30350.6965

) = 0.80250.4358

= 1.8414,

vale a dire l’odds per i maschi è superiore dell’84% all’odds per le femmine.Gli odds e gli odds ratio trovano frequente impiego nel calcolo delle probabilità. 15.12

220

Distribuzioni condizionate

Admit|Gender:Admitted Rejected

Male 0.4452 0.5548Female 0.3035 0.6965

Gender|Admit:Male Female

Admitted 0.6826 0.3174Rejected 0.5388 0.4612

Admit

Mal

eF

emal

e

Admitted Rejected

Admit

Admitted Rejected

Mal

eF

emal

e

15.13

Distribuzioni (congiunte) di Gender e Admit, condizionatamente ai diversi livellidella variabile Dept

Department AAdmitted Rejected

Male 512 313Female 89 19

Department BAdmitted Rejected


Department CAdmitted Rejected

Male 120 205Female 202 391

Department DAdmitted Rejected

Male 138 279Female 131 244

Department EAdmitted Rejected


Department FAdmitted Rejected


15.14Dalle precedenti tabelle è possibile ricavare le informazioni relative:

• al diverso grado di selettività esercitato dai 6 dipartimenti,• alla preferenza nella scelta del dipartimento.

OsservazioneI gruppi (Dept) non sono omogenei.

15.15

221

Grado di selettività


freq 0.6442 0.3558


freq 0.6325 0.3675


freq 0.3508 0.6492


freq 0.3396 0.6604


freq 0.2517 0.7483


freq 0.0644 0.9356

I dipartimenti sono già ordinati rispetto alla rigidità nella selezione 15.16

Scelta dipartimento

Department AMale Female

freq 0.8842 0.1158

Department BMale Female

freq 0.9573 0.0427

Department CMale Female

freq 0.3540 0.6460

Department DMale Female

freq 0.5265 0.4735

Department EMale Female

freq 0.3271 0.6729

Department FMale Female

freq 0.5224 0.4776

La preferenza data dalle femmine ai diversi dipartimenti è secondo l’ordine

E C F D A B15.17

222

Distribuzioni condizionate di Admit|Gender per i diversi dipartimenti



Admitted RejectedMale 0.6206 0.3794

Female 0.8241 0.1759

odds odds ratio1.6358 0.34924.6842




Female 0.6800 0.3200

odds odds ratio1.7053 0.80252.1250


Male 120 205Female 202 391


Female 0.3406 0.6594

odds odds ratio0.5854 1.13310.5166


Male 138 279Female 131 244


Female 0.3493 0.6507

odds odds ratio0.4946 0.92130.5369




Female 0.2392 0.7608

odds odds ratio0.3841 1.22160.3144




Female 0.0704 0.9296

odds odds ratio0.0627 0.82790.0757

15.18

Department A

Admit

Sex M

ale

Fem

ale

Admitted Rejected

Department B

Admit

Sex

Mal

eF

emal

e

Admitted Rejected

Department C

Admit

Sex

Mal

eF

emal

e

Admitted Rejected

Department D

Admit

Sex

Mal

eF

emal

e

Admitted Rejected

Department E

Admit

Sex

Mal

eF

emal

e

Admitted Rejected

Department F

Admit

Sex

Mal

eF

emal

e

Admitted Rejected

Student admissions at UC Berkeley

15.19

223

Distribuzioni condizionate di Gender|Admit per i diversi dipartimenti



Male FemaleAdmitted 0.8519 0.1481Rejected 0.9428 0.0572





Male 120 205Female 202 391



Male 138 279Female 131 244








15.20

Department A

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Department B

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Department C

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Department D

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Department E

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Department F

Admit

Sex

Admitted Rejected

Mal

eF

emal

e

Student admissions at UC Berkeley

15.21

Osservazioni• Solo nei dipartimenti C ed E si ha una percentuale di successo per le femmine

lievemente inferiore rispetto a quella ottenuta dai maschi.• In tali dipartimenti si osserva anche che la quota di femmine tra gli ammessi risulta

inferiore alla quota di femmine tra coloro che non sono stati ammessi.• L’elevato numero di femmine che hanno fatto domanda in tali dipartimenti, unita-

mente al basso numero di domande presentate nei dipartimenti a bassa selettività,ha una grande influenza nella determinazione della percentuale di successo a li-vello ’marginale’, dando l’impressione di una discriminazione nei confronti dellecandidature delle femmine. 15.22

224

3 Analisi di dati multidimensionali: the Titanic data

(from the R help system)The sinking of the Titanic is a famous event. Many well-known facts – from the propor-tions of first-class passengers to the ’women and children first’ policy, and the fact thatthat policy was not entirely successful in saving the women and children in the third class– are reflected in the survival rates for various classes of passenger.The dataset Titanic consists of a 4-dimensional array resulting from cross-tabulating2201 observations on 4 variables. The variables and their levels are as follows:

No Name Levels1 Class 1st, 2nd, 3rd, Crew2 Sex Male, Female3 Age Child, Adult4 Survived No, Yes

These data were originally collected by the British Board of Trade in their investigationof the sinking.Note that there is not complete agreement among primary sources as to the exact numberson board, rescued, or lost.

> mosaicplot(Titanic) 15.23

Titanic

Class

Sex

1st 2nd 3rd Crew

Mal

eF

emal

e

Child Adult

No

Yes

No

Yes

Child Adult Child Adult Child Adult

15.24

225

4 Studio della connessione per problemi asimmetrici

Si consideri la seguente tabella a doppia entrata che riassume la distribuzione delle varia-bili X , provenienza scolastica, e Y , Facoltà scelta.

ECONOMIA LETTEREumanistica 9 36scientifica 30 30

commerciale 41 4

È ragionevole1 ritenere che la scelta della Facoltà Y possa logicamente dipendere dallatipologia di formazione superiore conseguita X .L’indice χ2, che, si ricorda, ha carattere simmetrico, risulta 46.1607, con valore norma-lizzato χ2

N = 0.3077, confermando la presenza di connessione tra le variabili in gioco.15.25

Una prima analisi delle distribuzioni condizionate, definite secondo la natura asimmetricadel problema, può essere svolta tramite l’esame del mosaic plot.

commerciale scientifica umanistica

EC

ON

OM

IALE

TT

ER

E

15.26

1Nella presente sezione si assume che X ’variabile sulle righe della tabella’ possa interpretarsi come variabile’indipendente’ o esplicativa, mentre Y ’variabile sulle colonne della tabella’ come variabile ’dipendente’, valgacioè la seguente relazione di causalità

X → Y

226

5 Analisi delle distribuzioni condizionate

Studio delle distribuzioni condizionate Y |X . Si riportano le frequenze condizionaterelative Y |xi, i = 1,2,3.

ECONOMIA LETTEREumanistica 0.2000 0.8000scientifica 0.5000 0.5000

commerciale 0.9111 0.0889

Con riferimento ai 150 casi considerati:

• gli studenti provenienti da una scuola umanistica prediligono la Facoltà di Lettere;• quelli provenienti da un istituto commerciale la Facoltà di Economia;• gli studenti con maturità scientifica sono, invece, equidistribuiti tra le due Facoltà.

La situazione è evidente se si considerano i valori della Moda per le distribuzioni condi-zionate. 15.27

Per ’avvalorare’ il valore della Moda si può calcolare una misura di eterogeneità.Si osserva come anche l’indice di Gini non normalizzato, G, consenta di effettuare unconfronto tra i livelli di eterogeneità delle distribuzioni condizionate, essendo questecaratterizzate tutte dallo stesso numero di categorie.Con riferimento alla marginale Y : G(Y ) = 0.4978:

G(Y ) = 1−k

∑j=1

f 2• j G(Y |xi) = 1−

k

∑j=1

(ni j

ni•

)2

, i = 1, . . . ,h

xi Moda(Y |xi) G(Y |xi)umanistica LETTERE 0.32scientifica @ 0.5

commerciale ECONOMIA 0.16215.28

Lo studio delle cosiddette ’differenze di eterogeneità’

G(Y )−G(Y |xi), i = 1, . . . ,h,

consente di stabilire per quali livelli della variabile X si ha una propensione della variabileY a concentrarsi su ’poche’ categorie, o addirittura su un valore modale, dando in questocaso un contributo significativo alla connessione

xi Moda(Y |xi) G(Y |xi) G(Y )−G(Y |xi)umanistica LETTERE 0.32 0.4978−0.32 = 0.1778scientifica @ 0.5 0.4978−0.5 =−0.0022

commerciale ECONOMIA 0.162 0.4978−0.162 = 0.3358

Per Y |x1 e per Y |x3 abbiamo G(Y )−G(Y |xi)> 0. 15.29

227

6 L’indice τ di Goodman-Kruskal

L’indice di Goodman-Kruskal consiste in una sintesi (media aritmetica) delle differenzedi eterogeneità, che vengono ponderate con le frequenze della variabile condizionante X :

GK(Y |X) = τY |X =MX G(Y )−G(Y |X)

G(Y )

Si osserva che l’indice è già normalizzato.

xi G(Y )−G(Y |xi) n(xi) mod × frequmanistica 0.1778 45 8scientifica −0.0022 60 −0.1333

commerciale 0.3358 45 15.1111150 22.9778

GK(Y |X) = τY |X =22.9778

1500.4978

= 0.3077.

15.30

OsservazioneSe la variabile ’dipendente’, Y , è caratterizzata da due sole categorie l’indice χ2

N e l’in-dice di Goodman-Kruskal, GK(Y |X), forniscono lo stesso valore (normalmente ciò nonavviene).

OsservazioneCome osservato per l’indice χ2, anche l’espressione dell’indice di Goodman-Kruskal,GK(Y |X), presentata sopra, trova utilizzo nell’ambito della Statistica inferenziale; volen-do utilizzare l’indice ai fini descrittivi è preferibile considerare la radice quadrata dellostesso, che risulta meglio interpretabile come indice normalizzato.Con riferimento all’esempio precedente abbiamo√

GK(Y |X) = 0.5547.

che indica un livello medio di connessione della scelta della Facoltà rispetto alla prove-nienza scolastica.

Solo per esercizio:

GK(X |Y ) = 0.1402 e√

GK(X |Y ) = 0.3744

questo risultato ha la sola valenza numerica e nessun senso logico in quanto basatosull’assunzione che sia la tipologia di diploma a dipendere dalla scelta della Facoltà. 15.31

228

7 Esercizi

Esercizio 6. Nella seguente tabella è riportata la distribuzione delle frequenze congiuntedelle variabili X = ’Tipologia diploma scuola superiore’ e Y = ’Facoltà universitaria’rilevate in corrispondenza di un campione di 250 matricole di università milanesi.

X \ Y Economia Giurisprudenza Ingegneriaumanistica 20 40 15 75scienti f ica 35 35 30 100tecnica 25 15 35 75

80 90 80 250

1. È possibile ritenere che la scelta della facoltà dipende dal tipo di diploma?2. Sotto quali condizioni tale conclusione è estensibile a tutta la popolazione delle

matricole universitarie di Milano?15.32

Esercizio 7 (T 182, 18.01.2001, 1). In una località turistica invernale L1 sono presenti 30alberghi.Nel prospetto di sinistra si riporta la distribuzione congiunta del livello di soddisfacimen-to, S, rispetto alla categoria alberghiera, A, espresso da un campione di 200 turisti.Nel prospetto di destra si riportano, in corrispondenza di ciascuna categoria alberghiera,con riferimento al medesimo campione di 200 turisti, le distribuzioni delle frequenze, ri-levate nel 1999, della permanenza media in giorni, G, del soggiorno, condizionate rispettoalla categoria alberghiera, A.

A \ S non sodd. indi f f . sodd.?? 18 6 36??? 12 43 45???? 8 12 20

G|A ?? ??? ????1.5 0.50 0.70 0.603.0 0.30 0.15 0.257.5 0.20 0.15 0.15

1.00 1.00 1.00

1. Si rappresentino graficamente le distribuzioni A|G= 3.0 e A|G= 7.5 e si dica, senzaeffettuare calcoli e motivando la risposta, se sussiste indipendenza stocastica fra Ae G.

2. Si confrontino con opportuni indici di posizione e di variabilità le distribuzioniG|A = ?? e G|A = ???.

3. Si calcoli una misura della connessione tra il livello di soddisfazione e la categoriaalberghiera (S|A).

15.33

Esercizio 8 (T 239, 10.01.2008, 3). Completare la tabella, esplicitando anche i valoripossibili per x2 e y2, in modo tale che l’indice χ2 normalizzato sia pari a zero:

X \ Y 1 y2 = 35

x2 = 2−

15.34

Esercizio 9 (T 240, 31.01.2008, 2,3). Completare la tabella (inserendo frequenze con-giunte e marginali) in modo che:

a) χ2 = 21;b) ci sia dipendenza funzionale di Y da X .

X \ Y y1 y2 y3x1 14x2

21

−

229

15.35

Esercizio 10 (T 248, 29.01.2009, 2). Con riferimento a n unità statistiche si sono raccoltialcuni dati in una tabella a doppia entrata:Determinare, motivando le risposte, i valori delle frequenze assolute mancanti in modotale che χ2 = 0.

X \ Y y1 y2 y3 ni•x1 29 10x2 6n• j 45

X \ Y y1 y2 y3 ni•x1 20 30x2 10 11 15n• j

X \ Y y1 y2 y3 ni•x1x2 29 0 15n• j

-

15.36

230

Sezione 16Studio della dipendenza se lavariabile dipendente è di tipoquantitativo

16.1

Indice

1 Introduzione 231

2 Studio di un caso 232

3 Collegamento tra scomposizione della varianza e analisi bivariata 232

4 Calcolo del rapporto di correlazione η2Y |X 234

5 Considerazioni di riepilogo 235

6 Raccordo notazione 235

7 Analisi del Rapporto di Correlazione 236

8 Relazione tra indipendenza stocastica e indipendenza in media 238

9 Esercizi 240 16.2

1 Introduzione

Nella presente sezione si descrive come analizzare il comportamento congiunto di duevariabili in relazione a un problema di tipo asimmetrico con:

• X carattere qualitativo o quantitativo (variabile esplicativa)• Y carattere quantitativo (variabile dipendente)

Si vuole studiare Y in funzione di X .Si ricorda come lo studio della dipendenza passi sempre attraverso lo studio delle di-stribuzioni condizionate Y |X .Dal momento che la variabile dipendente (variabile risposta/outcome) Y è di tipo quanti-tativo, è possibile riassumere le distribuzioni condizionate mediante appropriati indici diposizione.Utilizzeremo le medie delle distribuzioni condizionate M(Y |xi). La scelta della mediacome indice sintetico verrà giustificata nelle sezioni successive, quando verrà presentatoil criterio dei minimi quadrati. 16.3

231

2 Studio di un caso

Un albergatore è interessato a stabilire se il livello Y dei consumi per food & beveragedipende dal motivo (X) della trasferta dei clienti: per turismo (T ) o per lavoro (L).A tal fine effettua, presso un campione di 10 soggetti, una rilevazione dei caratteri X e Yottenendo le seguenti informazioni

X YT 23.1T 43.1L 21.5L 7T 21.8T 34.6L 26.6T 30.2L 18L 10.5

16.4

3 Collegamento tra scomposizione della varianza e ana-lisi bivariata

Sebbene risulti più semplice analizzare i dati in questione considerando la struttura pergruppi1

Turismo Lavoro

23.1 43.1 21.8

34.6 30.2

21.5 7 26.6

18 10.5

riclassifichiamo i dati in una tabella a doppia entrata SOLO per mostrare come la variabiledi raggruppamento possa essere interpretata come variabile esplicativa o condizionante.

X \ Y 7 10.5 18 21.5 21.8 23.1 26.6 30.2 34.6 43.1 ni•T 0 0 0 0 1 1 0 1 1 1 5L 1 1 1 1 0 0 1 0 0 0 5

n• j 1 1 1 1 1 1 1 1 1 1 10

Y |Xi 7 10.5 18 21.5 21.8 23.1 26.6 30.2 34.6 43.1T 0 0 0 0 0.2 0.2 0 0.2 0.2 0.2 1L 0.2 0.2 0.2 0.2 0 0 0.2 0 0 0 1

16.5

Si ricorda come sia possibile studiare il comportamento congiunto a partire da un’analisigrafica che rappresenti le coppie di valori e le medie di gruppo (medie condizionate)Possiamo rappresentare i valori assunti dalle unità statistiche appartenenti alle 2 categorie

1cfr. calcolo delle medie potenziate in corrispondenza di valori singoli e il risultato di scomposizione dellavarianza

232

0

10

20

30

40

50

Turismo Lavoro

Y |X = turismo Y |X = lavoroM(Y |X = turismo) = 30.56 M(Y |X = lavoro) = 16.72

Var(Y |X = turismo) = 61.2184 Var(Y |X = lavoro) = 51.053616.6

Infatti:

•

M(Y |X = turismo) =15(23.1+43.1+21.8+34.6+30.2) =

15

152.8 = 30.56

Var(Y |X = turismo) =15(23.12 +43.12 +21.82 +34.62 +30.22)−30.562 =

=15

4975.66−933.9136 = 995.132−933.9136 = 61.2184

•

M(Y |X = lavoro) =15(21.5+7+26.6+18+10.5) =

15

83.6 = 16.72

Var(Y |X = lavoro) =15(21.52 +72 +26.62 +182 +10.52)−16.722 =

=15

1653.06−279.5584 = 330.612−279.5584 = 51.0536

16.7Stiamo quindi interpretando i dati mediante la funzione medie condizionate.

Dal momento che le medie condizionate sono fra loro diverse è possibile concludereche sussiste una forte dipendenza della variabile Y dalla variabile X = motivazione delsoggiorno?

Per rispondere al quesito occorre considerare il risultato di scomposizione della varianzae calcolare il rapporto di correlazione η2

Y |X .

NotazioneNel presente contesto (analisi bivariata) la varianza Between e la varianza Within sonoanche denominate varianza spiegata e varianza residua.

16.8

233

4 Calcolo del rapporto di correlazione η2Y |X

In primo luogo calcoliamo media e varianza della variabile statistica medie condizionateM(Y |X)

xi M(Y |xi) niT 30.56 5L 16.72 5

le cui modalità sono le medie condizionate (medie di gruppo), con frequenze le numero-sità delle categorie della variabile condizionante (numerosità di gruppo)

M(Y |xi) ni M(Y |xi) ·ni M(Y |xi)2 ·ni30.56 5 152.8 4669.56816.72 5 83.6 1397.792

10 236.4 6067.36

MXM(Y |X)= 1n

h

∑i=1

modalità · frequenze =110

236.4 = 23.64 = M(Y )

VarXM(Y |X)= σ2B =

varianzaspiegata =

momentosecondo −media2 =

=1

106067.36−23.642 = 606.736−558.8496 = 47.8864

16.9

È possibile ricostruire la variabile statistica varianze condizionate Var(Y |X)

xi Var(Y |xi) niT 61.2184 5L 51.0536 5

10

le cui modalità sono le varianze condizionate (varianze di gruppo), con associate co-me frequenze le numerosità delle categorie della variabile condizionante (numerosità digruppo).La media di tale variabile statistica risulta

Var(Y |xi) ni Var(Y |xi)ni61.2184 5 306.09251.0536 5 255.268

10 561.36

MXVar(Y |X)= σ2W =

varianzaresidua =

1n

h

∑i=1

modalità · frequenze =

=110

561.36 = 56.136

16.10

La varianza della variabile statistica marginale Y (varianza generale calcolata su tutte leunità statistiche) può essere ottenuta come

σ2Y = varianza spiegata + varianza residua = σ

2B +σ

2W

= 47.8864+56.136 = 104.0224

234

Si può, infatti, verificare che

Var(Y ) =1

10(23.12 +43.12 +21.52 +72 +21.82 +34.62 +26.62 +30.22 +182 +10.52)−23.642

=1

10(6628.72)−558.8496 = 662.872−558.8496 = 104.0224

Abbiamo, quindi

VarXM(Y |X)= σ2B = 47.8864

MXVar(Y |X)= σ2W = 56.136

e σ2 = 104.0224

quindi

η2 =

47.8864104.0224

= 0.4603.

Il rapporto di correlazione assume un valore moderato.Non sussiste, quindi, un forte livello di dipendenza tra la spesa per food & beverage e lamotivazione del soggiorno. 16.11

5 Considerazioni di riepilogo

Considerazioni di riepilogo

• È possibile concludere che sussiste una certa dipendenza della variabile Y = spesaper food & beverage dalla variabile X = motivazione del viaggio in quanto le mediecondizionate sono fra loro diverse (Varianza delle medie condizionate)

• Tale considerazione non garantisce un livello elevato di dipendenza in quanto lemedie condizionate devono essere ’rappresentative’ delle rispettive distribuzionicondizionate

• Si deve, quindi, anche considerare la variabilità delle rispettive distribuzioni condi-zionate

• Affinché le medie condizionate siano rappresentative è necessario che le varianzecondizionate assumano valore piccolo (Media delle varianze condizionate)

16.12

6 Raccordo notazione

Proprietà Associativa della media aritmetica

media generale = media delle medie di gruppoM(Y ) = MXM(Y |X)

Scomposizione varianzaσ2

B = varianza spiegata = VarXM(Y |X)+ + +

σ2W = varianza residua = MXVar(Y |X)= = =

σ2(globale) = varianza dipendente = Var(Y )

16.13

235

7 Analisi del Rapporto di Correlazione

Osservazione• medie condizionate tra loro molto diverse → varianza spiegata ↑• varianze condizionate piccole → varianza residua ↓

Precedentemente si era utilizzato il Rapporto di Correlazione per stabilire se è opportunoeffettuare una segmentazione delle unità statistiche; l’indice consente di sintetizzare ledue considerazioni riportate nella precedente Osservazione.


η2Y |X =

var.spiegataVar(Y )

=VarXM(Y |X)

Var(Y )

= 1− var.residuaVar(Y )

= 1− MXVar(Y |X)Var(Y )

16.14

Interpretazione• è interpretabile anche come rapporto di composizione in quanto

var. spiegata + var. residua = var. totale dipendente

0≤ η2 ≤ 1

• quota di variabilità spiegata dalla funzione medie condizionate

Si analizzano ora le situazioni a cui corrispondono i valori estremi di η2 16.15

η2Y |X = 0

η2Y |X =

VarXM(Y |X)Var(Y )

quindiη

2Y |X = 0 ↔ VarXM(Y |X)= 0

la variabile statistica ’medie condizionate’ M(Y |X) ha varianza nulla (è degenere)

M(Y |x1) = M(Y |x2) = . . .= M(Y |xh) = M(Y )

situazione di indipendenza in media

x1 x2 ... xh

y

16.16

η2Y |X = 1

η2Y |X = 1− MXVar(Y |X)

Var(Y )

quindiη

2Y |X = 1 ↔ MXVar(Y |X)= 0

236

la variabile statistica ’varianze condizionate’ Var(Y |X) ha media nullama

Var(Y |x1)≥ 0,Var(Y |x2)≥ 0, . . . ,Var(Y |xh)≥ 0

quindiMXVar(Y |X)= 0↔Var(Y |x1) = . . .=Var(Y |xh) = 0

le distribuzioni condizionate Y |xi sono degeneri, situazione di dipendenza funzionale.

x1 x2 ... xh

y

16.17

OsservazioneIn tutte le precedenti considerazioni la variabile X ha svolto il ruolo di carattere condi-zionante, come mera variabile di raggruppamento; potrebbe, quindi, essere di entrambi itipi

• qualitativo(genere, regione geografica, tipo di cliente, classe di età o di reddito)

• quantitativo(numero componenti famiglia, età)

In entrambi i casi, da un punto di vista operativo, non dovrebbe essere caratterizzata daun numero troppo elevato di categorie/modalità(eventuale ricodifica in un numero ridotto di categorie/classi).

16.18

Esercizio 2. Con riferimento a 20 unità statistiche sono state rilevate le variabili X1, X2,Y , Z e W .

i x1i x2i yi zi wi1 1 1 38 36 32.752 1 1 39 38 34.753 1 2 40 40 36.24 1 2 41 42 38.25 1 3 42 44 406 2 2 47 49 50.27 2 3 43 41 428 2 4 46 47 48.49 2 4 44 43 44.410 3 3 42 42 4011 3 4 41 40 38.412 3 4 43 44 42.413 4 1 47 48 50.7514 4 1 49 52 54.7515 4 3 49 52 5416 4 2 43 40 42.217 4 2 48 50 52.218 4 3 43 40 4219 4 3 45 44 4620 4 4 44 42 44.4

237

Si vuole studiare la dipendenza:

A di Y in funzione di X1 C di Y in funzione di X2

B di Z in funzione di X1 D di W in funzione di X216.19

medie condizionate diverse - bassa variabilità distribuzioni condizionate medie condizionate simili - bassa variabilità distribuzioni condizionate

X1 X1 X1 X1 X2 X2 X2 X2X1 1 2 3 4 X2 1 2 3 4M(Y|X1) 40 45 42 46 M(Y|X2) 43.3 43.8 44 43.6Var(Y|X1) 2 2.5 0.6667 5.75 Var(Y|X2) 23.1875 10.16 6 2.64n(Y|X1) 5 4 3 8 n(Y|X2) 4 5 6 5

medie condizionate diverse - elevata variabilità distribuzioni condizionate medie condizionate simili - elevata variabilità distribuzioni condizionate

X1 X1 X1 X1 X2 X2 X2 X2X1 1 2 3 4 X2 1 2 3 4M(Z|X1) 40 45 42 46 M(W|X2) 43.3 43.8 44 43.6Var(Z|X1) 8 10 2.6667 23 Var(W|X2) 92.75 40.64 24 10.56n(Z|X1) 5 4 3 8 n(W|X2) 4 5 6 5

M(Y)=MX1[M(Y|X1)] 43.7 M(Y)=MX2[M(Y|X2)] 43.7MX1[M(Y2|X1)] 1916 MX2[M(Y2|X2)] 1909.763

varianza spiegata VarX1[M(Y|X1)] 6.31 VarX2[M(Y|X2)] 0.0725 varianza spiegatavarianza residua MX1[Var(Y|X1)] 3.4 MX2[Var(Y|X2)] 9.6375 varianza residua

Var(Y)=var.spieg.+var.res. 9.71 Var(Y)=var.spieg.+var.res. 9.71rapporto di correlazione 0.649846 rapporto di correlazione 0.007467

M(Z)=MX1[M(Z|X1)] 43.7 M(W)=MX2[M(W|X2)] 43.7MX1[M(Z2|X1)] 1916 MX2[M(W2|X2)] 1909.763

varianza spiegata VarX1[M(Z|X1)] 6.31 VarX2[M(W|X2)] 0.0725 varianza spiegatavarianza residua MX1[Var(Z|X1)] 13.6 MX2[Var(W|X2)] 38.55 varianza residua

Var(Z)=var.spieg.+var.res. 19.91 Var(W)=var.spieg.+var.res. 38.6225rapporto di correlazione 0.316926 rapporto di correlazione 0.001877

A

B

C

D

A

B

C

D

30

35

40

45

50

55

60

0 1 2 3 4 530

35

40

45

50

55

60

0 1 2 3 4 5

30

35

40

45

50

55

60

0 1 2 3 4 530

35

40

45

50

55

60

0 1 2 3 4 5

A 1a situazione di riferimento C 2a situazione di riferimento(medie condizionate diverse e rappresentative) (medie condizionate simili e poco rappresentative)

B aumento variabilità distribuzioni condizionate D aumento variabilità distribuzioni condizionate

16.20

8 Relazione tra indipendenza stocastica e indipenden-za in media

indipendenza stocastica

Y |xi ∼ Y ↔ X |y j ∼ X

↓ ↑\/ ↓ ↑\/

M(Y |xi) = M(Y ) M(X |y j) = M(X)i = 1,2, . . . ,h j = 1,2, . . . ,k

l lη2

Y |X = 0 η2X |Y = 0

indipendenza in media

Nella parte in basso a destra della precedente relazione si è assunto che anche X sia ditipo quantitativo.

238

Osservazioneη2

Y |X e η2X |Y possono anche essere molto differenti

16.21Indipendenza in media (reciproca) ma non indipendenza stocastica

X \ Y y2−b y2 y2 +bx2− c 0 20 0

x2 10 30 10x2 + c 0 20 0

abbiamo

x

y

y

x

µY (x1) = µY (x2) = µY (x3) = y2 e µX (y1) = µX (y2) = µX (y3) = x2

η2Y |X = 0 η2

X |Y = 0

16.22

Indipendenza in media in una direzione (di X da Y ) e non indipendenza in media nell’altra

X \ Y y1 y2 y3x2− c 0 20 10

x2 10 30 0x2 + c 0 20 10

abbiamo

x

y

y

x

µY (x1) = µY (x3)> µY (x2) e µX (y1) = µX (y2) = µX (y3) = x2

η2Y |X > 0 η2

X |Y = 0

16.23

239

9 Esercizi

Esercizio 3. Si completino, se possibile, le seguenti tabelle a doppia entrata con leopportune frequenze congiunte relative in modo tale che:

a) le variabili X e Y siano stocasticamente indipendentiX \ Y y1 y2 y3

x1 0.4x2 0.6

0.2 0.6 0.2 1

b) sussista dipendenza funzionale di Y da XX \ Y y1 y2 y3

x1 0.4x2 0.6

0.2 0.6 0.2 1

c) sussista dipendenza funzionale di X da YX \ Y y1 y2 y3

x1 0.4x2 0.6

0.2 0.6 0.2 116.24

Esercizio 4 (continuazione). Si completino, se possibile, le seguenti tabelle a doppiaentrata con le opportune frequenze congiunte relative in modo tale che:

d) sussistano contemporaneamente:dipendenza funzionale di X da Yindipendenza in media di Y da X

X \ Y y1 y2 y3x1 0.4x2 0.6

0.2 0.6 0.2 1

e) si realizzino contemporaneamente le seguenti condizioni: indipendenza in media di Y da Xnon ci sia dipendenza funzionale di X da YX e Y non siano stocasticamente indipendenti

X \ Y y1 y2 y3x1 0.4x2 0.6

0.2 0.6 0.2 116.25

Esercizio 5 (T 256, 28.01.2010, 5). Si indichi, senza effettuare calcoli e motivando lerisposte, il valore (o l’intervallo di valori) assunto dagli indici η2

Y |X , η2X |Y e χ2

N .X \ Y 1 2 34 9 0 06 0 8 6

- I

16.26

240

Video0002.3gp

Esercizio 6 (T 250, 04.06.2009, 2). Si completi la seguente tabella in modo che sianosoddisfatte, se possibile, le condizioni indicate:

X \ Y y1 y2 y3x1 19x2 8x3 3

1. η2X |Y = 0 e η2

Y |X 6= 0 -

16.27

Esercizio 7 (T 264-3, 07.07.2011, 4). Si completi se possibile la seguente tabella, ripor-tando modalità e frequenze e motivando teoricamente la risposta, in modo tale che:

X \ Y 1 2 32 2 55 2 0 28

1. η2Y |X < η2

X |Y < 12. η2

Y |X = η2X |Y -

16.28

Esercizio 8 (T 267, 26.01.2012, 5). Se possibile e giustificando teoricamente le risposte,si completi la seguente tabella in modo da soddisfare le condizioni sotto indicate.

X \ Y 10 305 1 610 5

1. η2X |Y = 1, η2

Y |X = 02. η2

X |Y = 0, χ2 = 03. η2

X |Y = 1, η2Y |X = 1 -

16.29

Esercizio 9 (T 253, 03.09.2009, 2). Si consideri la seguente tabella delle frequenzecongiunte del carattere quantitativo X e del carattere qualitativo ordinato Y

X \ Y y1 y2 y3 ni•1 2 n12 n13 n1•x2 n21 n22 n23 n2•

n•1 n•2 n•3 14

1. Si completi la tabella (modalità e frequenze) in modo che contemporaneamente cisia indipendenza in media di X da Y e la moda di Y sia y2.-

16.30

Esercizio 10 (T 269-2, 28.06.2012, 4). Dati due caratteri Z e W , indicare che valoreassume l’indice η2

Z|W nelle seguenti ipotesi:

1. l’indice di connessione χ2 assume valore zero;2. la media delle varianze condizionate è pari a 3 volte la varianza delle medie condi-

zionate;3. la distribuzione delle medie condizionate e delle varianze condizionate è la seguente

w1 w2 w3M(Z|W ) 2 4 6

σ2Z|W 7 7 7

frequenze marginali di W 20 10 20

-

241

16.31

Esercizio 11 (T 270-1, 20.09.2012, 4). Se possibile e giustificando teoricamente le rispo-ste, si completi la seguente tabella in modo da soddisfare le condizioni sotto indicate.

X \ Y 3 92 2

26

1. η2Y |X = η2

X |Y -

16.32

242

Sezione 17Studio della dipendenza seentrambe le variabili sono di tipoquantitativo (1)

17.1

Indice

1 Introduzione 243

2 Funzioni delle componenti di una variabile statistica doppia 243

3 Media di una funzione di una variabile statistica doppia 244

4 La Covarianza 246

5 Interpretazione della Covarianza 246

6 Media di una combinazione lineare 252

7 Varianza di una combinazione lineare 253

8 Covarianza tra trasformazioni lineari 254 17.2

1 Introduzione

Si premettono alcuni complementi sulla variabile statistica doppia

• funzioni delle componenti di una variabile statistica doppia• media di una funzione delle componenti di una variabile statistica doppia• covarianza• media di una combinazione lineare delle componenti di una variabile statistica

doppia• varianza di una combinazione lineare delle componenti di una variabile statistica

doppia• covarianza tra trasformazioni lineari

17.3

2 Funzioni delle componenti di una variabile statisticadoppia

W = f (X ,Y ) = X +Y

243

• reddito coniugi→ reddito famigliare• peso veicolo + peso carico = peso lordo

X \ Y y1 = 5 y2 = 15 y3 = 25 ni•x1 = 15 3 9 18 30x2 = 25 2 6 12 20x3 = 35 5 15 30 50

n• j 10 30 60 100

wk nk20 330 2+940 5+6+1850 15+1260 30

100

f−1(30) = (25,5),(15,15)

nk = ∑(xi,y j):xi+y j=wk

ni j = ∑(xi,y j): f (xi,y j)=wk

ni j = ∑(xi,y j)= f−1(wk)

ni j

17.4

3 Media di una funzione di una variabile statistica dop-pia

Definizione 1 (Media di una funzione di una variabile statistica doppia). L’operatoremedia aritmetica assume la seguente struttura

•

M(W ) = M f (X ,Y )= 1n

h

∑i=1

k

∑j=1

f (xi,y j)ni j

in presenza di una variabile statistica doppia (tabella a doppia entrata)•

M(W ) = M f (X ,Y )= 1n

n

∑i=1

f (xi,yi)

quando si considerano le coppie di valori(ciascuna coppia figura una sola volta)

17.5

Esempio 2 (W = X +Y , tabella doppia). Riprendendo l’esempio iniziale, possiamo cal-colare la media sulla variabile W (dopo averla ricostruita)

wk nk wknk20 3 6030 11 33040 29 116050 27 135060 30 1800

100 4700

M(W ) =1n

k

∑i=1

wknk = 47

oppure applicare la formula dell’operatore media alla serie statistica doppia (X ,Y )

(xi + y j)ni j y1 = 5 y2 = 15 y3 = 25x1 = 15 (15+5) ·3 = 60 (15+15) ·9 = 270 (15+25) ·18 = 720x2 = 25 (25+5) ·2 = 60 (25+15) ·6 = 240 (25+25) ·12 = 600x3 = 35 (35+5) ·5 = 200 (35+15) ·15 = 750 (35+25) ·30 = 1800

4700

244

M(X +Y ) =1n

h

∑i=1

k

∑j=1

(xi + y j)ni j =1

1004700 = 47 = M(X)+M(Y ) = 27+20

17.6

Esempio 3 (W = X +Y , coppie valori). Si considerino le seguenti coppie di informazionirelative alle variabili X e Y

xi 3 2 1 4 2yi 6 4 4 6 5

l’applicazione della formula dell’operatore media consiste nel calcolare la media dellavariabile somma

xi yi wi = xi + yi3 6 92 4 61 4 54 6 102 5 7

∑ 12 25 37M = ∑/n 2.4 5 7.4

M(X) M(Y ) M(X +Y )

Oppure, ricordando che l’operatore media è lineare

M(X +Y ) = 7.4 = M(X)+M(Y ) = 2.4+517.7

Esempio 4 (W = X ·Y , tabella doppia). Riprendendo l’esempio iniziale, possiamo calco-lare la media sulla variabile W (dopo averla ricostruita)

wk nk wknk75 3 225125 2 250175 5 875225 9 2025375 6+18 = 24 9000525 15 7875625 12 7500875 30 26250

100 54000

M(W ) =1n

k

∑i=1

wknk = 540

oppure possiamo applicare direttamente la formula dell’operatore media alla serie stati-stica doppia (X ,Y )

xiy jni j y1 = 5 y2 = 15 y3 = 25x1 = 15 15 ·5 ·3 = 225 15 ·15 ·9 = 2025 15 ·25 ·18 = 6750x2 = 25 25 ·5 ·2 = 250 25 ·15 ·6 = 2250 25 ·25 ·12 = 7500x3 = 35 35 ·5 ·5 = 875 35 ·15 ·15 = 7875 35 ·25 ·30 = 26250

54000

M(X ·Y ) = 1n

h

∑i=1

k

∑j=1

(xi · y j)ni j =1

10054000 = 540

17.8

Esempio 5 (W = X ·Y , coppie valori). Si considerino le seguenti coppie di informazionirelative alle variabili X e Y

xi 3 2 1 4 2yi 6 4 4 6 5

245

xi yi xiyi3 6 182 4 81 4 44 6 242 5 10

∑ 12 25 64M = ∑/n 2.4 5 12.8

M(X) M(Y ) M(XY )

Si osserva comeM(XY ) = 12.8 6= M(X)M(Y ) = 2.4 ·5 = 12

17.9

4 La Covarianza

Definizione 6 (Covarianza).

Cov(X ,Y ) = M[(X−µX )(Y −µY )] = σXY

conµX = M(X) µY = M(Y )

Applicando la proprietà dell’operatore media aritmetica come operatore lineare

Cov(X ,Y ) = M[(X−µX )(Y −µY )] =

= M(XY −XµY −µXY +µX µY ) =

= M(XY )−M(XµY )−M(µXY )+M(µX µY ) =

= M(XY )−µY M(X)−µX M(Y )+µX µY =

= M(XY )−µX µY −µX µY +µX µY =

= M(XY )−µX µY

si ottiene la seguente formula operativa

Cov(X ,Y ) = M(XY )−M(X)M(Y )

17.10

Con riferimento ai due esempi precedenti:

• tabella a doppia entrata

Cov(X ,Y ) = M(XY )−µX µY = 540−27 ·20 = 540−540 = 0

• coppie valori

Cov(X ,Y ) = M(XY )−µX µY = 12.8−2.4 ·5 = 12.8−12 = 0.817.11

5 Interpretazione della Covarianza

Si riprende la definizione di covarianza

Cov(X ,Y ) = M[(X−µX )(Y −µY )]

246

la cui scrittura estesa, nel caso di coppie di osservazioni, risulta

Cov(X ,Y ) =1n

n

∑i=1

(xi−µX )(yi−µY )

Implica, quindi, il calcolo

1. delle medie (marginali) µX e µY di X e Y2. degli scarti dalle medie (xi−µX ) e (yi−µY )3. della media del prodotto di tali scarti

Il segno della covarianza dipende dal segno degli addendi (xi−µX )(yi−µY ) che figuranonella sommatoria 17.12

Si consideri la rappresentazione grafica delle seguenti coppie di osservazioni (xi,yi)

xi yi3.5 63 41 3.54 62 5.53 53 72 32 61 2

17.13

0 1 2 3 4 5

01

23

45

67

possiamo identificare sul grafico le medie di X e Y :µX = 2.45, µY = 4.8 17.14

247

0 1 2 3 4 5

01

23

45

67

µX

µY

tracciare le 2 rette perpendicolari in corrispondenza di µX = 2.45 e µY = 4.8 17.15

0 1 2 3 4 5

01

23

45

67

µX

µY

e qualificare il contributo alla covarianza dato dai punti nei quattro quadranti. 17.16

248

0 1 2 3 4 5

01

23

45

67

µX

µY

(+) (+) = (+)

I punti nel quadrante in alto a destra hanno coordinate xi > µX e yi > µY .Risulta (xi−µX )> 0, (yi−µY )> 0 e

(xi−µX )(yi−µY )> 0.

I punti nel quadrante in alto a destra danno un contributo positivo alla covarianza. 17.17

0 1 2 3 4 5

01

23

45

67

µX

µY

(+) (+) = (+)

(+) (−) = (−)

I punti nel quadrante in basso a destra hanno coordinate xi > µX e yi < µY .Risulta (xi−µX )> 0, (yi−µY )< 0 e

(xi−µX )(yi−µY )< 0.

I punti nel quadrante in basso a destra danno un contributo negativo alla covarianza. 17.18

249

0 1 2 3 4 5

01

23

45

67

µX

µY

(+) (+) = (+)

(+) (−) = (−)

(−) (−) = (+)

I punti nel quadrante in basso a sinistra hanno coordinate xi < µX e yi < µY .Risulta (xi−µX )< 0, (yi−µY )< 0 e

(xi−µX )(yi−µY )> 0.

I punti nel quadrante in basso a sinistra danno un contributo positivo alla covarianza. 17.19

0 1 2 3 4 5

01

23

45

67

µX

µY

(+) (+) = (+)

(+) (−) = (−)

(−) (−) = (+)

(−) (+) = (−)

I punti nel quadrante in alto a sinistra hanno coordinate xi < µX e yi > µY .Risulta (xi−µX )< 0, (yi−µY )> 0 e

(xi−µX )(yi−µY )< 0.

I punti nel quadrante in alto a sinistra danno un contributo negativo alla covarianza. 17.20

250

Conclusione (1)

0 1 2 3 4 5

01

23

45

67

µX

µY

Cov(X, Y) > 0

Se sono più frequenti i punti nelle regioni in alto a destra e in basso a sinistra potremoaspettarci un valore positivo della covarianza. 17.21

Conclusione (2)

0 1 2 3 4 5

01

23

45

67

µX

µY

Cov(X, Y) < 0

Se sono più frequenti i punti nelle regioni in basso a destra e in alto a sinistra potremoaspettarci un valore negativo della covarianza. 17.22

Interpretazione della CovarianzaLa covarianza fornisce, quindi, informazioni sulla tipologia di relazione esistente tra ledue variabili

• se sussiste una dipendenza di tipo diretto

Cov(X ,Y )> 0

a valori elevati della X corrispondono valori elevati della Ya valori piccoli della X corrispondono valori piccoli della Y

251

• se sussiste una dipendenza di tipo inverso

Cov(X ,Y )< 0

a valori elevati della X corrispondono valori piccoli della Ya valori piccoli della X corrispondono valori elevati della Y

Esempio 7. Dalle nozioni di Economia Politica

• relazione tra X = prezzo e Y = domanda: Cov(X ,Y )< 0• relazione tra X = prezzo e Y = offerta: Cov(X ,Y )> 0

17.23

Esempio 8. Con riferimento ai dati seguenti

xi yi xi · yi3.5 6 213 4 121 3.5 3.54 6 242 5.5 113 5 153 7 212 3 62 6 121 2 2

∑ 24.5 48 127.5∑/n 2.45 4.8 12.75

M(X) M(Y ) M(XY )

Cov(X ,Y ) = M(XY )−µX µY

= 12.75−2.45 ·4.8 = 12.75−11.76 = 0.9917.24

6 Media di una combinazione lineare

Teorema 9 (Media di una combinazione lineare). Siano X e Y due variabili statistichecon medie µX e µY e sia

W = a+bX + cY

con a,b,c ∈ℜ. AlloraM(W ) = a+bM(X)+ cM(Y ).

La dimostrazione può essere svolta considerando la definizione dell’operatore media arit-metica per una variabile statistica doppia 17.25

252

Dimostrazione.

M(a+bX + cY ) =1n

h

∑i=1

k

∑j=1

(a+bxi + cy j)ni j

=h

∑i=1

k

∑j=1

(a+bxi + cy j) fi j

=h

∑i=1

k

∑j=1

(a fi j +bxi fi j + cy j fi j)

=h

∑i=1

k

∑j=1

a fi j +h

∑i=1

k

∑j=1

bxi fi j +k

∑j=1

h

∑i=1

cy j fi j

= ah

∑i=1

k

∑j=1

fi j +bh

∑i=1

xi

k

∑j=1

fi j + ck

∑j=1

y j

h

∑i=1

fi j

= a ·1+bh

∑i=1

xi fi•+ ck

∑j=1

y j f• j

= a+bµX + cµY .

17.26

Dimostrazione. La dimostrazione può anche essere ottenuta ricordando che la mediaaritmetica è un operatore lineare

M(W ) = M(a+bX + cY ) = a+bM(X)+ cM(Y ).17.27

7 Varianza di una combinazione lineare

Teorema 10 (Varianza di una combinazione lineare). Siano X e Y due variabili statistichecon medie µX , µY , varianze σ2

X , σ2Y e covarianza Cov(X ,Y ) = σXY .

Si definiscaW = a+bX + cY

con a,b,c ∈ℜ. Allora

Var(W ) = b2Var(X)+ c2Var(Y )+2bcCov(X ,Y ).

Esempio 11.µX = 5,µY = 10,σ2

X = 4,σ2Y = 5,σXY = 4.5

SeW = 10−5X +2Y

alloraa = 10,b =−5,c =+2

Var(W ) = (−5)2 ·4+22 ·5+2 · (−5) ·2 ·4.5 = 100+20−90 = 30.17.28

253

Dimostrazione.

Var(W ) = M[W −M(W )]2

= M

[a+bX + cY −M(a+bX + cY )]2

= M

[a+bX + cY −a−bµX − cµY ]

2= M

[bX + cY −bµX − cµY ]

2= M

[b(X−µX )+ c(Y −µY )]

2

= M[b2(X−µX )

2 + c2(Y −µY )2+

+2bc(X−µX )(Y −µY )]

= b2M[(X−µX )

2]+ c2M[(Y −µY )

2]++2bcM [(X−µX )(Y −µY )]

= b2Var(X)+ c2Var(Y )+2bcCov(X ,Y )

= b2σ

2X + c2

σ2Y +2bcσXY .

17.29

8 Covarianza tra trasformazioni lineari

Teorema 12 (Covarianza tra trasformazioni lineari). Siano X e Y due variabili statistichecon medie µX , µY , varianze σ2

X , σ2Y e covarianza Cov(X ,Y ).

Si definiscanoW = a+bX

eT = c+dY

con a,b,c,d ∈ℜ. AlloraCov(W,T ) = bdCov(X ,Y ).

17.30

Dimostrazione.

Cov(W,T ) = M [W −M(W )][T −M(T )]= M [a+bX−M(a+bX)][c+dY −M(c+dY )]= M [a+bX−a−bµX ][c+dY − c−dµY ]= M [bX−bµX ][dY −dµY ]= M bd[X−µX ][Y −µY ]= bd M [X−µX ][Y −µY ]= bdCov(X ,Y ).

17.31

254

Sezione 18Studio della dipendenza seentrambe le variabili sono di tipoquantitativo (2)

18.1

Indice

1 La dipendenza e le sue misure 255

2 I modelli di regressione 257

3 Il criterio dei minimi quadrati 258

4 Bontà di adattamento di un modello 258

5 Soluzione del problema: la funzione di Regressione 260

6 Origine del termine regressione 262

7 Adattamento e dipendenza 264

8 I polinomi di regressione 265

9 Residuo quadratico medio di un modello polinomiale 266 18.2

1 La dipendenza e le sue misure

Come si è visto nelle sezioni precedenti lo studio della dipendenza passa attraverso lostudio delle distribuzioni condizionate:

studio condizionate→ studio connessione

• condizionate somiglianti = indipendenza stocastica• condizionate diverse = dipendenza• condizionate degeneri = dipendenza funzionale

In più, data una v.s. doppia (X ,Y ), quando la variabile dipendente (Y ) è quantitativa ci sipropone di descrivere al meglio l’andamento (la dinamica) del livello di Y al variare di X .

18.3

255

Esempio 1 (La scaltra commessa del negozio di scarpe). Per prevedere la lunghezza delpiede del cliente considera le informazioni relative a un campione di soggetti

Y = lunghezza piede di 90 maschi adultiy j 37 38 39 40 41 42 43 44 45 46n j 3 5 8 12 16 21 13 8 3 1 90

M(Y ) = 41.3667, Var(Y ) = 3.81

Ipotizzando che il campione estratto sia rappresentativo dei clienti del negozio, preso acaso un maschio adulto possiamo affermare che la lunghezza del suo piede è in media tra41 e 42.

Più correttamente applicando la diseguaglianza di Tchebychev

• con t = 2 una frazione degli individui almeno pari al 75% avrà lunghezza del piedenell’intervallo 41.4±2 ·

√3.8 = [37.5,45.3]

• con t = 3 una frazione degli individui almeno pari al 89% avrà lunghezza del piedenell’intervallo 41.4±3 ·

√3.8 = [35.5,47.2]

18.4La commessa osserva, però, anche l’altezza del cliente prima di suggerire un articolo.Con riferimento al campione abbiamo (X = altezza in cm)

Y \ X 160 170 180 19037 2 1 338 3 2 539 3 4 1 840 4 6 2 1241 3 7 6 1642 2 9 9 1 2143 6 6 1 1344 2 4 2 845 1 2 346 1 1

17 37 29 7 90

medie 39.5294 41.0811 42.1379 44.1429 41.3667varianze 2.3668 2.8853 1.843 1.551 3.81

Considerato un individuo di altezza 160 possiamo dire che Y è in media tra 39 e 40 (conmaggior precisione!)

Var(Y |X = 160) = 2.3668 <Var(Y ) = 3.81

18.5

I limiti degli intervalli definiti con la diseguaglianza di Tchebychev per t = 2 risultano

X 160 170 180 190limin f 36.5 37.7 39.4 41.7 37.5limsup 42.6 44.5 44.9 46.6 45.3

I limiti degli intervalli definiti con la diseguaglianza di Tchebychev per t = 3 risultano

X 160 170 180 190limin f 34.9 36 38.1 40.4 35.5limsup 44.1 46.2 46.2 47.9 47.2

18.6

256

2 I modelli di regressione

Definizione 2 (I modelli di regressione). Sono funzioni che descrivono il legame tra lavariabile statistica Y e la variabile statistica X .(studio della dipendenza)vengono così definiti dei modelli teorici del tipo

Y ∗ = g(X)

che vengono utilizzati per descrivere in maniera approssimata la relazione tra la variabilestatistica dipendente Y e la variabile statistica esplicativa X secondo la relazione

Y = g(X)+E

dove E riassume gli scostamenti di Y da Y ∗ = g(X) (residui) dovuti alla incapacità delmodello a riprodurre fedelmente i valori osservati in corrispondenza delle n coppie diosservazioni.Tra le singole osservazioni risultano, quindi, definite le seguenti relazioni

yi = g(xi)+ ei in presenza di coppie di osservazioniy j = g(xi)+ ei j se i dati sono raccolti in tabella

18.7Nella seguente tabella sono riassunte le informazioni relative alle variabili X e Y per 10unità statistiche

X\Y 37 43 50 ni•1 1 1 0 22 0 1 1 23 1 1 0 24 0 2 2 4

n• j 2 5 3 10Si riportano, nel seguente prospetto, le medesime informazioni con riferimento alle

coppie di valori (xi,yi) rilevati in corrispondenza di ciascuna delle 10 unità statistiche

i xi yi1 1 372 1 433 2 504 2 435 3 376 3 437 4 438 4 509 4 50

10 4 43

0 1 2 3 4 5

3540

4550

55

18.8Si supponga di interpretare la variabile Y secondo una generica funzione della variabile

X , ad esempio: Y ∗ = g1(X) =

41 se x = 145 se x = 242 se x = 347 se x = 4

i xi yi g1(xi) ei = yi−g1(xi)1 1 37 41 37−41 =−42 1 43 41 43−41 = 23 2 50 45 50−45 = 54 2 43 45 43−45 =−25 3 37 42 37−42 =−56 3 43 42 43−42 = 17 4 43 47 43−47 =−48 4 50 47 50−47 = 39 4 50 47 50−47 = 3

10 4 43 47 43−47 =−4

0 1 2 3 4 5

3540

4550

55

257

valeY = Y ∗+E = g1(X)+E

dove le componenti della variabile E (residuo) sono gli scarti tra i valori di Y e i valoriassegnati dal modello Y ∗ = g1(X)

• ei = yi−g1(xi) in presenza di coppie dei valori (xi,yi)• ei j = y j−g1(xi) in presenza di valori riclassificati in tabella

18.9Al fine di definire un criterio per scegliere la funzione g mediante la quale interpretarela variabile Y in funzione della variabile X occorre introdurre - come si è visto anche nelcontesto del ’criterio di scelta della media per minimizzazione del danno’ - una opportunapenalizzazione degli scarti.Si può considerare a tal fine la funzione di perdita quadratica1

e2i = [yi−g1(xi)]

2 e2i j = [y j−g1(xi)]

2

i xi yi g1(xi) ei e2i

1 1 37 41 −4 162 1 43 41 2 43 2 50 45 5 254 2 43 45 −2 45 3 37 42 −5 256 3 43 42 1 17 4 43 47 −4 168 4 50 47 3 99 4 50 47 3 910 4 43 47 −4 16

18.10

3 Il criterio dei minimi quadrati

Definizione 3 (Il criterio dei minimi quadrati). Si cerca la funzione g(x) che rende minimala seguente funzione criterio (che riassume il danno globale):

• in presenza di coppie di valori:

M(E2) =1n

n

∑i=1

e2i =

1n

n

∑i=1

[yi−g(xi)]2 = M

[Y −g(X)]2

,

• oppure, in presenza di dati raccolti in una tabella a doppia entrata

M(E2) =1n

h

∑i=1

k

∑j=1

e2i jni j =

1n

h

∑i=1

k

∑j=1

[y j−g(xi)]2ni j = M

[Y −g(X)]2

.

Nel presente paragrafo la ricerca della funzione g(·) è effettuata nell’insieme G dellefunzioni che assumono valore reale.La ricerca può anche essere effettuata in sottoinsiemi di G , ad esempio l’insieme dellefunzioni lineari in x (rette). 18.11

4 Bontà di adattamento di un modello

La quantità M(E2) fornisce una misura della bontà di adattamento di un modello g(·), eindica il danno globale/medio valutato secondo la funzione di perdita quadratica.

1Come si è visto nella Sezione 6 esistono anche altre funzioni di perdita, ad esempio |ei|= |yi−g1(xi)|

258

Definizione 4 (Residuo quadratico medio). La quantità M(E2), media del quadrato dellavariabile errore/scarti/residui, è denominata Residuo Quadratico Medio, in inglese MeanSquare Residual (MSR).

OsservazionePuò essere, indifferentemente, utilizzata quale funzione criterio anche la somma dei qua-drati dei residui n ·M(E2), denominata in inglese Residual Sum of Squares (RSS) e initaliano Devianza dei residui (Dev(E)).

18.12

OsservazioneSe la variabile residuo ha media nulla, M(E) = 0, allora

M(E2) =Var(E).

InfattiVar(E) = M

[(E−µE)

2]= M[(E−0)2]= M(E2).

18.13

Y ∗ = g1(X) =

41 se x = 145 se x = 242 se x = 347 se x = 4


1 1 37 41 −4 162 1 43 41 2 43 2 50 45 5 254 2 43 45 −2 45 3 37 42 −5 256 3 43 42 1 17 4 43 47 −4 168 4 50 47 3 99 4 50 47 3 9

10 4 43 47 −4 16Somma −5 125Media −0.5 12.5

In corrispondenza della funzione g1(x) il residuo quadratico medio risulta M(E2) = 12.5.18.14

A ogni funzione g(x) è associato un diverso valore del residuo quadratico medio.Nel seguente caso g2(x) è preferibile a g1(x).

Y ∗ = g1(X) =

41 se x = 145 se x = 242 se x = 347 se x = 4


1 1 37 41 −4 162 1 43 41 2 43 2 50 45 5 254 2 43 45 −2 45 3 37 42 −5 256 3 43 42 1 17 4 43 47 −4 168 4 50 47 3 99 4 50 47 3 9

10 4 43 47 −4 16Somma −5 125Media −0.5 12.5

Y ∗ = g2(X) =

38.5 se x = 146 se x = 241 se x = 347 se x = 4


1 1 37 38.5 −1.5 2.252 1 43 38.5 4.5 20.253 2 50 46 4 164 2 43 46 −3 95 3 37 41 −4 166 3 43 41 2 47 4 43 47 −4 168 4 50 47 3 99 4 50 47 3 9

10 4 43 47 −4 16Somma 0 117.5Media 0 11.75

g2(x) è anche caratterizzata dal fatto che M(E) = 0, di conseguenza non genera residuisistematici.M(E) = 0 rappresenta una caratteristica auspicabile per un modello di regressione. 18.15

259

5 Soluzione del problema: la funzione di Regressione

Teorema 5. In presenza di una variabile statistica doppia (X ,Y )

M(E2) =1n

h

∑i=1

k

∑j=1

e2i jni j =

1n

h

∑i=1

k

∑j=1

[y j−g(xi)]2ni j = M

[Y −g(X)]2

con g ∈ G , insieme delle funzioni che assumono valore reale, risulta minimo se

g(X) = M(Y |X).18.16

Dimostrazione. La dimostrazione è riferita a una v.s. doppia con dati raccolti in unatabella a doppia entrata.

M(E2) = M[Y −g(X)]2

=

1n

h

∑i=1

k

∑j=1

[y j−g(xi)]2 ni j =

=1n

h

∑i=1

ni•ni•

k

∑j=1

[y j−g(xi)]2ni j =

1n

h

∑i=1

ni•k

∑j=1

[y j−g(xi)]2 ni j

ni•=

=1n

h

∑i=1

ni•

k

∑j=1

[y j−g(xi)]2 ni j

ni•

.

Si osserva come ciascuna espressione in parentesi graffe è non negativa ed è riferita alladistribuzione condizionata Y |xi.Minimizzando ciascuna di queste espressioni, che sono le uniche che dipendono da g(·),si otterrà il minimo globale.Si è riformulato il problema iniziale in un insieme di h problemi di minimo.Quindi, con riferimento a ciascuna delle distribuzioni condizionate Y |xi, occorre determi-nare il valore α = g(xi) che rende minima

k

∑j=1

[y j−α]2ni j

ni•ovvero M

[(Y −α)2∣∣X = xi

].

In base al criterio di scelta della media per minimizzazione del danno la soluzione risultaα = g(xi) = M(Y |xi) = µY (xi).

18.17

Definizione 6 (Funzione di Regressione). Si definisce Funzione di Regressione una qual-siasi funzione che associa a ogni xi la media di Y condizionata a xi.

M(E2) risulta, quindi, minimo in corrispondenza della funzione di regressione.

Y ∗ = M(Y |X) =

40 = 1

2 (37+43) se x = 146.5 = 1

2 (50+43) se x = 240 = 1

2 (37+43) se x = 346.5 = 1

4 (43 ·2+50 ·2) se x = 4

i xi yi M(Y |xi) ei e2i

1 1 37 40 −3 92 1 43 40 3 93 2 50 46.5 3.5 12.254 2 43 46.5 −3.5 12.255 3 37 40 −3 96 3 43 40 3 97 4 43 46.5 −3.5 12.258 4 50 46.5 3.5 12.259 4 50 46.5 3.5 12.25

10 4 43 46.5 −3.5 12.25Somma 0 109.5Media 0 10.95

0 1 2 3 4 5

3540

4550

55

260

18.18

Yyi y2

i37 136943 184950 250043 184937 136943 184943 184950 250050 250043 1849

∑ 439 19483M 43.9 1948.3

v.s. medie condizionatexi M(Y |xi) ni• M(Y |xi) ·ni• [M(Y |xi)]

2 ·ni•1 40 2 80 3200.02 46.5 2 93 4324.53 40 2 80 3200.04 46.5 4 186 8649.0

10 439 19373.5

v.s. varianze condizionatexi Var(Y |xi) ni• Var(Y |xi) ·ni•1 9 2 182 12.25 2 24.53 9 2 184 12.25 4 49

10 109.5

M(Y ) = MX [M(Y |X)] = 43.9

M(Y 2) = 1948.3

Var(Y ) = 1948.3−43.92 = 21.09

varianza spiegata =VarX [M(Y |X)] = 1937.35−43.92 = 10.14

varianza residua = MX [Var(Y |X)] = 10.95

Var(Y ) = var. sp.+var. res. = 10.14+10.95 = 21.09

rapporto di correlazione η2Y |X =

VarX [M(Y |X)]

Var(Y )= 0.4808

18.19

Nel seguito si indicheranno con E, ei, ei j i residui del modello ottenuto con il criterio deiminimi quadrati.Nel caso della funzione di regressione abbiamo

ei j = y j−M(Y |xi).

Teorema 7. Il residuo quadratico medio della funzione di regressione

M(E2) = M[Y −M(Y |X)]2

coincide con la varianza dei residui.

18.20

Dimostrazione. Si dimostra, in primo luogo, con riferimento a una tabella a doppia en-trata, che M(E) = 0

M(E) = M [Y −M(Y |X)]= 1n

h

∑i=1

k

∑j=1

[y j−M(Y |xi)]ni j =

=1n

h

∑i=1

ni•ni•

k

∑j=1

[y j−M(Y |xi)]ni j =

=1n

h

∑i=1

ni•

k

∑j=1

[y j−M(Y |xi)]ni j

ni•

=

= MX [M [Y −M(Y |X)]|X]= MX [0] = 0.

in quanto per la generica distribuzione condizionata vale M [Y −M(Y |X)]|X= 0.Pertanto

M(E2) = M(E2−0) =Var(E).

261

18.21

Teorema 8. Con riferimento al modello funzione di regressione il residuo quadrati-co medio coincide con il termine varianza residua nel risultato di scomposizione dellavarianza.

18.22

Dimostrazione. La dimostrazione è riferita a una v.s. doppia con dati raccolti in unatabella a doppia entrata. M(E2) può essere riscritto come:

M(E2) = M[Y −M(Y |X)]2

=

1n

h

∑i=1

k

∑j=1

[y j−M(Y |xi)]2ni j =

=1n

h

∑i=1

ni•ni•

k

∑j=1

[y j−M(Y |xi)]2ni j =

=1n

h

∑i=1

ni•

k

∑j=1

[y j−M(Y |xi)]2 ni j

ni•

=

= MX

[M[Y −M(Y |X)]2

∣∣∣X]= MX [Var(Y |X)] = varianza residua.

18.23

OsservazioneCon riferimento al modello funzione di regressione le quantità

M(E2) =1n

n

∑i=1

e2i =

1n

n

∑i=1

[yi−M(Y |xi)]2 = M

[Y −M(Y |X)]2

definita in presenza di coppie di valori, oppure

M(E2) =1n

h

∑i=1

k

∑j=1

e2i jni j =

1n

h

∑i=1

k

∑j=1

[y j−M(Y |xi)]2ni j = M[Y −M(Y |X)]2

definita per una tabella a doppia entrata, coincidono con il termine varianza residua nelrisultato di scomposizione della varianza.

18.24

6 Origine del termine regressione

Galton F.R.S., Regression towards Mediocrity in Hereditary Stature, Journal of the AnthropologicalInstitute, 15, 246-263 (1886)

Plants data:’It appeared from these experiments that the offspring did not tend to resemble their parentseeds in size, but to be always more mediocre than they—to be smaller than the parents,if the parents were large; to be larger than the parents, if the parents were very small.’

Humans data:’The child inherits partly from his parents, partly from his ancestry. ... Their mean staturewill then be the same as that of the race; in other words, it will be mediocre. Or, to putthe same fact into another form, the most probable value of the mid-ancestral deviates inany remote generation is zero.’’The average regression of the offspring to a constant fraction of their respective mid-parental deviations, which was first observed in the diameters of seeds, and then confirmed

262

by observations on human stature, is now shown to be a perfectly reasonable law whichmight have been deductively foreseen.’ 18.25

Righe: Heights of the Midparents in inchesColonne: Heights of the Adult Children in inches

61.7 62.2 63.2 64.2 65.2 66.2 67.2 68.2 69.2 70.2 71.2 72.2 73.2 73.773 0 0 0 0 0 0 0 0 0 0 0 1 3 0

72.5 0 0 0 0 0 0 0 1 2 1 2 7 2 471.5 0 0 0 0 1 3 4 3 5 10 4 9 2 270.5 1 0 1 0 1 1 3 12 18 14 7 4 3 369.5 0 0 1 16 4 17 27 20 33 25 20 11 4 568.5 1 0 7 11 16 25 31 34 48 21 18 4 3 067.5 0 3 5 14 15 36 38 28 38 19 11 4 0 066.5 0 3 3 5 2 17 17 14 13 4 0 0 0 065.5 1 0 9 5 7 11 11 7 7 5 2 1 0 064.5 1 1 4 4 1 5 5 0 2 0 0 0 0 0

64 1 0 2 4 1 2 2 1 1 0 0 0 0 018.26

Heights of the Midparents in inches

Hei

ghts

of t

he A

dult

Chi

ldre

n in

inch

es

62 64 66 68 70 72 74

6264

6668

7072

74

Si può osservare come la linea tratteggiata che ’approssima’ (interpola) le medie dell’al-tezza dei figli da adulti condizionate all’altezza mediana dei genitori abbia una pendenzainferiore alla bisettrice (linea continua).Galton conclude che vi è una tendenza delle medie condizionate (che descrivono l’altezzamedia dei figli da adulti) a ritornare (’regredire’) verso la media generale che caratterizzala specie umana. 18.27

18.28

18.29

263

7 Adattamento e dipendenza

La funzione di regressione consente di descrivere il legame in media, quindi si ha:

• adattamento buono se:

– punti sperimentali vicini alla funzione di regressione g(x) = M(Y |X)

– bassa variabilità attorno alle medie condizionate

• dipendenza nulla se:

– medie condizionate tutte eguali

• dipendenza massima se:

– medie condizionate differenti

– variabilità nulla attorno alle medie condizionate

La varianza della variabile statistica medie condizionate

VarXM(Y |X)

costituisce un possibile indice di dipendenza (assoluto). 18.30

Teorema 9 (Scomposizione della varianza in corrispondenza del modello funzione diregressione).

Var(Y ) =VarX [M(Y |X)]+MX [Var(Y |X)]

= varianza spiegata+ varianza residua.

Dimostrazione. È possibile fare riferimento alla dimostrazione dell’analogo risultato ot-tenuto per la varianza di un miscuglio, cfr. il Teorema 1 nella Sezione 10, p. 144.Si riporta, per completezza, anche la dimostrazione riferita a una tabella a doppia entrata.

Var(Y ) = M[(Y −µY )

2]= M

[(Y −M(Y |X)+M(Y |X)−µY )

2]=

= MX

M[(Y −M(Y |X)+M(Y |X)−µY )

2∣∣∣X]=

= MX

M[

(Y −M(Y |X))2 +(M(Y |X)−µY )2 +2(Y −M(Y |X))(M(Y |X)−µY )

∣∣∣X]=

= MX

M[(Y −M(Y |X))2

∣∣∣X]+MX

M[(M(Y |X)−µY )

2∣∣∣X]+

+2MX (M(Y |X)−µY ) ·M [ (Y −M(Y |X))|X ]=

= MX Var(Y |X)+MX

(M(Y |X)−µY )

2+2MX (M(Y |X)−µY ) ·0=

= MX Var(Y |X)+VarX M(Y |X) .

Si osserva che l’eguaglianza M[(M(Y |X)−µY )

2∣∣∣X]= (M(Y |X)−µY )

2 vale in quantoM(Y |X) e µY sono delle costanti per la generica distribuzione condizionata Y |xi.

18.31Una misura della bontà di adattamento del modello funzione di regressione è costituitadalla quota di varianza spiegata.


η2Y |X =

VarX [M(Y |X)]

Var(Y )= 1− MX [Var(Y |X)]

Var(Y ).

18.32

264

8 I polinomi di regressione

Si è introdotta la funzione di regressione come una qualsiasi funzione passante per le hmedie condizionate.Tra le infinite funzioni che soddisfano tale definizione figura anche il polinomio di grado(h−1)

y∗ = a0 +a1x+a2x2 + . . .+ah−1xh−1

che unisce le medie senza soluzione di continuità.Per determinare i coefficienti a0,a1,a2, . . . ,ah−1 di tale polinomio, occorre risolvere ilseguente sistema di h equazioni lineari

M(Y |x1) = a0 +a1x1 +a2x21 + . . .+ah−1xh−1

1...M(Y |xh) = a0 +a1xh +a2x2

h + . . .+ah−1xh−1h

.

18.33

Si osserva però come il modello descritto dal polinomio di grado (h− 1) possa risultaretroppo complesso nelle applicazioni pratiche.

Si pensi ad esempio al polinomio interpolante una serie storica di lunghezza h.

Comunemente si fa, quindi, ricorso a modelli più semplici:polinomi di grado inferiore a (h−1) 18.34

Si considerano dei modelli polinomiali completi di grado r

0≤ r ≤ h−1

g G =spazio funzioniche assumonovalore reale

L0 L1 . . . Lh−1 L0 ⊂L1 ⊂ . . .⊂Lh−1 ⊂ G

Y = Y ∗+E = λ (x)+E = a0 +a1X +a2X2 + . . .+arX r +E

si tratta di modelli lineari nei parametri. 18.35

Stime dei parametri ai (i = 0,1, . . . ,r) possono essere determinate applicando ai dati ilcriterio dei minimi quadrati, che va a ricercare la soluzione che rende minimo il residuoquadratico medio

M(E2) = M[Y −λ (X)]2

= M

[(Y −a0−a1X−a2X2− . . .−arX r)2] .

OsservazioneSi dimostra che, in base al criterio dei minimi quadrati, il modello che meglio approssimai dati è lo stesso che meglio approssima la funzione di regressione.

18.36

Definizione 11 (Varianza residua). Se M(E) = 0, allora

M(E2) =Var(E)

e il residuo quadratico medio è denominato varianza residua.

265

OsservazioneCon riferimento alla stima dei parametri di un polinomio di regressione secondo il cri-terio dei minimi quadrati, la relazione M(E) = 0 risulta verificata se il parametro a0(denominato costante o intercetta) non è vincolato.

18.37

Definizione 12 (Scomposizione della varianza). Si dimostra che se in un modello poli-nomiale il parametro a0 (denominato costante o intercetta) non è vincolato, allora vale laseguente scomposizione della varianza di Y .

Var(Y ) = varianza spiegatamodello +varianza residuamodello

= varianza spiegatamodello +M(E2)

Definizione 13 (Indice di adattamento). Se vale il risultato di scomposizione della va-rianza, allora, è possibile definire la seguente misura normalizzata

R2 = 1− M(E2)

Var(Y )= 1− Var(E)

Var(Y )

detta indice di adattamento.

OsservazioneL’indice di adattamento R2 può essere interpretato come la quota di varianza spiegata dalmodello.

18.38

9 Residuo quadratico medio di un modello polinomiale

Si supponga di avere ottenuto, in base al criterio dei minimi quadrati, le stime dei coeffi-cienti a0, a1, . . . , ar del seguente modello polinomiale:

Y = a0 +a1X + . . .+arX r +E

Il residuo quadratico medio

M(E2) = M(Y − a0− a1X− . . .− arX r)2

può essere ottenuto applicando la seguente formula operativa

M(E2) = M Y (Y −modello polinomiale stimato)= M Y (Y − a0− a1X− . . .− arX r)= M(Y 2)− a0M(Y )− a1M (Y X)− . . .− arM (Y X r)

L’espressione vale anche se alcuni coefficienti sono nulli e, quindi, anche se manca l’in-tercetta o qualche potenza della variabile X . 18.39

266

Sezione 19Modelli polinomiali

19.1

Indice

1 Il modello costante Y = a0 +E 2681.1 Residuo quadratico medio e indice di adattamento . . . . . . . . . . . . . 268

2 Il modello retta Y = a+bX +E 2692.1 Scomposizione della varianza totale . . . . . . . . . . . . . . . . . . . . 2702.2 Indice adattamento retta . . . . . . . . . . . . . . . . . . . . . . . . . . . 2712.3 Residuo quadratico medio retta di regressione . . . . . . . . . . . . . . . 2712.4 Una ulteriore scomposizione della varianza residua del modello retta . . . 2712.5 Retta di regressione e covarianza . . . . . . . . . . . . . . . . . . . . . . 2722.6 Relazione tra indipendenza stocastica, indipendenza in media e indipen-

denza lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2732.7 Il coefficiente di correlazione lineare . . . . . . . . . . . . . . . . . . . . 2742.8 Confronto tra η2 e ρ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276

3 Esercizi 2793.1 Esercizi sul confronto tra ρ2 e η2 . . . . . . . . . . . . . . . . . . . . . . 2793.2 Esercizi di carattere teorico . . . . . . . . . . . . . . . . . . . . . . . . . 285

4 Modello Y = bX +E 288 19.2

267

1 Il modello costante Y = a0 +E

Si tratta del polinomio di grado r = 0.Si applica il criterio dei minimi quadrati per determinare l’espressione del parametro a0.La ricerca del minimo viene condotta all’interno della classe dei polinomi λ (x) ∈L0

a0 = arg mina0∈ℜ

M[E2] = arg mina0∈ℜ

M[(Y −a0)

2]= M(Y ) = µY

(per la proprietà della media aritmetica inerente il criterio di scelta della media per mini-mizzazione del danno 1).

0 1 2 3 4 5

01

23

45

µY

19.3

1.1 Residuo quadratico medio e indice di adattamento

Il residuo quadratico medio risulta:

M(E2)= M

[(Y −µY )

2]=Var(Y )

Dal momento che M(E)= M(Y −µY ) = 0 il residuo quadratico medio minimo coincide

con la varianza residuaM(E2)=Var

(E)=Var(Y ).

L’indice di adattamento R2 (quota di varianza spiegata) assume valore nullo:

1−M(E2)

Var(Y )= 1− Var(Y )

Var(Y )= 0.

Osservazioni• Il modello non passa necessariamente per le medie condizionate.• È il modello più semplice, però è decisamente scarso:

anche se i dati presentano trend non ne tiene conto!19.4

1Occorre risolvere la seguente equazione

d M[(Y −a0)

2]d a0

= 0

M[

d(Y −a0)2

d a0

]= 0

M [2(Y −a0)(−1)] = 0

−2M(Y −a0) = 0

M(Y −a0) = M(E) = 0

M(Y )−a0 = 0

a0 = M(Y ).

268

2 Il modello retta Y = a+bX +E

Esprime la dinamica in modo solo proporzionale.Si applica il criterio dei minimi quadrati per determinare l’espressione dei parametri a eb. La ricerca del minimo viene condotta all’interno della classe dei polinomi λ (x) ∈L1

(a, b) = argmina,b

M[E2] = argmina,b

M[(Y −a−bX)2]

Si ottiene:

b =Cov(X ,Y )

Var(X)a = M(Y )− bM(X)

0 1 2 3 4 5

01

23

45

19.5

Dimostrazione. Occorre risolvere il seguente sistema di equazioni lineari (denominateequazioni normali)

∂M[(Y−a−bX)2]∂a = 0

∂M[(Y−a−bX)2]∂b = 0

M [2(Y −a−bX)(−1)] = 0M [2(Y −a−bX)(−X)] = 0−2M(Y −a−bX) = 0−2M [(Y −a−bX)X ] = 0M(Y −a−bX) = 0M [(Y −a−bX)X ] = 0

Si osserva come, in corrispondenza dei valori (a, b) soluzione del sistema, dalla primaequazione segue che M

(E)= 0.

Dalla seconda equazione, sempre in corrispondenza dei valori (a, b) soluzione del siste-ma, abbiamo M

(EX)= 0. La seconda equazione impone, quindi, l’ortogonalità tra E e

X , da cui la denominazione di sistema delle equazioni normali.Si stanno, quindi, cercando le stime (a, b) che garantiscono M

(E)= 0 e M(EX) = 0.

Dal momento che M è un operatore lineare, dalla prima equazione si ottiene

M(Y )−a−bM(X) = 0a = M(Y )−bM(X) = µY −bµX

che può essere sostituito nella seconda equazione del sistema

M [Y − (µY −bµX )−bX ]X= 0

M(XY −µY X +bµX X−bX2)= 0

M(XY )−µY M(X)+bµX M(X)−bM(X2)= 0

269

M(XY )−µX µY +b(µX )2−bM

(X2)= 0

[M(XY )−µX µY ]−b[M(X2)− (µX )

2]= 0

b =M(XY )−µX µY

M (X2)− (µX )2 =

Cov(X ,Y )Var(X)

.

19.6In definitiva:

b =Cov(X ,Y )

Var(X)a = M(Y )− bM(X)

OsservazioneSi dimostra che la retta interpolante tutti i dati osservati è equivalente alla retta approssi-mante le medie condizionate.

19.7

2.1 Scomposizione della varianza totale

Definizione 1 (Scomposizione della varianza totale). Data la retta di regressione

Y = a+ bX + E = Y + E

dove a e b sono le stime dei valori dei coefficienti a e b del modello retta Y = a+bX +E,ottenute secondo il criterio dei minimi quadrati, vale la seguente scomposizione

Var(Y ) = varianza spiegataretta +varianza residuaretta

=Var(Y)+Var

(E)

=Var(Y)+M

(E2)

con

varianza spiegataretta =Var(Y)=Var(a+ bX) = b2Var(X) =

=

(Cov(X ,Y )

Var(X)

)2

Var(X) =[Cov(X ,Y )]2

Var(X)

varianza residuaretta = M(E2)= M

[(Y − Y

)2].

19.8Il residuo quadratico medio coincide con Var

(E), varianza dei residui, (M

(E)= 0). 19.9

Dimostrazione. Dalla prima equazione del sistema delle equazioni normali, cfr. dimo-strazione che ha portato alle formule dei coefficienti a e b, si è ottenuto

M(E)= M

(Y − Y

)= 0

quindiM(Y)= M(Y ) = µY .

Si considera ora la varianza di Y

Var(Y ) = M[(Y −µY )

2]= M

[(Y − Y + Y −µY

)2]

= M[(

Y − Y)+(Y −µY

)]2= M

[(Y − Y

)2]+M

[(Y −µY

)2]+M

[2(Y − Y

)(Y −µY

)]= M

(E2)+M

[(Y −µY

)2]+2M

[(Y − Y

)(Y −µY

)]270

• Il residuo quadratico medio al primo addendo coincide con la varianza della varia-bile residuo (residual), dal momento che M

(E)= 0.

• Il secondo addendo misura la variabilità dei valori stimati dal modello (punti sullaretta) rispetto alla media di Y e rappresenta la parte della variabilità di Y che ilmodello retta è in grado di spiegare.

• Il terzo addendo, 2 volte la covarianza tra E =(Y − Y

)e(Y −µY

), risulta nullo:

M[E(Y −µY

)]= M

[E(a+ bX− a− bµX

)]= M

[E(bX− bµX

)]= M

(bEX− bµX E

)= bM

(EX)− bµX M

(E)= b ·0− bµX ·0 = 0

essendo M(EX)= M

[(Y − Y

)X]= 0 in base alla seconda equazione del sistema

delle equazioni normali.

Quindi

Var(Y ) =Var(E)+Var

(Y)= varianza residuaretta +varianza spiegataretta.

19.10

2.2 Indice adattamento retta

Definizione 2 (Indice di adattamento della retta di regressione). Dal momento che vale lascomposizione

Var(Y ) = varianza spiegataretta +varianza residuaretta

possiamo definire, analogamente al modello funzione di regressione, un indice di adatta-mento come

R2 =varianza spiegataretta

Var(Y )= 1− varianza residuaretta

Var(Y )= 1−

M(E2)

Var(Y )

=

[Cov(X ,Y )]2

Var(X)

Var(Y )=

[Cov(X ,Y )]2

Var(X)Var(Y )= ρ

2.

L’indice di adattamento del modello retta viene anche indicato con il simbolo ρ2.19.11

2.3 Residuo quadratico medio retta di regressione

OsservazioneÈ possibile ricavare il residuo quadratico medio, o varianza residua, del modello rettacome

M(E2)= varianza residuaretta =

(1−ρ

2)Var(Y )

• ρ2 rappresenta la quota di varianza spiegata dal modello retta•(1−ρ2

)rappresenta la quota di varianza non spiegata (residua)

• varianza residuaretta è l’ammontare di varianza non spiegata19.12

2.4 Una ulteriore scomposizione della varianza residua del model-lo retta

La retta (secondo i minimi quadrati) e la funzione di regressione sono state ottenute comele funzioni che rendono minimo il residuo quadratico medio rispettivamente nelle classi:

271

• L1, delle rette,• G , delle funzioni che assumono valore reale.

Dal momento che L1⊂G vale la seguente relazione tra i residui quadratici medi (varianzeresidue) dei due modelli

M(E2

funzione di regressione)≤M

(E2

retta).

L’indice di adattamento della retta assumerà, di conseguenza, un valore inferiore a quellodella funzione di regressione:

ρ2 ≤ η

2Y |X .

19.13

Segue l’ulteriore scomposizione della varianza residua del modello retta2

varianza residuaretta = MX [Var(Y |X)]+∆2retta, funzione di regressione

dove• MX [Var(Y |X)] = MX

M[(Y −M(Y |X))2

∣∣∣X]= var. residuafunzione di regressione

• ∆2retta, funzione di regressione = MX

[(a+ bX

)−M(Y |X)

]2è la media degli scosta-

menti, elevati al quadrato, tra i valori teorici secondo il modello retta e le mediecondizionate (valori teorici secondo la funzione di regressione).

La varianza residua della funzione di regressione viene anche detta varianza irriducibile,in quanto coincide con il valore minimo che può assumere il residuo quadratico medio diun modello scelto con il criterio dei minimi quadrati. 19.14

2.5 Retta di regressione e covarianza

Si è visto come la formula del coefficiente angolare della retta di regressione secondo iminimi quadrati e l’indice di adattamento del modello retta dipendono dalla covarianza

b =Cov(X ,Y )

Var(X), ρ

2 =[Cov(X ,Y )]2

Var(X)Var(Y ).

È, quindi, possibile identificare la covarianza come indicatore fondamentale della dipen-denza lineare.

Definizione 3 (Indipendenza lineare). Si ha indipendenza lineare se

Cov(X ,Y ) =Cov(Y,X) = 0↔ b = 0↔ ρ2 = 0.

Definizione 4 (Perfetta dipendenza lineare). Si ha perfetta dipendenza lineare se

ρ2 = 1.

In questa situazione vale anche η2Y |X = η2

X |Y = 1.19.15

2 Posto Y = a+ bX vale infatti:

M[(

Y − Y)2]= MX

M[ (

Y − Y)2∣∣∣X]= MX

M[ (

Y ±M(Y |X)− Y)2∣∣∣X]=

= MX

M[

(Y −M(Y |X))2 +(M(Y |X)− Y

)2−2(Y −M(Y |X)) ·(M(Y |X)− Y

)∣∣∣X]=

= MX

M[(Y −M(Y |X))2

∣∣∣X]+MX

(M(Y |X)− Y

)2−2MX

(M(Y |X)− Y

)·M [ (Y −M(Y |X))|X ]

= MX [Var(Y |X)]+∆

2retta, funzione di regressione

ricordando che M [ (Y −M(Y |X))|X ] = 0.

272

2.6 Relazione tra indipendenza stocastica, indipendenza in mediae indipendenza lineare

y

x

\/

indipendenza stocastica

Y |xi ∼ Y ↔ X |y j ∼ X

↓ ↑\/ ↓ ↑\/

M(Y |xi) = M(Y ) ↔\/ M(X |y j) = M(X)i = 1,2, . . . ,h j = 1,2, . . . ,k

l lη2

Y |X = 0 indipendenza η2X |Y = 0

in media↓ ↑\/ ↓ ↑\/

Cov(X ,Y ) =Cov(Y,X) = 0indipendenza lineare(

se le medie condizionate sono tra loro egualila retta che le interpola ha coefficiente angolare nullo

)

y

x

\/

19.16

OsservazionePossono sussistere contemporaneamente le situazioni di indipendenza lineare e dipenden-za funzionale; si consideri, al riguardo, il seguente esempio

X \Y 8 23 29 ni•1 0 0 k k2 k 0 0 k5 0 k 0 k

n• j k k k n = 3k

Le distribuzioni condizionate Y |xi e X |y j sono degeneri; sussiste, quindi, dipendenzafunzionale bijettiva, ma Cov(X ,Y ) = 0.

M(XY ) =13k

(1 ·29k+2 ·8k+5 ·23k) =13k

(29k+16k+115k) =160k3k

=1603

µX =13k

(1k+2k+5k) =8k3k

=83

µY =13k

(8k+23k+29k) =60k3k

= 20

Cov(X ,Y ) = M(XY )−µX µY =160

3− 8

320 =

1603− 160

3= 0

0 1 2 3 4 5

05

1015

2025

3035

19.17

273

2.7 Il coefficiente di correlazione lineare

Definizione 5 (Il coefficiente di correlazione lineare). Si definisce coefficiente di cor-relazione lineare tra X e Y , ρXY , anche indicato con il simbolo ρ , la covarianza tra lecorrispondenti variabili standardizzate

ρ =Cov(

X−µX

σX,Y −µY

σY

)=

Cov(X ,Y )σX σY

dove µX , µY , σX , σY sono rispettivamente le medie e gli scarti quadratici medi.

Teorema 6.−1≤ ρ ≤ 1.

19.18Si riportando due dimostrazioni del risultato.

Dimostrazione. Il quadrato del coefficiente di correlazione lineare

ρ =Cov(X ,Y )

σX σY

coincide con l’indice di adattamento del modello retta, ρ2 = [Cov(X ,Y )]2

Var(X)Var(Y ) , quota di varian-za spiegata dal modello retta; vale quindi:

0≤ ρ2 ≤ 1

da cui segue la tesi.19.19

Dimostrazione. Si ricorda che una variabile standardizzata Z è caratterizzata da medianulla e varianza unitaria, quindi:

M(

X−µXσX

)= M

(Y−µY

σY

)= 0 Var

(X−µX

σX

)=Var

(Y−µY

σY

)= 1

Si considerano le varianze delle variabili somma e differenza delle variabili X e Y stan-dardizzate. Entrambe le varianze sono, per definizione, non negative. Var

(X−µX

σX+ Y−µY

σY

)≥ 0

Var(

X−µXσX− Y−µY

σY

)≥ 0 Var

(X−µX

σX

)+Var

(Y−µY

σY

)+2Cov

(X−µX

σX, Y−µY

σY

)≥ 0

Var(

X−µXσX

)+Var

(Y−µY

σY

)−2Cov

(X−µX

σX, Y−µY

σY

)≥ 0

1+1+2ρ ≥ 01+1−2ρ ≥ 02+2ρ ≥ 02−2ρ ≥ 01+ρ ≥ 01−ρ ≥ 0

da cui segue la tesi −1≤ ρ ≤ 1.

274

19.20

ρ ed equazione retta di regressioneRicordando che

b =Cov(X ,Y )

σ2X

e

ρ =Cov(X ,Y )

σX σY

abbiamob = ρ

σY

σX;

da cui si può scrivere

Y ∗ = a+ bX = µY − bµX + bX = µY + b(X−µX ) = µY +ρσY

σX(X−µX ).

La retta passa, quindi, nel punto (µX ,µY ), detto centroide.19.21

retta di regressione al variare di ρ

0 1 2 3 4 5

01

23

45

µX

µY

0 1 2 3 4 5

01

23

45

µX

µY

0 1 2 3 4 5

01

23

45

µX

µY

−1 < ρ < 0 ρ ' 0 0 < ρ <+119.22


0 1 2 3 4 5

01

23

45

µX

µY

0 1 2 3 4 5

01

23

45

µX

µY

ρ =−1 ρ =+119.23

Il seguente teorema trova applicazione in ambito finanziario.

Teorema 7 (Risultato di diversificazione). Siano X e Y due variabili statistiche con medieµX , µY , varianze σ2

X , σ2Y e covarianza σXY . Allora√

Var(X +Y )≤ σX +σY .

19.24

275

Dimostrazione. Dal momento che

|ρ|=∣∣∣∣Cov(X ,Y )

σX σY

∣∣∣∣≤ 1.

abbiamo−σX σY ≤Cov(X ,Y )≤ σX σY .

Moltiplicando per 2 e sommando Var(X) +Var(Y ) ai tre termini della diseguaglianzaabbiamo

Var(X)+Var(Y )−2σX σY ≤Var(X)+Var(Y )+2Cov(X ,Y )≤Var(X)+Var(Y )+2σX σY ,

da cui si ottiene(σX −σY )

2 ≤Var(X +Y )≤ (σX +σY )2

e|σX −σY | ≤

√Var(X +Y )≤ σX +σY .

19.25

2.8 Confronto tra η2 e ρ2

Si ipotizza di studiare la dipendenza di Y da X .Dal momento che vale la relazione

0≤ ρ2 ≤ η

2Y |X ≤ 1

si possono presentare le situazioni riassunte nel seguente prospetto

η2Y |X = 0 0 < η2

Y |X < 1 η2Y |X = 1

ρ2 = 0

0 2 4 6 8

01

23

45

0 2 4 6 8

01

23

45

0 2 4 6 8

01

23

45

0 < ρ2 < 1 no

0 2 4 6 8

01

23

45

0 2 4 6 8

01

23

45

ρ2 = 1 no no

0 2 4 6 8

01

23

45

Le sei situazioni plausibili sono descritte nelle pagine successive.Per una presentazione più dettagliata si rimanda a Zanella A 2003 Elementi di statisticadescrittiva, CUSL. 19.26

276

η2Y |X = 0

Se η2Y |X = 0 sussiste indipendenza in media di Y da X e anche ρ2 = 0 in quanto le medie

condizionate M(Y |xi) sono uguali a M(Y ).

0 2 4 6 8

01

23

45

19.27

η2Y |X = 1

Se η2Y |X = 1 sussiste dipendenza funzionale di Y da X in quanto le distribuzioni condizio-

nate (Y |xi) sono degeneri.

η2Y |X = 1

ρ2 = 0

0 2 4 6 8

01

23

45

i dati hanno una configurazione tale chela retta interpolante ha pendenza nulla

0 < ρ2 < 1

0 2 4 6 8

01

23

45

ρ2 = 1

0 2 4 6 8

01

23

45

ρ2 = η2Y |X = 1

sussiste perfetta dipendenza lineare

19.28

277

0 < η2Y |X < 1

Se 0 < η2Y |X < 1 esiste dipendenza di Y da X , ma non dipendenza funzionale.

Le rappresentazioni grafiche delle situazioni che si possono verificare sono simili a quellecostruite per η2

Y |X = 1; qui è, però, presente la nuvola dei punti in quanto le distribuzionicondizionate (Y |xi) non sono tutte degeneri.

0 < η2Y |X < 1

ρ2 = 0

0 2 4 6 8

01

23

45

i dati hanno una configurazione tale chela retta interpolante ha pendenza nulla

0 < ρ2 < 1

0 2 4 6 8

01

23

45

nella situazione rappresentata abbiamoρ2 < η2

Y |X

19.29

0 < ρ2 = η2Y |X < 1

Se ρ2 = η2Y |X il modello funzione di regressione e il modello retta coincidono (hanno lo

stesso residuo quadratico medio); di conseguenza le medie condizionate sono allineate.


0 2 4 6 8

01

23

45

0 2 4 6 8

01

23

45

ρ < 0 ρ > 0

Le medie condizionate non sono tutte uguali in quanto η2Y |X > 0;

è presente la nuvola dei punti in quanto η2Y |X < 1.

19.30

278

3 Esercizi

I seguenti esercizi sono articolati in 2 gruppi

• esercizi sul confronto tra ρ2 e η2,• esercizi di carattere teorico.

La presente sezione ha carattere integrativo rispetto agli esercizi che presuppongono unosviluppo numerico. 19.31

3.1 Esercizi sul confronto tra ρ2 e η2

Esercizio 8 (T 246, 18.09.2008, 4). Si indichi, per ognuna delle seguenti tabelle a doppiaentrata, il valore assunto dagli indici sotto indicati, motivando le risposte.

1.

X \ Y 4 5 61 10 0 02 0 8 03 0 0 6

η2X |Y , η2

Y |X , ρ2

2.

X \ Y 4 51 10 02 0 83 10 0

η2X |Y , η2

Y |X , χ2 -

19.32

Esercizio 9 (T 239, 10.01.2008, 4). Completare la tabella, esplicitando anche i valori possibiliper x2 e y2, in modo tale ρ2 = 0 e η2

X |Y = 1:

X \ Y 1 y2 35x2 1

-

19.33

Esercizio 10 (T 243, 19.06.2008, 2). Completare la seguente tabella, motivando le risposte, inmodo tale che:

1. η2Y |X = 0 e ρ2 = 1;

2. ρ2 = 0 e χ2N = 1;

3. η2Y |X = χ2

N .

X \ Y 10 15 203 85 4

3 6 3 12

-

19.34

Esercizio 11 (T 251, 18.06.2009, 2). Data la seguente tabella a doppia entrata si determinino ivalori delle frequenze n21 ed n22 in modo tale che risulti:

1. η2Y |X = ρ2 = 1

2. 0 < η2Y |X = ρ2 < 1

3. η2Y |X 6= ρ2

279

X \ Y 1 2 310 2 0 011 112 0 0 2

-

19.35

Esercizio 12 (T 255, 14.01.2010, 5). Si completino ove possibile le seguenti tabelle, motivandola risposta, in modo tale che:

1.

X \ Y 2 4 81 0 02 0 05 0 0

4

ρ2 = η2Y |X = 1

2.

X \ Y 2 4 61 03 0 0

5

η2Y |X = 0 e contemporaneamente η2

X |Y > 0 -

19.36

Esercizio 13 (T 257, 11.02.2010, 5). Se possibile e giustificando teoricamente le risposte,completare le seguenti tabelle in modo da soddisfare le condizioni sotto indicate.

X \ Y 3 4 ?4 0 8 ?7 12 0 ?

1. χ2N = 1 ρ = 0

2. η2Y |X = η2

X |Y = 1

3. ρ2 = η2Y |X = η2

X |Y = 0 -

19.37

Esercizio 14 (T 261, 13.01.2011, 4). Si completi ove possibile la seguente tabella, motivandola risposta, in modo tale che:

X \ Y 1 510 020

055

1. 0 < ρ2 = η2Y |X < 1

2. χ2 = 55

3. ρ2 = 0 -19.38

Esercizio 15 (T 262, 03.02.2011, 4). Si completi se possibile la seguente tabella, motivando larisposta, in modo tale che:

X \ Y 1 2 31 13 1

6

1. η2Y |X = 0 e ρ2 = 1

2. ρ2 = 0 -19.39

280

Esercizio 16 (T 266, 12.01.2012, 4). La tabella seguente riporta le osservazioni della variabileY in corrispondenza di 5 valori della X :

xi 8 8 10 12 12yi 4 6 y3 8 10

Si indichi un valore da assegnare a y3 affinché ρ2 < η2Y |X e η2

X |Y = 1. -

19.40

Esercizio 17 (T 263, 17.02.2011, 4). Si completino se possibile le seguenti tabelle, riportandomodalità e frequenze e motivando teoricamente la risposta, in modo tale che:

1.

X \ Y 2 y291011

η2Y |X = 1, η2

X |Y = 0 e ρ > 0

2.

X \ Y 2 y2910 4 011 0 712

η2Y |X = 1 e ρ < 0 -

19.41

Esercizio 18 (T 264-1, 09.06.2011, 5). Si completino se possibile le seguenti tabelle, riportan-do modalità e frequenze e motivando teoricamente la risposta, in modo tale che:

1.X \ Y 2 5 8x1 2 4 2x2 4 4

η2Y |X = 0, η2

X |Y > 0

2.X \ Y y1 y2 y3x1 2 4 2x2 4 4

ρ2 = 0 -19.42

Esercizio 19 (T 265, 08.09.2011, 4). Si completino se possibile le seguenti tabelle, motivandoteoricamente la risposta, in modo tale che:

1.X \ Y 10 20 301 0 112 0

η2Y |X = ρ2 = 0

2.X \ Y 10 20 301 11 02 0 9

η2Y |X = ρ2 6= 0 -

19.43

Esercizio 20 (T 265-1, 22.09.2011, 4). Si completino se possibile le seguenti tabelle, motivan-do teoricamente la risposta, in modo tale che:

1.

X \ Y 10 20 301 0 122 04 0

η2X |Y = ρ2 = 0

281

2.

X \ Y 10 20 301 12 02 0 93 12

η2Y |X = ρ2 6= 0 -

19.44

Esercizio 21 (T 268, 09.02.2012, 4). Se possibile e giustificando teoricamente le risposte, sicompletino le seguenti tabelle in modo da soddisfare le condizioni sotto indicate.

1.

X \ Y 3 92 3

36

0 < ρ2 = η2X |Y < 1

2.

X \ Y 20 4010 3

20 1

χ2 = 30 e η2Y |X = 1 -

19.45

Esercizio 22 (T 269-1, 07.06.2012, 4). Se possibile e giustificando teoricamente le risposte, sicompletino le seguenti tabelle in modo da soddisfare le condizioni sotto indicate.

1.

X \ Y 3 92 3

36

0 < ρ2 < η2X |Y < 1

2.

X \ Y 20 4010 3

20 1

ρ =−30 e η2Y |X = 0 -

19.46

Esercizio 23 (T 269-3, 12.07.2012, 4). Se possibile e giustificando teoricamente le risposte, sicompleti la seguente tabella in modo da soddisfare le condizioni sotto indicate.

X \ Y 3 92 8

8

1. ρ2 = η2X |Y

2. ρ2 = η2Y |X -

19.47

Esercizio 24 (T 240, 31.01.2008, 4). Con riferimento ai dati della seguente tabella:X \ Y 10 200 4 1 512 1 4 5

5 5 10

1. Rappresentare, mediante un grafico bubble diagram, le coppie di dati e la funzione di regres-sione per lo studio di Y |X .

2. Si stimino, attraverso il criterio dei minimi quadrati, i parametri del modello Y ∗ = a+bX

3. Calcolare ρ2.

282

4. Calcolare i valori di η2Y |X ed η2

X |Y . -

19.48

Esercizio 25 (T 207, 15.01.2004, 4). Con riferimento a n = 50 unità statistiche si sono raccoltialcuni dati, relativi alle variabili (X ,Y ) nella seguente tabella:

Y \ X 1 2 310 8 1 020 8 4 a30 0 1 b

1. Determinare i valori (interi) da assegnare alle costanti a e b affinché η2Y |X = ρ2.

2. Calcolare il valore del coefficiente di correlazione lineare.19.49

Esercizio 26 (T 270-1, 20.09.2012, 4). Se possibile e giustificando teoricamente le risposte, sicompleti la seguente tabella in modo da soddisfare le condizioni sotto indicate.

X \ Y 20 y2 4010 2x2

1. ρ = 1 e χ2 = 0 -19.50

Esercizio 27 (T 271, 10.01.2013, 4). Si completino, giustificando opportunamente la risposta,le seguenti tabelle in modo tale che:

1.y1 = 2 y2 = y3 = 12

x1 = 2 3x2 = 4 5 5

ρ2 = 1 e η2X |Y = 0

2.y1 = 2 y2 = y3 = 12

x1 = 2 3x2 = 4 5 5

ρ2 = η2Y |X = 0 e η2

X |Y = 1 -

19.51

Esercizio 28 (T 272, 24.01.2012, 4). Si completi la tabella, giustificando opportunamente larisposta, in modo che ρ2 < η2

Y |X .

y1 = 2 y2 = y3 = 12x1 = 2 3x2 = 4 5 5

-

19.52

Esercizio 29 (T 273, 07.02.2013, 4). Si completino le seguenti tabelle, giustificando opportu-namente la risposta, in modo tale che:

1.

y1 = 2 y2 = 4 y3 = 6x1 = 1 7x2 = 2 0 0x3 = 3 0

n = 31

χ2 = 62 e M(X) = 2

2.

y1 = 2 y2 = 4 y3 = 6x1 = 1 7x2 = 2x3 = 3

n =

χ2 = 0 e M(Y ) = 4 -

283

19.53

Esercizio 30 (T 274-1, 06.06.2013, 4). Si completi la seguente tabella, giustificando opportu-namente la risposta, in modo che χ2 = ρ2 = η2

Y |X .

y1 = 2 y2 = 4 y3 = 6x1 = 1 7x2 = 2x3 = 3

n = 120

-

19.54

Esercizio 31 (T 274-2, 11.07.2013, 4). Si completino le seguenti tabelle, giustificando oppor-tunamente la risposta, in modo tale che:

1.

y1 = 2 y2 = 4 y3 = 6x1 = 1 7x2 = 2

n = 120

ρ2 = 1 e η2Y |X = 0

2.

y1 = 2 y2 = 4 y3 = 6x1 = 1 7x2 = 2

n = 120

η2X |Y = 1 e η2

Y |X = 0 -

19.55

Esercizio 32 (T 275, 05.09.2013, 4). Si completi la seguente tabella, giustificando opportuna-mente la risposta, in modo tale che χ2 = 44 e ρ2 = 0

x1 = 12 x2 = x3 = 18y1 = 2 20y2 = 4

n = 44

-

19.56

Esercizio 33 (T 275-1, 16.09.2013, 4). Si completi la seguente tabella, giustificando opportu-namente la risposta, in modo tale che χ2 = 44 e ρ2 = 1

x1 = 12 x2 = 15 x3 = 18y1 = 2y2 = 4 20y2 = 5

n = 44

-

19.57

Esercizio 34 (T 276, 16.01.2014, 4). Si completino le seguenti tabelle, giustificando la risposta,in modo che siano soddisfatte le condizioni indicate.

1.y1 = 10 y2 = 15

x1 = 1 11x2 = 2 10

η2Y |X = ρ2 > 0

2.y1 = 10 y2 = 15

x1 = 1 11x2 = 2 5

χ2 = 0

284

3.y1 = 10 y2 = 15

x1 = 1 11x2 = 2

ρ =−1 -19.58

Esercizio 35 (T 277, 30.01.2014, 4). Si completino le seguenti tabelle, giustificando la risposta,in modo che siano soddisfatte le condizioni indicate.

1.y1 = 10 y2 = 20 y3 = 30

x1 = 1 0 11x2 = 2 0

η2X |Y = 1,ρ2 = 0

2.y1 = 10 y2 = 20 y3 = 30

x1 = 1 11x2 = 2 11

η2Y |X = ρ2 6= 0 -

19.59

Esercizio 36 (T 228, 13.07.2006, 2). Con riferimento alla seguente tabella a doppia entrata sidica, motivando teoricamente la risposta, che valore assume

X \ Y 8 10 121 0 0 b2 a 1 a3 c 0 0

1. η2Y |X sapendo che ρ =−0.85 e che a,b,c sono valori interi strettamente positivi;

2. η2Y |X e ρ nell’ipotesi in cui a = 0. Si definisca, per questo caso, l’espressione analitica della

funzione di regressione.

3. Indicare l’intervallo di valori che può assumere il rapporto di correlazione η2X |Y .

19.60

3.2 Esercizi di carattere teoricoEsercizio 37 (T 212, 15.07.2004, 1). Con riferimento alla seguente tabella a doppia entratariferita a una rilevazione campionaria su 200 unità statistiche, posto che il rapporto di correlazioneη2

Y |X assume valore nullo e che la media marginale di Y è pari a 25:

X \ Y 15 25 35x1 25 50 n13x2 n21 80 10

1. si determinino i valori delle frequenze assolute n13 e n21 e si rappresenti graficamente ladistribuzione cumulata Y |X = x1;

2. si riassumano con opportuni indici di posizione e di variabilità le distribuzioni condizionateY |X = xi, i = 1,2;

3. sulla base di un opportuno indice verificare se si può ritenere che esista connessione tra levariabili X e Y ;

4. confrontare le due distribuzioni condizionate Y |X = xi, i = 1,2, con un opportuno indice diasimmetria;

5. supponendo che x1 = 1 e x2 = 2x1 si calcoli il valore del coefficiente di correlazione linearetra X e Y .

19.61

285

Esercizio 38 (T 212, 15.07.2004, 2). Dato il seguente grafico della serie storica Y del fatturato(in milioni di e) di un’azienda negli ultimi 7 mesi (t = 1,2, . . . ,7),

0 2 4 6 8

1. sapendo che M(Y ) = 4, Var(Y ) = 9, e che ρ2 = 0.64 calcolare i parametri della retta diregressione Y ∗ = a+bt;

2. indicare i valori assunti dalle varianze spiegate dei modelli I) Y = a+ bt e II) funzione diregressione M(Y |t).

19.62

Esercizio 39 (T 227, 29.06.2006, 3). Date due v.s. X e Y , la funzione di regressione di Y |X èM(Y |X) = 2+3X2. Sapendo che la distribuzione marginale di X è la seguente:

xi 1 2 3 4fi 0.2 0.3 0.4 0.1

e sapendo che η2Y |X = 0.5, determinare il valore della varianza residua di Y .

19.63

Esercizio 40 (T 157, 30.09.1999, 3). Data la seguente distribuzione del carattere W :

wi 2 7 12ni 3 4 3

sapendo che le stime dei parametri del seguente modello di regressione: T ∗ = a+bW assumono ivalori seguenti: a = −4 e b = 2, e che l’indice di adattamento di tale modello è pari al rapporto dicorrelazione, ossia ρ2 = η2

T |W , calcolare:

1. le medie condizionate M(T |W ) del carattere T ;

2. il valore di η2T |W sapendo che la varianza di T è pari a 100;

3. il valore della covarianza tra W e T .19.64

Esercizio 41 (T 179, 20.07.2000, 5). A un insieme di dati si è adattato un modello di regressionelineare Y ∗ = a+bX e si sono conservati soltanto i seguenti valori: b = 0.7; σ2

X = 5 e M(Y 2) = 2.2.Si vogliono determinare le seguenti quantità:

1. ρ2: indice di adattamento;

2. σXY (covarianza);

3. la varianza residua;

4. la varianza spiegata;

5. la stima dell’intercetta a.

Si calcolino, ove possibile, i valori numerici delle quantità sopra indicate e, in caso di impossibilità,si indichino quali ulteriori informazioni sarebbero necessarie.

19.65

Esercizio 42 (T 189, 27.09.2001, 5). Siano date le due variabili statistiche X e Y . Sapendoche il coefficiente angolare (b) della retta di regressione Y = a+bX è pari a 1.5 e il coefficiente dicorrelazione lineare tra X e Y è pari a 0.7, si determini il valore:

1. del coefficiente angolare della seconda retta di regressione X = γ +δY ;

2. l’indice di adattamento ρ2.

Sapendo inoltre che σ2X = 56 si calcoli il valore:

286

1. della varianza spiegata della prima retta di regressione Y = a+bX ;

2. della covarianza.19.66

Esercizio 43 (T 191, 31.01.2002, 4). In una classe di 20 studenti di un liceo scientifico si sonorilevati il voto di matematica (X) ed il voto di fisica (Y ). Il coefficiente di correlazione lineare èrisultato essere pari a 0.8. Per descrivere l’eventuale legame esistente fra le due variabili sono statiusati i seguenti modelli lineari: Y = a+ bX ed X = c+ dY , i cui parametri sono stati determinaticol metodo dei minimi quadrati.Dire, motivando la risposta, se le seguenti affermazioni sono vere.

1. b =−0.6 e d =−1.0667;

2. l’80% della variabilità di Y è spiegata attraverso il legame lineare con X ;

3. esiste perfetta relazione lineare tra X e Y .19.67

Esercizio 44 (T 203, 26.06.2003, 3). Siano M(Y |x1) = 2, M(Y |x2) = 4 e M(Y |x3) = 6 le mediecondizionate di una variabile Y alle tre modalità di una variabile X così distribuita:

xi nia 10b 20c 10

1. Sapendo che la media delle varianze condizionate di Y a X è 20, calcolare la varianza di Y .

2. Si determini il valore di η2Y |X .

3. Posto a = 1, b = 2 e c = 3, si determini il segno del coefficiente di correlazione lineare tra Xe Y .

19.68

Esercizio 45 (T 211, 01.07.2004, 3). Siano X e Y due variabili statistiche. Sapendo che la stimab del coefficiente b della retta di regressione X = a+bY è pari a 0.7 e il coefficiente di correlazionelineare tra X e Y è pari a 0.5, determinare:

1. il coefficiente angolare della retta di regressione Y = c+dX

2. le varianze residua e spiegata della retta di regressione X = a+ bY sapendo che σ2Y = 7

3. il valore della covarianza tra X e Y .19.69

Esercizio 46 (T 238, 20.09.2007, 3). Siano X e Y due caratteri quantitativi tali che la funzionedi regressione di Y su X sia M(Y |X) = 2+4

√xi. Sapendo che la distribuzione del carattere X è la

seguente:xi 4 9 16 25 36fi 0.2 0.15 0.3 0.15 0.2

e che la varianza del carattere Y è pari a 45.6

1. si calcoli la media della variabile Y .

2. Si calcoli il valore dell’indice η2Y |X .

3. Si indichi l’intervallo dei valori che può assumere il coefficiente di correlazione lineare ρ trale variabili X e Y .

19.70

Esercizio 47 (T 152, .., 5). Siano X1, X2 e X3 tre variabili statistiche tra loro non correlate, conmedie aritmetiche µi e varianze σ2

i ; sia Z un’altra variabile definita come Z = X1 +X2. Trovarel’espressione analitica dei parametri e della varianza residua del modello di regressione lineare di Zcon X3.

19.71

287

4 Modello Y = bX +E

Si applica il criterio dei minimi quadrati per determinare l’espressione del parametro b

b = argminb

M[E2]= argmin

bM[(Y −bX)2

]

dM[(Y −bX)2

]db

= 0

M

[d (Y −bX)2

db

]= 0

M [2(Y −bX)(−X)] = 0−2M [(Y −bX)X ] = 0M [(Y −bX)X ] = M (EX) = 0

M(−XY +bX2)= 0

−M (XY )+bM(X2)= 0

da cui segue

b =M (XY )M (X2)

.

19.72

Il residuo quadratico medio risulta

M(E2)= M

[(Y − bX

)2]= M

[(Y − bX

)(Y − bX

)]= M

[(Y − bX

)Y]− bM

[(Y − bX

)X]

ma, nella dimostrazione precedente si è visto che, per b = b, si ha M[(

Y − bX)

X]=

M(EX)= 0; abbiamo quindi:

M(E2)= M

[(Y − bX

)Y].

La formula coincide con quella generale relativa ai polinomi

M(E2)= M

[Y(Y − bX

)]= M

(Y 2)− bM (XY ) .

Si osserva come, mancando l’intercetta (è stata vincolata a 0), non vale il risultato discomposizione della varianza e non è quindi possibile calcolare l’indice di adattamento(normalizzato). 19.73

288

Sezione 20Modelli riconducibili al modelloretta

20.1

Indice

1 Linearizzazioni 289

2 Valutazione di modelli alternativi 2902.1 Modelli completi e funzione di regressione . . . . . . . . . . . . . . . . . 2912.2 Modelli incompleti e linearizzati . . . . . . . . . . . . . . . . . . . . . . 291

3 Indice di miglioramento 293

4 Previsione 293

5 Valutazione di modelli in termini previsivi 293

6 Estensione del modello lineare bivariato 294

7 Interpretazione del coefficiente b per alcuni modelli di regressione 2957.1 Relazione lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2957.2 Trasformata logaritmica della variabile esplicativa . . . . . . . . . . . . . 2957.3 Trasformata logaritmica della variabile dipendente . . . . . . . . . . . . 2967.4 Trasformata logaritmica della variabile dipendente e variabile esplicativa

di tipo dummy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2967.5 Trasformata logaritmica sia della variabile dipendente che della variabile

esplicativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2977.6 Prospetto riepilogativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 2987.7 Esercizio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 20.2

1 Linearizzazioni

Sebbene qualsiasi funzione continua possa essere approssimata, con riferimento allo svi-luppo in serie di Taylor, con una funzione polinomiale di grado opportuno, a volte perinterpretare al meglio il legame esistente tra la variabile Y e la variabile X risulta più ap-propriato fare ricorso a una relazione di tipo non lineare. Alcune, come le seguenti, sonoriconducibili al modello retta tramite una opportuna trasformazione (linearizzazione).

289

forma non lineare forma linearizzata1) Y ∗ = aXb (lnY ∗) = (lna)+b(lnX)2) Y ∗ = aebX (lnY ∗) = (lna)+bX3) Y ∗ = abX (lnY ∗) = (lna)+(lnb)X4) Y ∗ = a+ b

X Y ∗ = a+b 1X

5) Y ∗ = 1a+bX

1Y ∗ = a+bX

6) Y ∗ = Xa+bX

1Y ∗ = b+a 1

X4) iperbole 5) reciproco retta 6) reciproco iperbole

20.3

Il precedente prospetto contiene dei particolari modelli che nelle variabili trasformatedivengono lineari di 1 grado del tipo

dipendente = intercetta+ pendenza · esplicativa+ residuo

i cui parametri (intercetta e pendenza) sono stimati con le usuali formule del modello retta

pendenza =Cov(dipendente,esplicativa)

Var(esplicativa)intercetta = M(dipendente)− pendenza ·M(esplicativa).

Le stime così ottenute costituiscono delle approssimazioni di quelle che si otterrebberorisolvendo il problema di minimo in base al criterio dei minimi quadrati applicato airesidui della forma non lineare. 20.4

Ad esempio, con riferimento ai coefficienti a e b del modello 1) occorrerebbe risolvere(per via numerica) uno dei seguenti problemi:

min(a,b)

M(

Y −aXb)2

min(a,b)

M

(Y

aXb

)2

riferiti ai modelli di regressione:

Y = aXb +E Y = aXb ·E

caratterizzati, rispettivamente, da residui di tipo additivo e moltiplicativo. 20.5

2 Valutazione di modelli alternativi

In presenza di due o più modelli è possibile individuare il modello che si ’adatta’ meglioai dati, vale a dire interpreta meglio la relazione di dipendenza tra la variabile dipendenteY e la variabile esplicativa X , confrontando i residui quadratici medi dei modelli in gioco.Il modello ’migliore’ è quello caratterizzato da residuo quadratico medio, M

(E2), mini-

mo.Si osserva che l’indice di adattamento non risulta essere, in genere, ben definito. Se,ad esempio, la variabile E non avesse media nulla non sarebbe possibile scomporreopportunamente la varianza della variabile dipendente.

Nel caso in cui, per ciascuno dei modelli in gioco valga il risultato di scomposizionedella varianza è anche possibile, in alternativa al confronto dei residui quadratici medi,effettuare il confronto tra gli indici di adattamento.Il modello ’migliore’ è quello caratterizzato dall’indice di adattamento (quota di varianzaspiegata) più elevato. 20.6

290

2.1 Modelli completi e funzione di regressione

Con riferimento ai modelli completi (modelli polinomiali nei quali figura l’intercetta co-me parametro libero) e alla funzione di regressione si è visto che la media del residuo ènulla

M(E)= 0

quindi, il residuo quadratico medio coincide con la varianza residua del modello

M(E2)=Var

(E)

e vale la scomposizione della varianza come

σ2Y = σ

2spiegata +σ

2residua

dove

• σ2spiegata = varianza dei punti di regressione

• σ2residua = attorno ai punti di regressione =Var

(E)= M

(E2)

20.7

2.2 Modelli incompleti e linearizzati

Nei modelli incompleti e in quelli non lineari, se per ricondursi alla forma linearizzatasi opera una trasformazione della variabile dipendente, non vale la scomposizione dellavarianza e può, anche, accadere che

M(E2)> σ

2Y .

Di conseguenza, dovendo scegliere, tra diversi modelli, quale è più opportuno utilizzareper interpretare la variabile Y si dovranno confrontare i residui quadratici medi quando:

• con riferimento a modelli lineari nei parametri

– in qualcuno dei modelli in gioco manca l’intercetta,

– l’intercetta è vincolata,

• il modello è non lineare e, per ricondursi alla forma linearizzata, si è operata unatrasformazione che coinvolge la variabile dipendente.

In questi casi non ha senso calcolare l’usuale indice di adattamento. 20.8

Esempio 1 (vincolo: retta passante in (0,a0)).

Y ∗ = a0 +bX (a≡ a0 = 10)

0 2 4 6 8

02

46

810

x

y

291

20.9

Esempio 2 (trasformazione: modello Y = a+ bX2). È possibile ricondursi al modelloretta, considerando X2 come variabile esplicativa.Nella prima delle seguenti rappresentazioni grafiche si stima il modello quadratico in X ;nella seconda il modello lineare in X2; si osserva come la struttura di variabilità della Yrimane immutata.I residui del primo modello sono identici a quelli del secondo, avendo operato una tra-sformazione solo della variabile esplicativa.Quindi il residuo quadratico medio assume lo stesso valore in entrambe le situazioni.

0 1 2 3 4 5 6 7 8

02

46

810

x

y

0 4 9 16 25 36 49

02

46

810

x2

y

20.10

OsservazionePer convenzione, con riferimento ai modelli linearizzabili, si indicherà con E la variabileresiduo attinente alla forma non lineare.Ad esempio, per il modello

Y ∗ = aXb

avremoE = Y ∗− aX b

dove a e b sono le stime dei parametri ottenute con il modello linearizzato

lnY ∗ = lna+b lnX .

20.11

Esempio 3 (trasformazione: modello Y = aXb). È possibile ricondursi al modello retta,operando la linearizzazione

ln(Y ) = lna+b ln(X)

Nella prima delle seguenti rappresentazioni grafiche si stima il modello non lineare in X ;nella seconda il modello linearizzato in lnX e lnY .Si osserva come in questo caso la struttura di variabilità della Y cambia.Non si possono, quindi, utilizzare i residui e, tantomeno, l’indice di adattamento delsecondo modello per valutare la bontà del primo.Occorre calcolare il residuo quadratico medio basandosi sui residui della prima figura.

0 2 4 6 8

020

4060

8010

0

x

y

0.0 0.5 1.0 1.5 2.0 2.5

01

23

45

ln(x)

ln(y)

20.12

292

3 Indice di miglioramento

Dati due modelli possiamo classificare come ’migliore’ il modello che ha associato ilresiduo quadratico medio più piccolo e come ’peggiore’ quello che ha associato il residuoquadratico medio più grande.

Definizione 4. Si definisce indice di miglioramento la riduzione relativa del residuoquadratico medio che si ottiene passando dal modello peggiore al modello migliore.

pegg,miglρ2 =

RMSpegg−RMSmigl

RMSpegg.

20.13

4 Previsione

Ottenuta la stima g(·) della componente strutturale g(·) del modello

Y = g(X)+E,

formulato per spiegare una variabile dipendente Y in termini di una variabile esplicativaX , è possibile utilizzare tale stima per effettuare una previsione riguardo al valore as-sunto dalla variabile dipendente Y in corrispondenza di una nuova osservazione x0 dellavariabile esplicativa X .Occorre, a tal fine, posta pari a zero la previsione della componente accidentale, sostituireil valore x0 nell’espressione g(x). 20.14

Esempio 5. Si considera il problema della previsione per il modello retta

Y = a+bX +E.

Ipotizzando che le stime dei parametri a e b, ottenute, secondo il criterio dei minimiquadrati, in corrispondenza a un insieme di n osservazioni (xi,yi), i = 1,2, . . . ,n, sianoa = 3 e b = 7, la previsione in corrispondenza del valore x0 = 5 risulta

Y (x0 = 5) = a+ b · x0 +0= 3+7 ·5 = 38.

20.15

5 Valutazione di modelli in termini previsivi

Si ricorda che le stime secondo il criterio dei minimi quadrati vengono ottenute tramiteminimizzazione del residuo quadratico medio

M(E2) = M[Y −g(X)2

]con riferimento all’insieme dei dati osservati che costituiscono il cosiddetto training set. 20.16

Si osserva che, nel caso le realizzazioni nel training set presentino notevoli deviazionirispetto alla componente strutturale g(x) del modello che si pensa descrivere il fenomenooggetto di studio, i criteri di scelta tra i possibili modelli alternativi1 (presentati nel para-grafo 2) potrebbero portare a selezionare un modello g(x) poco efficace con riferimentoalla previsione in corrispondenza di nuove osservazioni. 20.17

1Si ricorda che tali criteri sono basati sul valore assunto dal residuo quadratico medio calcolato per ciascunmodello in corrispondenza del training set.

293

La valutazione in termini previsivi di un insieme di modelli alternativi G = g1(x), . . . ,gh(x)dovrebbe, pertanto, essere effettuata su un nuovo insieme di k unità statistiche (il cosiddet-to test set) per il quale si dispongano di informazioni relative sia alla variabile esplicativasia alla variabile dipendente (x01,y01), . . . ,(x0k,y0k), cfr. James, Witten, Hastie, Tibshirani2015 An Introduction to Statistical Learning. Springer.In tal modo la valutazione viene svolta considerando un insieme di osservazioni nonutilizzate per la stima del modello. 20.18

Il modello migliore in ottica previsiva sarà quello che minimizza il residuo quadraticomedio calcolato sul test set

g(x) = arg mingi(x)∈G

1k

k

∑i=1y0i−g(x0i)2 .

20.19

6 Estensione del modello lineare bivariato

• se ρ2 η2Y |X → il modello è migliorabile

(ad esempio aumentando il grado del polinomio)• se ρ2 ' η2

Y |X → il modello polinomiale non è migliorabile20.20

Esempio 6. Si riprenda l’esempio relativo alla lunghezza piede (Y ) e all’altezza (X)

xi 160 170 180 190fi• 0.189 0.411 0.322 0.078

µY (xi) 39.43 41.04 42.14 44.14σ2

Y (xi) 2.37 2.83 1.84 1.55

M(X) = 172.89 Var(X) = 73.88M(Y ) = 41.37 Var(Y ) = 3.81

Cov(X ,Y ) = M(XY )−µX µY = 10.56

avendo espresso M(XY ) come segue

M(XY ) =h

∑i=1

k

∑j=1

xiy j fi j =h

∑i=1

fi•k

∑j=1

xiy jfi j

fi•

=h

∑i=1

fi•xi

k

∑j=1

y jfi j

fi•=

h

∑i=1

fi•xiM(Y |xi) =h

∑i=1

xiµY (xi) fi•

media varianze condizionate = 2.32varianza medie condizionate = 1.54

η2Y = 0.399 ρ

2 = 0.39120.21

Soluzione

aggiungere variabili esplicative→ analisi multivariata

ad esempio:lunghezza piede = f (altezza, peso)

20.22

294

7 Interpretazione del coefficiente b per alcuni modellidi regressione

I risultati seguenti valgono anche con riferimento ai modelli di regressione multipla (cheverranno presentati in una Sezione successiva), ceteris paribus, ossia supponendo cherimanga immutato il livello di tutte le altre variabili eventualmente presenti nel modello enell’ipotesi teorica che vi sia assenza di correlazione lineare tra la componente di errore ei regressori.Si considerano le seguenti tipologie di relazioni lineari:

• relazione lineare tra le variabili nella loro scala originaria• relazione lineare con trasformata logaritmica della variabile esplicativa• relazione lineare con trasformata logaritmica della variabile dipendente• relazione lineare con trasformata logaritmica della variabile dipendente e variabile

esplicativa di tipo dummy• relazione lineare con trasformata logaritmica sia della variabile dipendente che

della variabile esplicativa 20.23

7.1 Relazione lineare

Y ∗ = a+bX

Sex0→ x0 +∆x

consegue che

y∗0 = a+bx0→ a+b(x0 +∆x) = a+bx0 +b∆x = y∗0 +b∆x,

quindi

∆y∗ = y∗0 +b∆x− y∗0 = b∆x e∆y∗

∆x= b.

b è la variazione assoluta di y∗ che consegue a una variazione assoluta unitaria di x. 20.24

7.2 Trasformata logaritmica della variabile esplicativa

Y ∗ = a+b ln(X)

Sex0→ x1 = x0 +∆x = x0 + cx0 = (1+ c)x0

consegue che

y∗0 = a+b ln(x0)→ a+b ln[(1+ c)x0] = a+b ln(x0)+b ln(1+ c) = y∗0 +b ln(1+ c),

quindi∆y∗ = b ln(1+ c).

Si osserva che il rapporto tra il nuovo valore di x, x1 = (1+c)x0 e il valore iniziale x0 puòessere interpretato come un valore relativo e risulta pari a 1+ c:

x1

x0= (1+ c)

da cui consegue una variazione relativa di x pari a c.Si consideri lo sviluppo in serie di Taylor di ln(1+ c), vale:

ln(1+ c)' c.

Per valori ’piccoli’ di c si può interpretare b ln(1+ c) ' bc come la variazione assolutadi y∗ che consegue a una variazione relativa di x pari a 100c%. 20.25

295

7.3 Trasformata logaritmica della variabile dipendente

ln(Y ∗) = a+bX

Sex0→ x1 = x0 +∆x

consegue che

ln(y∗0) = a+bx0→ ln(y∗1) = a+b(x0 +∆x) = a+bx0 +b∆x = ln(y∗0)+b∆x.

Si consideri il rapporto (valore relativo) tra il nuovo valore y∗1 = expln(y∗0)+ b∆x e ilvalore iniziale y∗0:

y∗1y∗0

=expln(y∗0)+b∆x

expln(y∗0)=

exp

ln(y∗0)+ lneb∆x

y∗0=

=exp

ln(y∗0 · eb∆x

)y∗0

=y∗0 · eb∆x

y∗0= eb∆x.

Considerando lo sviluppo in serie di Taylor di eb∆x, abbiamo che eb∆x ' (1+b∆x).Quindi, per valori piccoli di b e di ∆x si può interpretare b∆x come la variazione relativadi y∗ che consegue a una variazione assoluta ∆x di x. 20.26

7.4 Trasformata logaritmica della variabile dipendente e variabileesplicativa di tipo dummy

Si particolarizza il caso precedente tenendo presente che x può assumere solo i valori 0 e1, rispettivamente nelle situazioni di assenza e presenza del carattere di cui è indicatrice.2

ln(Y ∗) = a+bX

Sex0 = 0→ x1 = 1

consegue cheln(y∗0) = a→ ln(y∗1) = a+b = ln(y∗0)+b.

Il rapporto (valore relativo) tra il nuovo valore y∗1 = expln(y∗0)+b e il valore iniziale y∗0risulta:

y∗1y∗0

=expln(y∗0)+b

expln(y∗0)=

exp

ln(y∗0)+ lneb

y∗0=

exp

ln(y∗0eb

)y∗0

=y∗0eb

y∗0= eb.

Quindi, dal momento che eb ' (1+b) per valori piccoli di b, il coefficiente b può essereinterpretato come la variazione relativa di y∗ che consegue al passaggio della variabileindicatrice x dallo stato 0 allo stato 1.Ad esempio l’incremento percentuale, ceteris paribus, del salario di un soggetto di generemaschile, x = 1, rispetto allo stipendio di un soggetto di genere femminile, x = 0. 20.27

2Se, ad esempio, si è rilevato il genere G di 4 soggetti, la variabile X =maschio assume valore 1 per i soggettimaschi e 0 per le femmine

soggetto G X1 m 12 f 03 f 04 m 15 f 0

296

7.5 Trasformata logaritmica sia della variabile dipendente che del-la variabile esplicativa

ln(Y ∗) = a+b ln(X)

Sex0→ x1 = x0 +∆x = x0 + cx0 = (1+ c)x0

consegue che

ln(y∗0) = a+b ln(x0)→ ln(y∗1) = a+b ln[(1+ c)x0] =

= a+b ln(x0)+b ln(1+ c) = ln(y∗0)+b ln(1+ c).

Si consideri il rapporto (valore relativo) tra il nuovo valore y∗1 = expln(y∗0)+b ln(1+c)e il valore iniziale y∗0:

y∗1y∗0

=expln(y∗0)+b ln(1+ c)

expln(y∗0)=

expln(y∗0)+ ln(1+ c)by∗0

=

=expln[y∗0(1+ c)b]

y∗0=

y∗0(1+ c)b

y∗0= (1+ c)b.

Si osservi come(1+ c)b ' (1+bc),

per valori piccoli di b e c; infatti

(1+ c)b = exp[ln(1+ c)b] = exp[b ln(1+ c)];

inoltreln(1+ c)' c

e, infine,exp(bc)' (1+bc).

20.28

A una variazione relativa di x, pari ac

(si ricordi che x1/x0 = 1+ c) consegue, quindi, una variazione relativa di y∗ pari a circa

bc

(infatti, y∗1/y∗0 ' 1+bc).Dal momento che si considerano valori ’sufficientemente piccoli’ di b e c le variazionirelative di x e y∗ possono rispettivamente indicarsi (nel continuo) con dx

x e dy∗y∗ , da cui il

rapportody∗y∗

dxx

' bcc

= b

noto anche come elasticità di y∗ rispetto a x.Si osserva che la presente relazione, ln(Y ∗) = a + b ln(X), corrisponde alla versione’linearizzata’ di Y ∗

Y ∗ = αXb

con a = ln(α). 20.29

297

7.6 Prospetto riepilogativo

• Y ∗ = a+bXb è la variazione assoluta di Y ∗ conseguente a una variazione assoluta di X =+1.

• Y ∗ = a+b lnXbc è la variazione assoluta di Y ∗ conseguente a una variazione relativa di X pari ac = 100c%;se X aumenta dell’1% (variazione relativa di X = 0.01 =+1%) allora la variazioneassoluta di Y ∗ è 0.01b.

• lnY ∗ = a+bXb= 100b% è la variazione relativa (percentuale) di Y ∗ conseguente a una variazioneassoluta di X =+1.

• lnY ∗ = a+b lnXbc = 100(bc)% è la variazione relativa (percentuale) di Y ∗ conseguente a una va-riazione relativa di X pari a c = 100c%;se X aumenta dell’1% (variazione relativa di X = 0.01 =+1%) allora la variazionerelativa di Y ∗ è 0.01b = 100 ·0.01b% = b%.

20.30

Se X è una variabile indicatrice (dummy) abbiamo:

• Y ∗ = a+bXb è la variazione assoluta di Y ∗ conseguente al passaggio di X dallo stato 0 allostato 1.

• lnY ∗ = a+bXb = 100b% è la variazione relativa (percentuale) di Y ∗ conseguente al passaggio diX dallo stato 0 allo stato 1. 20.31

7.7 Esercizio

Esercizio 7. Si riportano nel seguente prospetto lo stipendio orario, yi, e il settore lavora-tivo (con categorie f = finanziario e m = manifatturiero), wi, di 5 soggetti

wi f m f m fyi 6 7 8 8 10

• Si calcolino M(Y |W = f ) e M(Y |W = m) e si riassuma il livello di dipendenza inmedia di Y da W mediante il rapporto di correlazione η2

Y |W .• Si ricodifichino le categorie di W mediante le variabili indicatrici (dummy)

xi =

1 se wi = m0 se wi 6= m

ci =

1 se wi = f0 se wi 6= f

• Si stimino, secondo il criterio dei minimi quadrati, i parametri e l’indice di adatta-mento dei seguenti modelli di regressione

Y = a+bX +E (1)Y = α +βC+E (2)

• Si interpretino le stime dei parametri nei modelli (1) e (2), confrontandole con ivalori delle medie di gruppo M(Y |W = f ) e M(Y |W = m).

• Si giustifichi perché gli indici di adattamento dei modelli (1) e (2) coincidono conil rapporto di correlazione η2

Y |W .20.32

298

Sezione 21Esempio stima modelli inpresenza di tabella a doppiaentrata

21.1

Indice

1 Funzione di regressione 3001.1 Rapporto di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . 301

2 Modello Y ∗ = a+bX 302

3 Modello Y ∗ = a+bX2 302

4 Modello Y ∗ = bX 303

5 Modello Y ∗ = bX2 303

6 Modello Y ∗ = aXb 304

7 Modello Y ∗ = aebX 305

8 Modello Y ∗ = abX 306

9 Modello Y ∗ = 5+bX 306

10 Modello Y ∗ = 5+bX2 307

11 Schema riassuntivo 308 21.2

Con riferimento ai dati raccolti nella tabella a doppia entrata

X \ Y 5 15 261 0 0 4 42 0 8 3 113 9 1 0 10

9 9 7 25

si stimano i parametri e il residuo quadratico medio di alcuni modelli di regressione. 21.3

299

varianza delle medie condizionate

VarXM(Y |X)= 662825−14.482 = 55.4496 (varianza spiegata).

21.6

Variabile statistica varianze condizionate Var(Y |X)

xi Var(Y |xi) ni Var(Y |xi)ni1 0 4 02 24 11 2643 9 10 90

Somma 25 354modalità frequenze calcolo

media

media varianze condizionate

MXVar(Y |X)= 35425

= 14.16 (varianza residua).

Calcolo media e varianza di Y

y j n j y jn j y2jn j

5 9 45 22515 9 135 202526 7 182 4732

25 362 6982

M(Y ) = 362/25 = 14.48M(Y 2)= 6982/25 = 279.28

Var(Y ) = 279.28−14.482 = 69.6096.

21.7

1.1 Rapporto di correlazione

Dai calcoli effettuati nelle pagine precedenti si ha che

M(Y ) = MXM(Y |X)= 14.48

Var(Y ) = VarXM(Y |X) + MXVar(Y |X)Var(Y ) = (varianza spiegata) + (varianza residua)69.6096 = 55.4496 + 14.16

η2Y |X =

varianza spiegata funzione regressioneVar(Y )

η2Y |X =

VarXM(Y |X)Var(Y )

=55.449669.6096

= 0.7967.

21.8

301

2 Modello Y ∗ = a+bX

b =Cov(X ,Y )

Var(X)=

M(XY )−M(X)M(Y )M (X2)− [M(X)]2

=27.2−2.24 ·14.48

5.52−5.0176=−5.23520.5024

=−10.4204

a = M(Y )− bM(X) = 14.48+10.4204 ·2.24 = 37.8217

ρ2 =

[Cov(X ,Y )]2

Var(X)Var(Y )=

27.40730.5024 ·69.6096

= 0.7837

ρ =−0.8853

M(E2)=Var

(E)= varianza residua = 15.0568 = σ

2Y (1−ρ

2).

21.9

Osservazione

•dipendente = a+b · esplicativa

b =Cov(esplicativa,dipendente)

Var(esplicativa)

a = M(dipendente)− bM(esplicativa).

• Nel caso in esame la variabile residuo, E = Y − Y , è caratterizzata da media nulla,quindi M

(E2)= Var

(E), vale a dire il residuo quadratico medio coincide con la

varianza dei residui.21.10

3 Modello Y ∗ = a+bX2

È possibile ricondursi al modello retta

dipendente = a+b · esplicativa

b =Cov

(X2,Y

)Var (X2)

=M(X2Y

)−M

(X2)

M(Y )M (X4)− [M (X2)]2

=57.44−5.52 ·14.48

39.6−5.522 =−22.4896

9.1296=−2.4634

a = M(Y )− bM(X2)= 14.48+2.4634 ·5.52 = 28.078

ρ2 =

[Cov

(X2,Y

)]2Var (X2)Var(Y )

=505.7821

9.1296 ·69.6096= 0.7958

ρ =−0.8921

M(E2)=Var

(E)= varianza residua = 14.2113 = σ

2Y (1−ρ

2).

Anche nel caso in esame M(E)= 0 quindi M

(E2)=Var

(E). 21.11

302

4 Modello Y ∗ = bX

b =M (XY )M (X2)

=27.25.52

= 4.9275.

Per ottenere il residuo quadratico medio si applica la formula relativa ai polinomi

M(E2)= M

[Y(Y − bX

)]= M

(Y 2)− bM(XY ) = 279.28−4.9275 ·27.2 = 145.252.

Si osserva come, mancando l’intercetta, non vale il risultato di scomposizione della va-rianza: il valore del residuo quadratico medio è superiore a quello di Var(Y ). 21.12

5 Modello Y ∗ = bX2


b = argminb

M[(

Y −bX2)2]

dM[(

Y −bX2)2]

db= 0

M

[d(Y −bX2

)2

db

]= 0

M[2(Y −bX2)(−X2)]= 0

M(−X2Y +bX4)= 0

−M(X2Y

)+bM

(X4)= 0

da cui segue

b =M(X2Y

)M (X4)

=57.4439.6

= 1.4505.

21.13


M(E2)=M

[Y(Y − bX2)]=M

(Y 2)− bM

(X2Y

)= 279.28−1.4505 ·57.44= 195.9633

Si osserva come, mancando l’intercetta, non vale il risultato di scomposizione della va-rianza: il valore del residuo quadratico medio è superiore a quello di Var(Y ). 21.14

303

6 Modello Y ∗ = aXb

È possibile linearizzare il modello

lnY ∗ = lna+b lnX

e ricondursi al modello retta

dipendente = lna+b · esplicativa

dove dipendente = lnY e esplicativa = lnX .Per calcolare i parametri conviene riferirsi alle variabili trasformate

lnX \ lnY 1.6094 2.7081 3.25810 0 0 4 4

0.6931 0 8 3 111.0986 9 1 0 10

9 9 7 25

M(lnX) = 0.744 M(lnY ) = 2.4666M[(lnX)2

]= 0.6942 M[(lnY )2] = 1.6272

Var(lnX) = 0.14 Cov(lnX , lnY ) = M(lnX lnY )−M(lnX)M(lnY ) == 1.6272−0.744 ·2.4666 =−0.2090

b =Cov(lnX , lnY )

Var(lnX)=

M(lnX lnY )−M(lnX)M(lnY )M [(lnX)2]− [M(lnX)]2

=−0.2090

0.14=−1.4929

ln(a) = M(lnY )− bM(lnX) = 3.578 → a = e3.578 = 35.8019.

21.15

Per il calcolo del residuo quadratico medio occorre, in primo luogo, determinare i valoriassunti dal modello Y ∗ = 35.8019X−1.4929 con x = 1,2,3.

Y ∗(1) = 35.80, Y ∗(2) = 12.72, Y ∗(3) = 6.94

quindi, applicando la definizione di residuo quadratico medio

M(E2)= M

(Y −35.8019X−1.4929)2

=

1n

h

∑i=1

k

∑j=1

(y j−35.8019x−1.4929

i)2

ni j

calcolare la corrispondente media di una funzione di una variabile statistica doppia

(y j−35.8019x−1.4929

i

)2ni j y1 = 5 y2 = 15 y3 = 26

x1 = 1 (5−35.80)2 ·0 (15−35.80)2 ·0 (26−35.80)2 ·4x2 = 2 (5−12.72)2 ·0 (15−12.72)2 ·8 (26−12.72)2 ·3x3 = 3 (5−6.94)2 ·9 (15−6.94)2 ·1 (26−6.94)2 ·0

1053.75

da cuiM(E2)= 1053.75

25= 42.15.

21.16

304

7 Modello Y ∗ = aebX


lnY ∗ = lna+bX


dipendente = lna+b · esplicativa

dove dipendente = lnY e esplicativa = X .Per calcolare i parametri conviene riferirsi alle variabili trasformate

X \ lnY 1.6094 2.7081 3.25811 0 0 4 42 0 8 3 113 9 1 0 10

9 9 7 25

M(X) = 2.24 M(lnY ) = 2.4666M[X2] = 5.52 M(X lnY ) = 5.0995Var(X) = 0.5024 Cov(X , lnY ) = 5.0995−2.24 ·2.4666 =−0.4256

b =Cov(X , lnY )

Var(X)=

M(X lnY )−M(X)M(lnY )M (X2)− [M(X)]2

=−0.42560.5024

=−0.8470

ln(a) = M(lnY )− bM(X) = 4.3639 → a = e4.3639 = 78.5648.

21.17

Per il calcolo del residuo quadratico medio occorre, in primo luogo, determinare i valoriassunti dal modello Y ∗ = 78.5648e−0.8470X con x = 1,2,3.

Y ∗(1) = 33.68, Y ∗(2) = 14.44, Y ∗(3) = 6.19

quindi, applicando la definizione di residuo quadratico medio

M(E2)= M

(Y −78.5648e−0.8470X)2

=

1n

h

∑i=1

k

∑j=1

(y j−78.5648e−0.8470xi

)2ni j

e calcolando la corrispondente media di una funzione di una variabile statistica doppia

(y j−78.5786e−0.8471xi

)2 ni j y1 = 5 y2 = 15 y3 = 26x1 = 1 (5−33.68)2 ·0 (15−33.68)2 ·0 (26−33.68)2 ·4x2 = 2 (5−14.44)2 ·0 (15−14.44)2 ·8 (26−14.44)2 ·3x3 = 3 (5−6.19)2 ·9 (15−6.19)2 ·1 (26−6.19)2 ·0

729.83

da cuiM(E2)= 729.83

25= 29.19.

21.18

305

8 Modello Y ∗ = abX


lnY ∗ = lna+(lnb)X .

Si lascia per esercizio la stima dei parametri e del residuo quadratico medio

ln(b)=

Cov(X , lnY )Var(X)

=−0.42560.5024

=−0.8470 → b = e−0.8470 = 0.4287

ln(a) = M(lnY )− ln(b)

M(X) = 4.3639 → a = e4.3639 = 78.5648

M(E2)= M

(Y −78.5648 ·0.4287X)2

=

729.8325

= 29.19.

Il modello in esame è equivalente a quello precedentemente stimato; vale infatti

abX = aelnbX= aeX lnb = ae(lnb)X = aecX .

21.19

9 Modello Y ∗ = 5+bX


b = argminb

M[(Y −5−bX)2

]dM[(Y −5−bX)2

]db

= 0

M

[d (Y −5−bX)2

db

]= 0

M [2(Y −5−bX)(−X)] = 0

(è utile considerare Y −5 come termine unico)

M[−X (Y −5)+bX2]= 0

−M [X (Y −5)]+bM(X2)= 0

da cui segue

b =M [X (Y −5)]

M (X2)=

165.52

= 2.8986.

X \ Y −5 0 10 211 0 0 4 42 0 8 3 113 9 1 0 10

9 9 7 25

M[X2] = 5.52M[X(Y −5)] = 16M[(Y −5)2] = 159.48.

21.20

Per ottenere il residuo quadratico medio si applica la formula relativa ai polinomi con-siderando la trasformazione Y − 5 (in questo caso si è operata una traslazione e non si èalterata la struttura di variabilità della Y )

M(E2)= M

[(Y −5)

(Y −5− bX

)]= M

[(Y −5)2]− bM[X(Y −5)] = 159.48−2.8986 ·16 = 113.1024.

Si osserva come, essendo l’intercetta vincolata, non vale il risultato di scomposizionedella varianza: il valore del residuo quadratico medio è superiore a quello di Var(Y ). 21.21

306

10 Modello Y ∗ = 5+bX2


b = argminb

M[(

Y −5−bX2)2]

dM[(

Y −5−bX2)2]

db= 0

M

[d(Y −5−bX2

)2

db

]= 0

M[2(Y −5−bX2)(−X2)]= 0

(è utile considerare Y −5 come termine unico)

M[−X2 (Y −5)+bX4]= 0

−M[X2 (Y −5)

]+bM

(X4)= 0

da cui segue

b =M[X2 (Y −5)

]M (X4)

=29.8439.6

= 0.7535.

X \ (Y −5) 0 10 211 0 0 4 42 0 8 3 113 9 1 0 10

9 9 7 25

M[X4] = 39.6M[X2(Y −5)] = 29.84M[(Y −5)2] = 159.48.

21.22

Per ottenere il residuo quadratico medio si applica la formula relativa ai polinomi con-siderando la trasformazione Y − 5 (in questo caso si è operata una traslazione e non si èalterata la struttura di variabilità della Y )

M(E2)= M

[(Y −5)

(Y −5− bX2)]

= M[(Y −5)2]− bM[X2(Y −5)] = 159.48−0.7535 ·29.84 = 136.9956.

Si osserva come, essendo l’intercetta vincolata, non vale il risultato di scomposizionedella varianza: il valore del residuo quadratico medio è superiore a quello di Var(Y ). 21.23

307

11 Schema riassuntivomodello I II III IV V V I V II V III IX XY ∗ = f .regress. a+bX a+bX2 bX bX2 aXb aebX abX 5+bX 5+ cX2

M(E2) 14.16 15.0568 14.2113 145.25 195.96 42.15 29.19 29.19 113.10 136.996

indice 0.7967 0.7837 0.7958 non vale il teorema di scomposizione della varianzaadatt. in quanto M

(E)6= 0

21.24

Il seguente prospetto riporta gli indici di miglioramento

pegg,miglρ2 =

RMSpegg−RMSmigl

RMSpegg

per i modelli considerati

riga,colonnaρ2 I II III IV V V I V II V III IX XY ∗ = f .regress. a+bX a+bX2 bX bX2 aXb aebX abX 5+bX 5+ cX2

III 0.0596 0.0562III 0.0036IV 0.9025 0.8963 0.9022 0.7098 0.7990 0.7990 0.2213 0.0568V 0.9277 0.9232 0.9275 0.2588 0.7849 0.8510 0.8510 0.4228 0.3009V I 0.6641 0.6428 0.6628 0.3075 0.3075V II 0.5149 0.4842 0.5131 0.0000V III 0.5149 0.4842 0.5131 0.0000IX 0.8748 0.8669 0.8743 0.6273 0.7419 0.7419X 0.8966 0.8901 0.8963 0.6923 0.7869 0.7869 0.1744

21.25

308

Sezione 22Esempio stima modelli inpresenza di coppie di dati

22.1

Indice

1 Funzione di regressione 3101.1 Rapporto di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . 311

2 Modello Y ∗ = a+bX 312

3 Modello Y ∗ = a+bX2 313

4 Modello Y ∗ = bX 314

5 Modello Y ∗ = bX2 314

6 Modello Y ∗ = aXb 315

7 Modello Y ∗ = aebX 316

8 Modello Y ∗ = abX 317

9 Modelli Y ∗ = 5+bX e Y ∗ = 5+ cX2 318

10 Schema riassuntivo 318 22.2

Con riferimento alle coppie di dati

xi 3 2 1 4 2yi 6 4 4 6 5

si stimano i parametri e il residuo quadratico medio dei seguenti modelli

• funzione di regressione• Y ∗ = a+bX• Y ∗ = a+bX2

• Y ∗ = bX• Y ∗ = bX2

• Y ∗ = aXb

• Y ∗ = aebX

• Y ∗ = abX

• Y ∗ = 5+bX• Y ∗ = 5+ cX2

22.3

309

1 Funzione di regressione

i xi yi1 3 62 2 43 1 44 4 65 2 5

Somma 12 25Media 2.4 5

Rappresentazione grafica punti e medie condizionate M(Y |X)

0 1 2 3 4 5

01

23

45

67

22.4

Variabile statistica medie condizionate M(Y |X)

xi M(Y |xi) ni M(Y |X)ni M(Y |X)2ni1 4 1 4 162 4.5 2 9 40.53 6 1 6 364 6 1 6 36

Somma 5 25 128.5modalità frequenze calcolo calcolo

media momentosecondo

media delle medie condizionate

MXM(Y |X)= 255

= 5;

varianza delle medie condizionate

VarXM(Y |X)= 128.55−52 = 0.7 (varianza spiegata).

22.5

310

Variabile statistica varianze condizionate Var(Y |X)

xi Var(Y |xi) ni Var(Y |xi)ni1 0 1 02 0.25 2 0.53 0 1 04 0 1 0

Somma 5 0.5modalità frequenze calcolo

media

media varianze condizionate

MXVar(Y |X)= 0.55

= 0.1 (varianza residua).

22.6

1.1 Rapporto di correlazione

Dai calcoli effettuati nelle pagine precedenti si ha che

M(Y ) = 5 = MXM(Y |X)

Var(Y ) = VarXM(Y |X) + MXVar(Y |X)Var(Y ) = (varianza spiegata) + (varianza residua)

0.8 = 0.7 + 0.1

η2Y |X =

varianza spiegata funzione regressioneVar(Y )

η2Y |X =

VarXM(Y |X)Var(Y )

=0.70.8

= 0.875.

22.7

311

2 Modello Y ∗ = a+bX

b =Cov(X ,Y )

Var(X)=

0.81.04

= 0.7692

a = M(Y )− bM(X) = 3.1538

ρ2 =

[Cov(X ,Y )]2

Var(X)Var(Y )=

0.641.04 ·0.8

= 0.7692

M(E2)=Var

(E)= varianza residua = σ

2Y (1−ρ

2) = 0.1846.

i xi yi xiyi x2i y2

i1 3 6 18 9 362 2 4 8 4 163 1 4 4 1 164 4 6 24 16 365 2 5 10 4 25

Somma 12 25 64 34 129Media 2.4 5 12.8 6.8 25.8

M(X) M(Y ) M(XY ) M(X2)

M(Y 2)

Var(X) = M(X2)− [M(X)]2 = 1.04 Var(Y ) = M

(Y 2)− [M(Y )]2 = 0.8

Cov(X ,Y ) = M(XY )−M(X)M(Y ) = 0.8.22.8

Osservazione

•dipendente = a+b · esplicativa

b =Cov(esplicativa,dipendente)

Var(esplicativa)

a = M(dipendente)− bM(esplicativa).

• Nel caso in esame la variabile residuo E = Y − Y è caratterizzata da media nulla,quindi M

(E2)= Var

(E), vale a dire il residuo quadratico medio coincide con la

varianza dei residui.22.9

312

3 Modello Y ∗ = a+bX2

È possibile ricondursi al modello retta

dipendente = a+b · esplicativa

b =Cov

(X2,Y

)Var (X2)

=M(X2Y

)−M

(X2)

M(Y )M (X4)− [M (X2)]2

=4

27.76= 0.1441

a = M(Y )− bM(X2)= 4.0202

ρ2 =

[Cov

(X2,Y

)]2Var (X2)Var(Y )

= 0.7205

M(E2)=Var

(E)= varianza residua = σ

2Y (1−ρ

2) = 0.2236.

Anche nel caso in esame M(E)= 0 quindi M

(E2)=Var

(E).

i xi yi x2i x2

i yi x4i y2

i1 3 6 9 54 81 362 2 4 4 16 16 163 1 4 1 4 1 164 4 6 16 96 256 365 2 5 4 20 16 25

Somma 25 34 190 370 129Media 5 6.8 38 74 25.8

M(Y ) M(X2)

M(X2Y

)M(X4)

M(Y 2)

Var(X2)= M

(X4)− [M

(X2)]2 = 27.76 Var(Y ) = M

(Y 2)− [M(Y )]2 = 0.8

Cov(X2,Y

)= M

(X2Y

)−M

(X2)

M(Y ) = 4.22.10

313

4 Modello Y ∗ = bX

b =M(XY )M (X2)

=12.86.8

= 1.8824


M(E2)= M[Y (Y − bX)] = M

(Y 2)− bM(XY ) = 25.8−1.8824 ·12.8 = 1.7059.

i xi yi xiyi x2i y2

i1 3 6 18 9 362 2 4 8 4 163 1 4 4 1 164 4 6 24 16 365 2 5 10 4 25

Somma 64 34 129Media 12.8 6.8 25.8

M(XY ) M(X2)

M(Y 2)

22.11

5 Modello Y ∗ = bX2


b = argminb

M[(

Y −bX2)2]

dM[(

Y −bX2)2]

db= 0

M

[d(Y −bX2

)2

db

]= 0

M[2(Y −bX2)(−X2)]= 0

M(−X2Y +bX4)= 0

−M(X2Y

)+bM

(X4)= 0

da cui segue

b =M(X2Y

)M (X4)

=3874

= 0.5135.

22.12


M(E2)= M

[Y(Y − bX2)]= M

(Y 2)− bM

(X2Y

)= 25.8−0.5135 ·38 = 6.287.

i xi yi x2i x2

i yi x4i y2

i1 3 6 9 54 81 362 2 4 4 16 16 163 1 4 1 4 1 164 4 6 16 96 256 365 2 5 4 20 16 25

Somma 190 370 129Media 38 74 25.8

M(X2Y

)M(X4)

M(Y 2)

22.13

314

6 Modello Y ∗ = aXb


lnY ∗ = lna+b lnX


dipendente = lna+b · esplicativa.

Per calcolare i parametri conviene riferirsi alle variabili trasformate

b =Cov(lnX , lnY )

Var(lnX)=

M(lnX lnY )−M(lnX)M(lnY )M [(lnX)2]− [M(lnX)]2

= 0.3310

ln a = M(lnY )− bM(lnX) = 1.3368 → a = eln a = e1.3368 = 3.8070.

i xi yi lnxi lnyi lnxi lnyi [lnxi]2

1 3 6 1.0986 1.7918 1.9684 1.20692 2 4 0.6931 1.3863 0.9609 0.48053 1 4 0.0000 1.3863 0.0000 0.00004 4 6 1.3863 1.7918 2.4839 1.92185 2 5 0.6931 1.6094 1.1156 0.4805

Somma 3.8712 7.9655 6.5288 4.0897Media 0.7742 1.5931 1.3058 0.8179

M(lnX) M(lnY ) M(lnX lnY ) M[(lnX)2

]Var(lnX) = M

[(lnX)2

]− [M(lnX)]2 = 0.2185

Cov(lnX , lnY ) = M(lnX lnY )−M(lnX)M(lnY ) = 0.0723.22.14

Per calcolare il residuo quadratico medio

M(E2)= M

[(Y − Y

)2]=

1n

n

∑i=1

(yi− yi)2

occorre determinare i valori assunti dal modello yi = a ·(xi)b = 3.8070 ·(xi)

0.3310, essendoa= 3.8070 e b= 0.3310 le stime dei parametri a e b ottenute secondo il criterio dei minimiquadrati

i xi yi yi (yi− yi)2

1 3 6 5.4766 0.27402 2 4 4.7887 0.62213 1 4 3.8070 0.03734 4 6 6.0237 0.00065 2 5 4.7887 0.0446

Somma 0.9786Residuo Quadratico Medio = Media 0.1957

22.15

315

7 Modello Y ∗ = aebX


lnY ∗ = lna+bX


dipendente = lna+b · esplicativa.


b =Cov(X , lnY )

Var(X)=

M(X lnY )−M(X)M(lnY )M[X2]− [M(X)]2

= 0.1544

ln a = M(lnY )− bM(X) = 1.2226

a = eln a = e1.2226 = 3.3960.

i xi yi lnyi xi lnyi x2i

1 3 6 1.7918 5.3753 92 2 4 1.3863 2.7726 43 1 4 1.3863 1.3863 14 4 6 1.7918 7.1670 165 2 5 1.6094 3.2189 4

Somma 12 7.9655 19.9201 34Media 2.4 1.5931 3.9840 6.8

M(X) M(lnY ) M(X lnY ) M(X2)

Var(X) = M(X2− [M(X)]2 = 1.04Cov(X , lnY ) = M(X lnY )−M(X)M(lnY ) = 0.1606.

22.16


M(E2)= M

[(Y − Y

)2]=

1n

n

∑i=1

(yi− yi)2

occorre determinare i valori assunti dal modello yi = aebxi = 3.3960 · e0.1544xi , essendoa = 3.3960 e b = 0.1544 le stime dei parametri a e b ottenute secondo il criterio deiminimi quadrati


1 3 6 5.3964 0.36432 2 4 4.6245 0.38993 1 4 3.9629 0.00144 4 6 6.2973 0.08845 2 5 4.6244 0.1410


22.17

316

8 Modello Y ∗ = abX


lnY ∗ = lna+ lnbX


dipendente = lna+ lnb · esplicativa.


ln b =Cov(X , lnY )

Var(X)=

M(X lnY )−M(X)M(lnY )M[X2]− [M(X)]2

= 0.1544

b = eln b = e0.1544 = 1.1669

ln a = M(lnY )− ln bM(X) = 1.2226

a = eln a = e1.2226 = 3.3960.

i xi yi lnyi xi lnyi x2i

1 3 6 1.7918 5.3753 92 2 4 1.3863 2.7726 43 1 4 1.3863 1.3863 14 4 6 1.7918 7.1670 165 2 5 1.6094 3.2189 4

Somma 12 7.9655 19.9201 34Media 2.4 1.5931 3.9840 6.8

M(X) M(lnY ) M(X lnY ) M(X2)

Var(X) = M(X2− [M(X)]2 = 1.04Cov(X , lnY ) = M(X lnY )−M(X)M(lnY ) = 0.1606.

22.18


M(E2)= M

[(Y − Y

)2]=

1n

n

∑i=1

(yi− yi)2

occorre determinare i valori assunti dal modello yi = abxi = 3.3960 · 1.1669xi , essendoa = 3.3960 e b = 1.1669 le stime dei parametri a e b ottenute secondo il criterio deiminimi quadrati


1 3 6 5.3964 0.36432 2 4 4.6245 0.38993 1 4 3.9629 0.00144 4 6 6.2973 0.08845 2 5 4.6245 0.1410


Il modello in esame è equivalente a quello precedentemente stimato; vale infatti

abX = aelnbX

= aeX lnb

= ae(lnb)X

= aecX .

22.19

317

9 Modelli Y ∗ = 5+bX e Y ∗ = 5+ cX2

Si applica il criterio dei minimi quadrati per determinare l’espressione del coefficienteincognito, cfr. Sezione 21 anche per la formula del residuo quadratico medio

b =M [X (Y −5)]

M (X2)=

0.86.8

= 0.1176

M(E2)= M

[(Y −5)

(Y −5− bX

)]= M

[(Y −5)2]− bM[X(Y −5)] = 0.8−0.1176 ·0.8 = 0.7059

c =M[X2 (Y −5)

]M (X4)

=474

= 0.0541

M(E2)= M

[(Y −5)

(Y −5− cX2)]

= M[(Y −5)2]− cM[X2(Y −5)] = 0.8−0.0541 ·4 = 0.5836.

Si osserva come, in entrambi i casi, essendo l’intercetta vincolata, non vale il risultato discomposizione della varianza. Non ha senso calcolare l’indice di adattamento.

i xi yi yi−5 xi(yi−5) x2i (yi−5)2 x2

i (yi−5) x4i

1 3 6 1 3 9 1 9 812 2 4 −1 −2 4 1 −4 163 1 4 −1 −1 1 1 −1 14 4 6 1 4 16 1 16 2565 2 5 0 0 4 0 0 16

Somma 12 25 0 4 34 4 20 370Media 2.4 5 0 0.8 6.8 0.8 4 74

M(X) M(Y ) M(Y −5) M[X(Y −5)] M(X2) M

[(Y −5)2] M

[X2(Y −5)

]M[X4]

22.20

10 Schema riassuntivomodello I II III IV V V I V II V III IX XY ∗ = f .regress. a+bX a+bX2 bX bX2 aXb aebX abX 5+bX 5+bX2

M(E2) 0.1 0.1846 0.2236 1.7059 6.287 0.1957 0.1970 0.1970 0.7059 0.5836

indice 0.875 0.7692 0.7205 non vale il teorema di scomposizione della varianzaadatt. in quanto M

(E)6= 0

22.21

Il seguente prospetto riporta gli indici di miglioramento

pegg,miglρ2 =

RMSpegg−RMSmigl

RMSpegg

per i modelli considerati.

riga,colonnaρ2 I II III IV V V I V II V III IX XY ∗ = f .regress. a+bX a+bX2 bX bX2 aXb aebX abX 5+bX 5+bX2

III 0.4583III 0.5528 0.1744 0.1248 0.1190 0.1190IV 0.9414 0.8918 0.8689 0.8853 0.8845 0.8845 0.5862 0.6579V 0.9841 0.9706 0.9644 0.7287 0.9689 0.9687 0.9687 0.8877 0.9072V I 0.4890 0.0567V II 0.4924 0.0629 0.0066 0.0000V III 0.4924 0.0629 0.0066 0.0000IX 0.8583 0.7385 0.6832 0.7228 0.7209 0.7209 0.1733X 0.8286 0.6837 0.6169 0.6647 0.6624 0.6624

22.22

318

Sezione 23Regressione lineare multipla

23.1

Indice

1 Statistica descrittiva e statistica inferenziale 319

2 Modello di regressione lineare multipla 321

3 Giustificazione del modello di regressione lineare nelle variabili 322

4 Ipotesi sul modello di regressione lineare multipla 323

5 Stima dei parametri a con il criterio dei minimi quadrati 324

6 Esempio 325

7 Interpretazione dei coefficienti 326

8 Coefficienti standardizzati 327

9 Ulteriori ipotesi sul modello lineare 328

10 Modelli di regressione lineare multipla con presenza di variabili indicatrici 329

11 Misure di importanza delle variabili esplicative 341

Si suggerisce di anticipare lo studio delle Sezioni 24-27 sul Calcolo delle Probabilità allalettura della presente Sezione. 23.2

1 Statistica descrittiva e statistica inferenziale

Nelle sezioni precedenti sono stati presentati gli strumenti (indicatori statistici e modelli)che consentono di effettuare un’analisi di tipo descrittivo di un carattere (statistica uni-variata) e l’analisi congiunta di due caratteri oggetto di studio (analisi bivariata) a partiredalle osservazioni disponibili.Oggetto della statistica inferenziale è lo studio dei modelli generatori delle osservazioni. 23.3

Con riferimento all’analisi di un singolo carattere le osservazioni x1,x2, . . . ,xn, riassuntenella variabile statistica X , sono da intendere come determinazioni di una variabile casualeX .L’insieme dei dati x1,x2, . . . ,xn viene denominato campione di osservazioni da X .È possibile avvalersi di informatori (funzioni delle osservazioni) per ricercare il valore in-cognito dei parametri che caratterizzano la distribuzione di probabilità di X ; ad esempio

319

la media µ = M (X ) e la varianza σ2 =Var (X ) nel caso X sia distribuita secondo unavariabile casuale Normale. 23.4

Esempio 1 (Alcuni informatori statistici).

• La media campionaria x

x =1n

n

∑i=1

xi = M(X)

viene utilizzata come ’stima’ del valore atteso (media) µ di X .• La varianza campionaria

σ2 =

1n

n

∑i=1

(xi− x)2 =Var(X)

oppure la varianza campionaria corretta1

s2 =1

n−1

n

∑i=1

(xi− x)2 =n

n−1Var(X)

vengono utilizzate come ’stime’ della varianza σ2 di X .23.5

Con riferimento a un’analisi di regressione bivariata e allo studio della dipendenza del-la variabile casuale Y in funzione della variabile casuale X è possibile formulare unmodello del tipo

Y = g(X )+E

dove g ∈ G esprime il legame teorico tra le variabili casuali X e Y , ipotizzato apparte-nere alla classe di funzioni G .La relazione vale a meno della componente aleatoria di errore E che riassume il contributodi tutte le variabili esplicative che non sono state inserite nel modello (non essendo ca-ratterizzate da contributi sistematici); si rimanda ai paragrafi successivi per la definizionedelle proprietà di E nel contesto di un modello di regressione multipla. 23.6

La funzione g(·) può essere determinata avvalendosi del criterio dei minimi quadrati

argming

M(E 2)= argmin

gM[Y −g(X )]2

23.7

• Se g ∈ G , insieme delle funzioni che assumono valore reale, abbiamo la funzionedi regressione ’teorica’

g(X ) = M(Y |X )

mentre, in presenza di n coppie di osservazioni (xi,yi), i = 1,2, . . . ,n, riassunte inuna tabella a doppia entrata, abbiamo

argming

M(E2) = argming

1n

h

∑i=1

k

∑j=1

[y j−g(xi)]2ni j = argmin

gM[Y −g(X)]2

con soluzione la funzione di regressione cosiddetta ’empirica’

g(xi) = M(Y |xi), i = 1,2, . . . ,h

stima della funzione di regressione ’teorica’.23.8

1L’espressione della varianza campionaria corretta verrà giustificata nell’insegnamento di Statisticaapplicata.

320

• Se g ∈ L 1, insieme delle funzioni lineari (rette), il problema di minimo tra levariabili casuali X e Y

argminα,β

M[E 2]= M

[Y − (α +βX )]2

ha come soluzione i valori teorici dei parametri del modello retta Y =α+βX +E

β =Cov(X ,Y )

Var(X )e α = M (Y )− βM (X ) .

In presenza di n coppie di osservazioni (xi,yi), i = 1,2, . . . ,n, abbiamo le stime a eb rispettivamente di α e β

b =1

n−1 ∑ni=1(xi− x)(yi− y)

1n−1 ∑

ni=1(xi− x)2

=1n ∑

ni=1(xi− x)(yi− y)1n ∑

ni=1(xi− x)2

=Cov(X ,Y )

Var(X)

ea = y− bx = M(Y )− bM(X).

I residui ei = yi− a− bxi sono, invece, delle stime delle realizzazioni (non osserva-bili) della variabile casuale di errore E .

23.9

OsservazioneNella esposizione precedente si sono utilizzati simboli latini per indicare le variabilistatistiche (X ,Y,E) e simboli calligrafici per le variabili casuali (X ,Y ,E ).Tale convenzione consente l’utilizzo degli operatori M(·), Var(·) e Cov(·, ·), introdottinelle sezioni precedenti, con una semplificazione di scrittura delle formule.Si osserva come spesso venga utilizzata la simbologia latina maiuscola per indicare le va-riabili casuali e quella minuscola per le osservazioni e, a volte, la minuscola per entrambe.Con l’esperienza il lettore non troverà difficoltà nel discernere tra le diverse fattispecie.

Nell’insegnamento di Statistica applicata vengono presentate le proprietà degli stimatori estrumenti quali gli intervalli di confidenza e i test che consentono di verificare delle ipotesisul valore incognito dei parametri che caratterizzano sia le distribuzioni di probabilitàdelle variabili in gioco sia i modelli utilizzati per studiare relazioni tra le stesse. 23.10

2 Modello di regressione lineare multipla

In un modello di regressione multipla si studia la relazione tra la variabile dipendente Ye un insieme di variabili esplicative X1,X2, . . .Xk.

Definizione 2 (Modello di regressione lineare multipla). Un modello di regressione mul-tipla

Y = a0 +a1X1 +a2X2 + . . .+akXk +E (1)

si definisce lineare in quanto la variabile dipendente Y viene espressa mediante unastruttura lineare nei parametri a j ( j = 0,1, . . . ,k).

23.11

Esempio 3. Per descrivere il prezzo di mercato Y di un prodotto si possono utilizzare leseguenti variabili esplicative

X1 = costo di produzioneX2 = quantità prodotteX3 = quantità a magazzinoX4 = grado di sfruttamento degli impiantiX5 = prezzo nel periodo precedente.

321

23.12La componente di errore E , presente nella (1), variabile casuale con media nulla che siassume non correlata linearmente con i regressori X1,X2, . . . ,Xk, riassume il contribu-to di tutte le variabili esplicative che non sono state inserite nel modello (non essendocaratterizzate da contributi sistematici).

La variabile casuale E descrive, quindi, la componente di variabilità accidentale presentenella risposta Y , che non viene spiegata dalle variabili esplicative X1,X2, . . . ,Xk; ossia,l’incapacità del modello di riprodurre esattamente i valori osservati. 23.13

Nella specificazione del modello le variabili esplicative possono anche figurare in forma dipotenza. Con riferimento all’esempio precedente anche il quadrato della variabile gradodi sfruttamento degli impianti potrebbe figurare tra le variabili esplicative

X1 = costo di produzioneX2 = quantità prodotteX3 = quantità a magazzinoX4 = grado di sfruttamento degli impianti

X 24 = (grado di sfruttamento degli impianti)2

X5 = prezzo nel periodo precedente.

23.14

Il modello di regressione lineare multipla può essere anche utilizzato nell’ambito di unaregressione polinomiale

Y = a0 +a1X +a2X2 +a3X

3 + . . .+akXk +E

come approssimazione della funzione di regressione (o di un suo sviluppo in serie diTaylor di ordine k) nello studio della variabile dipendente Y in funzione della variabileesplicativa X , avendo posto

X1 = X

X2 = X 2

X3 = X 3

...

Xk = X k.

23.15

3 Giustificazione del modello di regressione lineare nel-le variabili

Si assuma che sia possibile descrivere la ’vera’ relazione che intercorre tra la variabiledipendente Y e i regressori X1,X2, . . . ,Xk, mediante una funzione g(·)

Y = g(X1,X2, . . . ,Xk)+Eg.

a meno di una componente di errore Eg = Y −g(X1,X2, . . . ,Xk).Se la funzione g(·) ammette derivate fino all’ordine d, essa può essere espressa, applican-do la formula di Taylor, come

g(X ) = a0 +∑j

a jX j + ∑j≤h

a jhX jXh + . . .+Rd

322

con Rd resto che riassume l’effetto dei termini di grado superiore a d.

Il modello più semplice consiste nel considerare termini solo lineari per le variabili espli-cative

Y = a0 +k

∑j=1

a jX j +E .

23.16

23.17

4 Ipotesi sul modello di regressione lineare multipla

In presenza della costante a0 si è soliti completare il modello di regressione linearemultipla

Y = a0X0 +a1X1 + . . .+akXk +E ,

inserendo una ulteriore variabile esplicativa X0 ≡ 1 che assume valore costante unitario. 23.18

Anche la matrice delle osservazioni (variabili statistiche Y,X1, . . . ,Xk)

i Y X1 X2 . . . Xk1 y1 x11 x12 . . . x1k2 y2 x21 x22 . . . x2k...

......

......

i yi xi1 x12 . . . xik...

......

......

n yn xn1 xn2 . . . xnk

viene, quindi, completata inserendo una colonna corrispondente alla variabile statisticaX0 che assume valore unitario per tutte le unità statistiche osservate

Yy1y2...yi...

yn

X0 X1 X2 . . . Xk1 x11 x12 . . . x1k1 x21 x22 . . . x2k...

......

...1 xi1 x12 . . . xik...

......

...1 xn1 xn2 . . . xnk

23.19

In corrispondenza del generico soggetto abbiamo

yi = a0 +a1xi1 +a2xi2 + . . .+akxik + ei,

dove xi1,xi2, . . . ,xik sono i valori assunti dalle k variabili X1,X2, . . . ,Xk.Con riferimento agli n soggetti gli elementi ei rappresentano gli scostamenti delle osser-vazioni dai valori descritti dal modello

ei = yi− (a0 +a1xi1 +a2xi2 + . . .+akxik)

e sono denominati residui. 23.20

Gli elementi ei contengono informazioni sulle determinazioni delle variabili casuali dierrore Ei (i = 1,2, . . . ,n), che caratterizzano l’aleatorietà della variabile risposta.Il valore yi della variabile risposta per il generico soggetto è determinazione di una varia-bile casuale Yi

Yi = a0 +a1xi1 +a2xi2 + . . .+akxik +Ei

323

avendo considerato prefissati i valori xi j dei regressori (cosiddetto modello a effetti fissi).La natura aleatoria della risposta Y deriva quindi dalla presenza nel modello della com-ponente accidentale E . 23.21

Le componenti di errore Ei nel modello classico di regressione lineare si assume abbianole seguenti caratteristiche

• M(Ei) = 0,• Cov(Ei,E j) = 0 (se i 6= j),• la matrice Σ di varianze e covarianze di E = (E1,E2, . . . ,En)

′

Σ=

σ2

1 σ12 . . . σ1nσ21 σ2

2 . . . σ2n...

.... . .

...σn1 σn2 . . . σ2

n

,dove σi j =Cov(Ei,E j), assume la particolare forma

Σ= σ2In

(ipotesi di sfericità degli errori o di omoschedasticità),• gli errori Ei hanno distribuzione Normale.• gli errori Ei non sono correlati con i regressori, se sono presenti regressori stocastici,

vale a dire se i valori assunti dai regressori sono determinazioni di variabili casuali.23.22

Notazione matriciale del modello di regressione lineare multiplaLe osservazioni attinenti le n unità statistiche possono essere riassunte mediante la se-guente notazione matriciale

y = Xa+ e

dove

y =

y1y2...

yn

X =

1 x11 . . . x1k1 x21 . . . x2k...

......

1 xn1 . . . xnk

a =

a0...

ak

e =

e1e2...

en

• y ed e sono vettori n-dimensionali,• a è un vettore (k+1)-dimensionale,• X è la cosiddetta matrice sperimentale.

23.23

5 Stima dei parametri a con il criterio dei minimi qua-drati

In base al criterio dei minimi quadrati si ricercano i valori a0, a1, . . . , ak dei parametria0,a1, . . . ,ak che minimizzano il residuo quadratico medio in corrispondenza alle osser-vazioni y e X

a =

a ∈ℜ

k+1 :1n

n

∑i=1

e2i =

1n

n

∑i=1yi− (a0 +a1xi1 +a2xi2 + . . .+akxik)2 = min

324

ovvero, con ovvie estensioni formali delle proprietà dell’operatore media al caso multi-variato,

a =

a ∈ℜk+1 : M

(Y −

k

∑j=0

a jX j

)2

= min

.

La soluzione del problema esiste ed è unica se rango(X) = (k+1)≤ n; essa risulta

a = (X′X)−1X′y.

23.24

6 Esempio

Esempio 4 (Consumi mensili pro-capite di gelato).

Y X1 X2n consumo kg prezzo/hg temp max F1 0.386 0.230 412 0.374 0.240 563 0.393 0.235 634 0.425 0.238 685 0.406 0.231 696 0.344 0.262 657 0.327 0.275 618 0.288 0.307 479 0.269 0.305 32

10 0.256 0.319 2411 0.286 0.324 2812 0.298 0.311 2613 0.329 0.272 3214 0.318 0.287 4015 0.381 0.249 5516 0.381 0.258 6317 0.470 0.252 7218 0.443 0.249 7219 0.386 0.277 6720 0.342 0.277 6021 0.319 0.292 4422 0.307 0.287 4023 0.284 0.332 3224 0.326 0.285 2725 0.309 0.282 2826 0.359 0.265 3327 0.376 0.265 4128 0.416 0.225 5229 0.437 0.228 6430 0.548 0.221 71

media 0.359 0.269 49.10sqm 0.065 0.031 16.146

23.25

325

Si riporta l’output dell’elaborazione, effettuata con EXCEL, del seguente modello

Y = a0 +a1X1 +a2X2 +E

OUTPUT RIEPILOGO

Statistica della regressioneR multiplo 0.8929R2 0.7972R2 corretto 0.7822Errore std 0.0307Osservazioni 30

ANALISI VARIANZAgdl SQ MQ F Significatività F

Regressione 2 0.1001 0.0500 53.0725 4.41599E-10Residuo 27 0.0255 0.0009Totale 29 0.1255

Coefficienti Errore std Stat t Signif Inf 95% Sup 95%Intercetta 0.6435 0.0874 7.3612 0.0000 0.4641 0.8228prezzo −1.2999 0.2547 −5.1035 0.0000 −1.8225 −0.7773temp 0.0013 0.0005 2.7472 0.0106 0.0003 0.0023

23.26

7 Interpretazione dei coefficienti

La stima del coefficiente ai, i = 1,2, . . . ,k, nel modello

Y = a0 +a1X1 +a2X2 + · · ·+akXk +E

rappresenta la variazione (media) attesa nella variabile risposta Y conseguente a un incre-mento unitario della corrispondente variabile Xi, ceteris paribus, ossia supponendo cherimanga immutato il livello di tutte le altre variabili X j, j 6= i, e che vi sia assenza di cor-relazione lineare tra la componente stocastica di errore E e i regressori Xi, i= 1,2, . . . ,k.2

23.27

Con riferimento all’esempio sul consumo di gelato il parametro a1 = −1.2999 nel mo-dello

Y = 0.6435−1.2999 ·X1 +0.0013 ·X2

dove:

• Y = consumo stimato di gelato• X1 = prezzo/hg• X2 = temperatura

indica che, supponendo che non si modifichi il livello della temperatura (X2), una varia-zione positiva di una unità del prezzo implica un calo nei consumi individuali di 1.2999.

23.28

2Nell’insegnamento di Statistica applicata verranno accennati i metodi per accertare che i residui del modellosoddisfino le condizioni imposte alla variabile di errore nel modello definito tra le variabili casuali.

326

Una variabile esplicativa Xi ha, quindi, influenza sulla variabile dipendente Y solo se ilcorrispondente coefficiente ai risulta diverso da 0.Secondo un approccio di carattere inferenziale i valori ai costituiscono le migliori ap-prossimazioni, secondo il criterio dei minimi quadrati, dei coefficienti incogniti ai. Cia-scun coefficiente si ritiene significativamente diverso da 0 solo se il corrispondente valoreindicato nella colonna Signif è piccolo (in genere < 0.05 = 5% o < 0.01 = 1%).Tale valore, denominato p-value, indica, informalmente, il livello di compatibilità dei daticon l’ipotesi di nullità del coefficiente ai. 23.29

8 Coefficienti standardizzati

Per confrontare i coefficienti in presenza di un modello completo, ad esempio

Y = a0 +a1X1 +a2X2 +E,

è possibile riferirsi alle stime dei coefficienti βi nel modello costruito con le variabilistandardizzate34

Y std = β1X std1 +β2X std

2 +ERRORE.

AbbiamoCoeff std = βi = ai ·

σXi

σY(i = 1,2)

mentre β0 = 0.

Coeff stdIntercetta 0prezzo −0.6238temp 0.3358

23.30

Il coefficiente standardizzato βi rappresenta la variazione (media) attesa di Y std conse-guente a una variazione unitaria di X std

i , corrispondente a una variazione di Xi pari aσXi .La corrispondente variazione assoluta di Y risulta pari a βiσY .

Nel modelloY = a0 +a1X1 +a2X2 +E

con variabili in scala originaria, il coefficiente ai corrisponde, invece, alla variazione(media) attesa di Y conseguente a una variazione unitaria di Xi. 23.31

3Si ricorda che

Y std =Y −µY

σY

X stdi =

Xi−µXi

σXi

(i = 1,2).

Vale inoltreM(Y std) = M(X std

i ) = M(Estd) = 0

eVar(Y std) =Var(X std

i ) =Var(Estd) = 1.

4Se l’intercetta risulta nulla si considera il modello definito sulle variabili

Y =YσY

e X j =X j

σ j.

327

OsservazioneNel caso un coefficiente sia riferito a una variabile dummy, cfr. Sezione 20 §4.4, ai fi-ni del calcolo della versione ’standardizzata’ del coefficiente la variabile dummy vienemantenuta nella scala originaria.In questo caso, il coefficiente standardizzato βi = ai · 1

σYrappresenta la variazione (media)

attesa di Y std conseguente al passaggio della variabile dummy dallo stato 0 allo stato 1.23.32

9 Ulteriori ipotesi sul modello lineare

Le ipotesi, complessivamente imposte al modello lineare, sono piuttosto forti. Presup-pongono, infatti, anche che:

• la correlazione lineare tra le variabili esplicative non sia troppo elevata; deve, ingenere, valere

∣∣ρXiX j

∣∣ < 0.8, i = 1, . . . ,k, j = 1, . . . ,k, i 6= j se la dimensione cam-pionaria non è elevata n' 20 e

∣∣ρXiX j

∣∣< 0.95 in presenza di una elevata dimensionecampionaria;

• il contributo dato dalle componenti non considerate esplicitamente nel modello, inquanto riassunte dalla componente di errore E, sia in media nullo.

23.33La matrice di correlazione riferita all’esempio sui consumi pro-capite di gelato risulta

consumo prezzo tempconsumo 1 −0.8605 0.7756prezzo −0.8605 1 −0.7051temp 0.7756 −0.7051 1

Abbiamo ρprezzo,temp = ρtemp,prezzo = −0.7051 < 0.8. Non sussistono, quindi, problemiriguardo all’utilizzo congiunto delle variabili esplicative prezzo e temperatura nel modellodi regressione. 23.34

OsservazioneLa condizione rango(X) = (k + 1) ≤ n, che assicura l’esistenza e l’unicità della stimasecondo il criterio dei minimi quadrati, implica che non devono sussistere relazioni lineariesatte tra le variabili esplicative.Ad esempio, nel modello non possono figurare contemporaneamente le variabili ’Età’ e’Anno di nascita’, oppure il ’Peso lordo’, il ’Peso netto’ e la ’Tara’.Tra le variabili ’Età’ e ’Anno di nascita’ vale, infatti, la relazione

Età = Anno corrente−Anno di nascitae abbiamo

ρEtà,Anno di nascita =−1.

Tra le variabili ’Peso lordo’, ’Peso netto’ e ’Tara’ vale, invece, la relazione

Peso lordo = Peso netto+Tarale variabili in gioco sono, quindi, linearmente dipendenti.

23.35Si consideri la seguente matrice di correlazione relativa allo studio della dipendenza del-la variabile Y = ’cauzione sul prezzo di aggiudicazione richiesta da una casa d’asta alvincitore’, in funzione delle seguenti variabili:

• X1 = ’costo originario di acquisto dell’opera’,• X2 = ’prezzo di aggiudicazione’,• X3 = ’costi amministrativi’,• X4 = ’guadagno della casa d’asta’,

328

• X5 = ’numero di partecipanti all’asta’,• X6 = ’anno di nascita del vincitore’,• X7 = ’età del vincitore’,• X8 = ’il vincitore ha prestato garanzie di pagamento (variabile dummy)’. 23.36

Y X1 X2 X3 X4 X5 X6 X7 X8Y 1 0.54 0.78 0.13 0.55 0.02 −0.16 0.04 −0.56X1 0.54 1 0.51 −0.02 −0.24 0.02 −0.08 0.08 −0.15X2 0.78 0.51 1 0.19 0.70 0.02 −0.00 0.00 −0.12X3 0.13 −0.02 0.19 1 0.15 −0.22 0.00 −0.00 −0.23X4 0.55 −0.24 0.70 0.15 1 0.02 0.07 −0.07 −0.00X5 0.02 0.02 0.02 −0.22 0.02 1 0.08 −0.08 0.00X6 −0.16 −0.08 −0.00 0.00 0.07 0.08 1 −1 0.38X7 0.04 0.08 0.00 −0.00 −0.07 −0.08 −1 1 −0.38X8 −0.56 −0.15 −0.12 −0.23 −0.00 0.00 0.38 −0.38 1

23.37

Tra le variabili esplicative sussistono le seguenti 2 relazioni lineari

X4 = X2−X1−X3

X7 = Anno corrente−X6.

Dalla matrice di correlazione si può evincere l’esistenza della relazione lineare tra le va-riabili X6 e X7, tra le quali vale ρX6X7 =−1. Non è, invece, possibile evincere la relazionelineare esistente tra le variabili X1,X2,X3 e X4.Occorre a tal fine considerare la matrice ridotta di dimensione 7×7, ottenuta eliminandodalla matrice di correlazione riportata sopra la riga e la colonna relative alla variabiledipendente Y e, ad esempio, la riga e la colonna relative a X6. Il determinante dellamatrice ridotta risulta essere nullo essendo la stessa caratterizzata da rango pari a 6.Si osserva che la matrice sperimentale X = [1,X1,X2,X3,X4,X5,X7,X8] ha rango 7 < 8. 23.38

10 Modelli di regressione lineare multipla con presen-za di variabili indicatrici

È possibile tenere conto in un modello di regressione (lineare) anche della presenza dieventuali variabili esplicative di tipo qualitativo?Ad esempio formulare un modello per interpretare la variabile dipendente Y = ’salario’ infunzione della variabile esplicativa G = ’genere’, o in funzione della variabile EDUC =’livello di istruzione’?La risposta immediata è di ricorrere alla costruzione della funzione di regressione consi-derando la variabile G o la variabile EDUC (ed eventualmente l’interazione tra le stesse)come variabile di raggruppamento.Esistono però anche delle soluzioni alternative illustrate nel seguente esempio. 23.39

Esempio 5. Il presente esempio numerico considera 1472 osservazioni dall’indagine sulcomportamento delle famiglie condotta dall’Unione Europea (anno 1994, Belgio). (Ver-beek M, 2008, A Guide to Modern Econometrics John Wiley)Variabili presenti nel database:

• wage: salario lordo orario in Euro• educ: livello di istruzione da 1 [basso] a 5 [alto]• exper: anni di esperienza• male: dummy, 1 se maschio

Si studia, dal punto di vista descrittivo, la variabile wage in funzione delle altre variabili. 23.40

329

GenereSi definisca una nuova variabile M a partire da G, ponendo in corrispondenza della imaunità statistica:

mi =

1 se gi = maschio0 se gi = femmina

Si consideri il seguente modello di regressione lineare per interpretare la variabile Y infunzione della variabile indicatrice (chiamata variabile dummy) M

Y = a+bM+E

23.41

Interpretazione dei coefficientib è la differenza tra lo stipendio medio dei maschi (variabile indicatrice che figura nelmodello) e lo stipendio medio delle femmine, riassunto dalla costante a.I seguenti prospetti danno, quindi, informazioni coerenti.

Funzione di regressione M(Y |gi)

indwages$MALE: 0[1] 10.26154----------------------------------------------indwages$MALE: 1[1] 11.56223

Modello lineare

Call:lm(formula = WAGE ~ MALE, data = indwages)

Residuals:Min 1Q Median 3Q Max

-8.095 -2.864 -0.999 1.818 36.013

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) 10.2615 0.1831 56.036 < 2e-16 ***MALE 1.3007 0.2351 5.532 3.74e-08 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.406 on 1470 degrees of freedomMultiple R-squared: 0.0204, Adjusted R-squared: 0.01973F-statistic: 30.61 on 1 and 1470 DF, p-value: 3.737e-08

Nella presente situazione dal momento che la variabile esplicativa nel modello lineare(M = MALE) è una variabile indicatrice consegue che

Multiple R-squared = η2Y |M.

23.42

Si osserva che il modelloY = a+bM+ cF +E

nel quale sono presenti sia la variabile indicatrice M per i maschi sia la variabile indica-trice F per le femmine:

fi =

1 se gi = femmina0 se gi = maschio

330

non può essere stimato in quanto la matrice ottenuta accostando il vettore unitario (X0) aik = 2 vettori delle osservazioni delle variabili M ed F ha rango 2 < (k+1) = 3

X0 M F1 0 11 1 0...

......

1 1 01 0 1

Vale, infattiM+F = X0 = 1.

23.43

Risultano, quindi, stimabili i modelli

Y = a+bM+E e Y = α +βF +E

nei quali è presente un numero di variabili indicatrici inferiore di una unità rispetto alnumero di categorie distinte della variabile che è stata ricodificata.Per il secondo modello abbiamo

Call:lm(formula = WAGE ~ FEMALE, data = indwages)


-8.095 -2.864 -0.999 1.818 36.013


(Intercept) 11.5622 0.1475 78.412 < 2e-16 ***FEMALE -1.3007 0.2351 -5.532 3.74e-08 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.406 on 1470 degrees of freedomMultiple R-squared: 0.0204, Adjusted R-squared: 0.01973F-statistic: 30.61 on 1 and 1470 DF, p-value: 3.737e-08

con β differenza tra lo stipendio medio delle femmine (variabile indicatrice che figura nelmodello) e lo stipendio medio dei maschi, riassunto dalla costante α . 23.44

Risulta anche stimabile il seguente modello incompleto (senza intercetta)

Y = bM+ cF +E

i cui coefficienti coincidono con gli stipendi medi per i maschi e per le femmine.

t test of coefficients:

Estimate Std. Error t value Pr(>|t|)MALE 11.56223 0.14745 78.412 < 2.2e-16 ***FEMALE 10.26154 0.18312 56.036 < 2.2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

23.45

331

Livello di istruzioneLa variabile EDUC è stata codificata con i valori interi da 1 a 5.Si può, in primo luogo, osservare come non sia opportuno considerare il seguente modellodi regressione lineare

Y = a+b ·EDUC+E

Call:lm(formula = WAGE ~ EDUC, data = indwages)


-10.569 -2.731 -0.615 1.907 34.190


(Intercept) 6.18513 0.31830 19.43 <2e-16 ***EDUC 1.44018 0.08875 16.23 <2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.1 on 1470 degrees of freedomMultiple R-squared: 0.1519, Adjusted R-squared: 0.1514F-statistic: 263.3 on 1 and 1470 DF, p-value: < 2.2e-16

23.46Il coefficiente b dovrebbe essere interpretato, ceteris paribus, come la variazione nellavariabile risposta (stima di Y ) conseguente a variazioni unitarie della variabile esplicativaEDUC (passaggi da un livello di istruzione al successivo).

Non è verosimile che l’incremento sia costante, dal momento che EDUC è un caratterequalitativo ordinato.

È opportuno costruire alcune (4) nuove variabili indicatrici L2, L3, L4, L5 con la seguentestruttura per la generica unità statistica

l2i =

1 se educi = 20 se educi 6= 2 . . . l5i =

1 se educi = 50 se educi 6= 5 .

23.47

Si osservi come il numero di variabili indicatrici che sono state costruite e che verrannoutilizzate nelle analisi successive è inferiore di una unità al numero di categorie distin-te della variabile che si è ricodificata. La presenza di tutte e 5 le variabili indicatriciL1, . . . ,L5 con

l1i =

1 se educi = 10 se educi 6= 1

non rispetterebbe, infatti, la condizione rango(X) = (k + 1). Infatti, in tal caso nellamatrice del modello avremmo 1 = L1 + . . .+L5 con 1 vettore di termini unitari. 23.48

Ciascuna variabile indicatrice dà informazioni sulla presenza, o meno, della generica cate-goria della variabile ricodificata: se, ad esempio, l3i = 1 la iesima unità statistica possiedeil terzo livello di istruzione; conseguentemente, in corrispondenza a tale unità statistica,si avrà che l1i = l2i = l4i = l5i = 0.

Si considera quindi il seguente modello di regressione lineare per interpretare la variabileY in funzione del livello di istruzione

Y = a+b2L2 +b3L3 +b4L4 +b5L5 +E.

332

23.49

Interpretazione del generico coefficiente biVariazione media nello stipendio che si ottiene passando dal livello di istruzione, che nonè stato considerato nella costruzione delle variabili indicatrici (nel caso presente EDUC =1), al livello di istruzione ricodificato mediante la variabile Li.

Si osserva che la costante a nel modello di regressione riassume la media della variabilerisposta per le unità statistiche con livello di istruzione EDUC = 1. 23.50

I seguenti prospetti danno, quindi, informazioni equivalenti.

Funzione di Regressione M(Y |educi)

indwages$EDUC: 1[1] 8.429049----------------------------------------------indwages$EDUC: 2[1] 9.21519----------------------------------------------indwages$EDUC: 3[1] 10.2032----------------------------------------------indwages$EDUC: 4[1] 11.43112----------------------------------------------indwages$EDUC: 5[1] 13.96139

Modello Lineare

Call:lm(formula = WAGE ~ L, data = indwages)


-11.144 -2.547 -0.572 1.769 33.614


(Intercept) 8.4290 0.4099 20.566 < 2e-16 ***L2 0.7861 0.4804 1.637 0.101933L3 1.7742 0.4556 3.894 0.000103 ***L4 3.0021 0.4634 6.479 1.26e-10 ***L5 5.5323 0.4670 11.847 < 2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


23.51Anche in questo caso le variabili esplicative nel modello lineare (Li, i= 2, . . . ,5) sono solovariabili indicatrici; consegue che

Multiple R-squared = η2Y |EDUC.

23.52

333

Box & Whiskers Plots

0 1

1020

3040

G

1 2 3 4 5

1020

3040

EDUC

0 1 0 2 0 3 0 4 0 5 1 1 1 2 1 3 1 4 1 5

1020

3040

G * EDUC

Dall’alto:

• salario in funzione del genere (G);• salario in funzione del livello di istruzione (EDUC);• salario in funzione delle interazioni tra genere e livello di istruzione (G : EDUC).

23.53Genere e Livello di istruzione

Funzione di Regressione M(Y |gi,educ j)

paste(indwages$MALE, indwages$EDUC): 0 1[1] 6.60001----------------------------------------------paste(indwages$MALE, indwages$EDUC): 0 2[1] 8.152744----------------------------------------------paste(indwages$MALE, indwages$EDUC): 0 3[1] 9.34604----------------------------------------------paste(indwages$MALE, indwages$EDUC): 0 4[1] 10.71929----------------------------------------------paste(indwages$MALE, indwages$EDUC): 0 5[1] 12.47561----------------------------------------------paste(indwages$MALE, indwages$EDUC): 1 1[1] 8.982574

334

----------------------------------------------paste(indwages$MALE, indwages$EDUC): 1 2[1] 9.596581----------------------------------------------paste(indwages$MALE, indwages$EDUC): 1 3[1] 10.74142----------------------------------------------paste(indwages$MALE, indwages$EDUC): 1 4[1] 12.26449----------------------------------------------paste(indwages$MALE, indwages$EDUC): 1 5[1] 14.942

23.54

Modello Lineare

Call:lm(formula = WAGE ~ MALE * L, data = indwages)


-10.059 -2.405 -0.532 1.820 32.634


(Intercept) 6.60001 0.83243 7.929 4.36e-15 ***MALE 2.38256 0.95008 2.508 0.01226 *L2 1.55273 0.95949 1.618 0.10582L3 2.74603 0.88956 3.087 0.00206 **L4 4.11928 0.88088 4.676 3.19e-06 ***L5 5.87560 0.90204 6.514 1.01e-10 ***MALE:L2 -0.93873 1.10093 -0.853 0.39398MALE:L3 -0.98718 1.03092 -0.958 0.33844MALE:L4 -0.83736 1.04059 -0.805 0.42113MALE:L5 0.08384 1.05027 0.080 0.93639---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


23.55

Y = a+gM+b2L2 +b3L3 +b4L4 +b5L5 + c12M ·L2 + c13M ·L3+

+ c14M ·L4 + c15M ·L5 +E

La previsione del salario per un soggetto maschio (M = 1) con livello di istruzione 4(L4 = 1) risulta 6.60001+2.38256+4.11928−0.83736 = 12.26449.Per una femmina con livello di istruzione 5 abbiamo 6.60001+5.87560 = 12.47561.Anche in questo caso dal momento che le variabili esplicative nel modello lineare (Li, i =2, . . . ,5) sono variabili indicatrici o variabili ottenute dal prodotto di variabili indicatriciconsegue che

Multiple R-squared = η2Y |M∗EDUC.

23.56

335

Genere e Livello di istruzione e anni di esperienza

Y = a+gM+b2L2 +b3L3 +b4L4 +b5L5+

+ c12M ·L2 + c13M ·L3 + c14M ·L4 + c15M ·L5 +d ·Exper+E

Modello Lineare

Call:lm(formula = WAGE ~ MALE * L + EXPER, data = indwages)


-13.9128 -1.8688 -0.3153 1.5982 30.3096


(Intercept) 2.094466 0.773842 2.707 0.00688 **MALE 1.808870 0.844576 2.142 0.03238 *L2 1.958518 0.852688 2.297 0.02177 *L3 4.377753 0.794609 5.509 4.25e-08 ***L4 5.974984 0.788205 7.580 6.09e-14 ***L5 7.970928 0.808374 9.860 < 2e-16 ***EXPER 0.191195 0.009666 19.780 < 2e-16 ***MALE:L2 -0.169567 0.978878 -0.173 0.86250MALE:L3 -1.034530 0.915907 -1.130 0.25887MALE:L4 -0.709085 0.924519 -0.767 0.44322MALE:L5 0.038260 0.933099 0.041 0.96730---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


23.57Si osservi che nella presente situazione la variabile

Exper = numero di anni di esperienza

figura come variabile quantitativa e non è conveniente costruire la funzione di regressionedal momento che Exper assume parecchi valori distinti.

Multiple R-squared esprime la quota di varianza di Y spiegata dal modello diregressione lineare riportato all’inizio della pagina.

Non è inoltre ragionevole assumere che l’effetto dell’esperienza sul salario sia diretta-mente proporzionale al numero di anni (interpretazione del coefficiente d).

Si potrebbe ovviare a tale inconveniente ricodificando anche la variabile esperienza conopportune variabili indicatrici che identifichino livelli bassi, medi e alti di esperienza.

Una soluzione alternativa è quella di effettuare una trasformazione non lineare dellavariabile Exper 23.58

336

Y = a+gM+b2L2 +b3L3 +b4L4 +b5L5+

+ c12M ·L2 + c13M ·L3 + c14M ·L4 + c15M ·L5 +d ln(Exper)+E

Call:lm(formula = WAGE ~ MALE * L + LNEXPER, data = indwages)


-12.8419 -1.9742 -0.2711 1.4507 30.5102


(Intercept) -1.73580 0.83950 -2.068 0.0388 *MALE 1.90487 0.83817 2.273 0.0232 *L2 1.79639 0.84623 2.123 0.0339 *L3 4.15723 0.78750 5.279 1.49e-07 ***L4 5.72400 0.78077 7.331 3.76e-13 ***L5 7.86340 0.80139 9.812 < 2e-16 ***LNEXPER 2.70650 0.13223 20.468 < 2e-16 ***MALE:L2 -0.20095 0.97155 -0.207 0.8362MALE:L3 -1.10739 0.90916 -1.218 0.2234MALE:L4 -0.78301 0.91767 -0.853 0.3937MALE:L5 -0.08071 0.92624 -0.087 0.9306---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


23.59La presente formulazione, considerando la trasformata logaritmica del numero di annidi esperienza, può consentire di tenere conto di un effetto non lineare dell’esperienza(si presuppone che gli effetti sulla variabile risposta siano legati in maniera meno cheproporzionale al crescere del numero di anni di esperienza). Infatti:

> 1:7

[1] 1 2 3 4 5 6 7

> diff(1:7)

[1] 1 1 1 1 1 1

> round(log(1:7), 4)

[1] 0.0000 0.6931 1.0986 1.3863 1.6094 1.7918 1.9459

> round(diff(log(1:7)), 4)

[1] 0.6931 0.4055 0.2877 0.2231 0.1823 0.1542

La previsione del salario per un soggetto maschio (M = 1) con livello di istruzione 4 (L4 =1) e 10 anni di esperienza risulta −1.73580+ 1.90487+ 5.72400− 0.78301+ 2.70650 ·ln(10) = 11.34201. Per una femmina con livello di istruzione 5 e 7 anni di esperienzaabbiamo −1.73580+7.86340+2.70650 · ln(7) = 11.39421. 23.60

Per ulteriori approfondimenti si veda Verbeek M (2008) A Guide to Modern EconometricsJohn Wiley, testo da cui sono stati reperiti i dati relativi all’esempio considerato. 23.61

337

Esercizio 6. Facendo riferimento ai risultati della sezione 20.4 si dia un’interpretazionedei coefficienti nel seguente output relativo a due modelli di regressione utilizzati perinterpretare il prezzo (1987) di 546 abitazioni, o il suo logaritmo, in funzione di alcunecaratteristiche, Verbeek M (2008) A Guide to Modern Econometrics John Wiley, cap. 3.

Dependent variable:

price log(price)

(1) (2)

Constant −4,038.350 7.745∗∗∗

(3,409.471) (0.216)

lot.size.in.sq.feet 3.546∗∗∗

(0.350)

log(lot.size.in.sq.feet) 0.303∗∗∗

(0.027)

number.of.bedrooms 1,832.003∗ 0.034∗∗

(1,047.000) (0.014)

number.of.full.bathrooms 14,335.560∗∗∗ 0.166∗∗∗

(1,489.921) (0.020)

dummy.there.is.central.air.conditioning 12,632.890∗∗∗ 0.166∗∗∗

(1,555.021) (0.021)

dummy.the.house.has.a.driveway 6,687.779∗∗∗ 0.110∗∗∗

(2,045.246) (0.028)

dummy.the.house.has.a.recreational.room 4,511.284∗∗ 0.058∗∗

(1,899.958) (0.026)

dummy.the.house.has.a.full.finished.basement 5,452.386∗∗∗ 0.104∗∗∗

(1,588.024) (0.022)

dummy.the.house.uses.gas.for.hot.water.heating 12,831.410∗∗∗ 0.179∗∗∗

(3,217.597) (0.044)

number.of.garage.places 4,244.829∗∗∗ 0.048∗∗∗

(840.544) (0.011)

dummy.located.in.the.preferred.neighbourhood.of.the.city 9,369.513∗∗∗ 0.132∗∗∗

(1,669.091) (0.023)

number.of.stories.excluding.basement 6,556.946∗∗∗ 0.092∗∗∗

(925.290) (0.013)

R2 0.673 0.687F Statistic (df = 11; 534) 99.968∗∗∗ 106.329∗∗∗

Note: ∗p<0.1; ∗∗p<0.05; ∗∗∗p<0.01

338

23.62Soluzione 7 (Esercizio 6). Nel seguente prospetto viene riportata l’interpretazione, cete-ris paribus, dei coefficienti di ciascuna variabile presente nel modello che spiega il prezzodell’abitazione nella sua scala originaria, supponendo che rimangano fissati i livelli ditutte le altre variabili.

variabile coefficiente interpretazione

lot size in sq.feet 3.5463il prezzo teorico per sq.feet al netto di tut-te le altre caratteristiche dell’abitazione è3.5463

number of bedrooms 1832.0035per ogni camera da letto presente nell’abi-tazione il prezzo aumenta teoricamente di1832.0035

number of full bathrooms 14335.5585per ogni stanza da bagno presente nell’a-bitazione il prezzo aumenta teoricamentedi 14335.5585

dummy there is centralair conditioning 12632.8904

se nell’abitazione è presente l’impiantodi climatizzazione centralizzato il prezzoaumenta teoricamente di 12632.8904

dummy the house has adriveway 6687.7789

se l’edificio è accessibile mediante un via-le carrozzabile il prezzo aumenta teorica-mente di 6687.7789

dummy the house has arecreational room

4511.2838se nell’abitazione è presente una stanza deigiochi il prezzo aumenta teoricamente di4511.2838

dummy the house has afull finished basement 5452.3855

se l’abitazione dispone anche di un pianoseminterrato abitabile il prezzo aumentateoricamente di 5452.3855

dummy the house usesgas for hot water heating 12831.4063

se il riscaldamento dell’acqua calda vie-ne prodotto mediante un impianto agas il prezzo aumenta teoricamente di12831.4063

number of garage places 4244.829per ogni posto macchina presente nell’abi-tazione il prezzo aumenta teoricamente di4244.829

dummy located in the pre-ferred neighbourhood ofthe city

9369.5132se l’abitazione è situata in zona residen-ziale il prezzo aumenta teoricamente di9369.5132

number of stories exclud-ing basement 6556.9457

per ogni piano (escluso il seminterrato)di cui è composta l’abitazione il prezzoaumenta teoricamente di 6556.9457

339

Nel seguente prospetto viene riportata l’interpretazione, ceteris paribus, dei coefficienti diciascuna variabile presente nel modello che spiega il logaritmo del prezzo dell’abitazione,supponendo che rimangano fissati i livelli di tutte le altre variabili.

variabile coefficiente interpretazione

log(lot size in sq.feet) 0.3031se la superficie aumenta dell’1% allora il prezzoaumenta teoricamente dello 100 · (e0.3031·ln(1.01)−1)% = 0.302% (circa dello 0.3031%)

number of bedrooms 0.0344in presenza di una camera da letto aggiuntiva ilprezzo aumenta teoricamente del 100 · (e0.0344−1)% = 3.5% (circa del 3.44%)

number of full bathrooms 0.1658in presenza di una stanza da bagno aggiuntiva ilprezzo aumenta teoricamente del 100 · (e0.1658−1)% = 18.03% (circa del 16.58%)

there is central air condi-tioning (dummy) 0.1664

se è presente l’impianto di climatizzazione centra-lizzato il prezzo aumenta teoricamente del 100 ·(e0.1664−1)% = 18.1% (circa del 16.64%)

the house has a driveway(dummy) 0.1102

se l’edificio è accessibile mediante un viale car-rozzabile il prezzo aumenta teoricamente del 100 ·(e0.1102−1)% = 11.65% (circa dell’11.02%)

the house has a recreation-al room (dummy) 0.058

se nell’abitazione è presente una stanza dei giochiil prezzo aumenta teoricamente del 100 · (e0.058−1)% = 5.97% (circa del 5.8%)

the house has a full fin-ished basement (dummy) 0.1045

se l’abitazione dispone anche di un piano semin-terrato abitabile il prezzo aumenta teoricamen-te del 100 · (e0.1045 − 1)% = 11.02% (circa del10.45%)

the house uses gas for hotwater heating (dummy) 0.179

se il riscaldamento dell’acqua calda viene prodot-to mediante un impianto a gas il prezzo aumen-ta teoricamente del 100 · (e0.179 − 1)% = 19.6%(circa del 17.9%)

number of garage places 0.048in presenza di un posto macchina aggiuntivo ilprezzo aumenta teoricamente del 100 · (e0.048 −1)% = 4.92% (circa del 4.8%)

located in the preferredneighbourhood of the city(dummy)

0.1319se l’abitazione è situata in zona residenziale ilprezzo aumenta teoricamente del 100 · (e0.1319−1)% = 14.1% (circa del 13.19%)

number of stories exclud-ing basement 0.0917

se l’abitazione è disposta su più piani; in pre-senza di un piano supplementare (escluso il se-minterrato) il prezzo aumenta teoricamente del100 · (e0.0917−1)% = 9.6% (circa del 9.17%)

OsservazioneSi ricorda come, in base allo sviluppo in serie di Taylor, si ottiene una buona approssi-mazione di ex con (1+ x) solo in un intorno dell’origine.

340

Abbiamo infatti |ex− (1+ x)| < 0.01, corrispondente a uno scostamento massimo di unpunto percentuale, solo se −0.1448 < x < 0.1382.

OsservazioneSi fa presente che i due indici di adattamento R2 riportati nell’output non sono confron-tabili in quanto il secondo modello è riferito alla variabile prezzo trasformata in scalalogaritmica.

23.63

11 Misure di importanza delle variabili esplicative

Con riferimento a un modello di regressione lineare completo (di intercetta)

Y = a0 + f (X1,X2, . . . ,Xk)+E,

con f (·) funzione lineare nelle variabili esplicative X1,X2, . . . ,Xk, eventualmente ricodifi-cate mediante variabili indicatrici se qualitative, una misura del contributo di ciascun re-gressore Xi nella spiegazione della variabile dipendente Y , al netto di tutte le altre variabiliincluse nel modello, è data dal seguente indice di miglioramento

constr, f ullρ2 =

RMSconstr−RMS f ull

RMSconstr,

ottenuto considerando come full il modello con tutte le variabili esplicative e come con-strained il modello senza la variabile Xi (ovvero l’insieme delle variabili indicatrici uti-lizzate per codificare le categorie di Xi nel caso questa sia una variabile qualitativa).

23.64

Si osserva la struttura nidificata (nested) dei modelli in gioco, nel senso che il modellofull, che ha associato il residuo quadratico medio più piccolo, contiene quello constrained,con residuo quadratico medio più grande. 23.65

OsservazioneLa valutazione del contributo ’marginale’ di ciascun regressore può essere effettuata tra-mite l’indicatore constr, f ullρ

2 solo quando non figurano effetti di interazione nel modello,vale a dire non sono presenti variabili ottenute come prodotto di altre variabili, come av-viene, ad esempio, nel modello che include le variabili Genere, Livello di istruzione e laloro interazione negli esempi presentati nel §10.

In presenza di interazioni tra le variabili in gioco, ai fini della valutazione dell’impattodelle variabili possono essere utilizzate le misure di importanza presentate in GrömpingU 2006 Relative Importance for Linear Regression in R: The Package relaimpo. Journalof Statistical Software, 17(1), 1-27. 23.66

L’indicatore constr, f ullρ2 è anche noto in letteratura come coefficiente di correlazione par-

ziale e rappresenta una possibile misura di effect size del regressore. In tal senso, un valoredi constr, f ullρ

2 pari a 0.02 può, indicativamente, essere associato a un effetto di entità lieve,0.15 a un effetto di entità media e 0.35 a un effetto di grande entità, come suggerito daCohen J 1989 Statistical Power Analysis for the Behavioral Sciences, Lawrence ErlbaumAssociates.

OsservazioneAnche il quadrato β 2

i del coefficiente standardizzato βi rappresenta una possibile misuradi effect size della singola variabile esplicativa, in alternativa a constr, f ullρ

2.In effetti, constr, f ullρ

2 può anche essere utilizzato per valutare l’importanza marginale diun gruppo di variabili esplicative, al netto delle altre variabili nel modello. A tal fine

341

è sufficiente considerare come full il modello con tutte le variabili esplicative e comeconstrained il modello senza le variabili di cui si vuole valutare l’importanza.Come esempio, si pensi all’insieme di variabili indicatrici utilizzate per codificare unavariabile qualitativa. Mediante l’utilizzo di constr, f ullρ

2 è possibile valutare l’importanzacomplessiva della variabile qualitativa e non solo delle sue singole categorie.

23.67

OsservazioneLa misura constr, f ullρ

2 può essere espressa in funzione degli indici di adattamento

R2 = 1− RMSVar(Y )

dei modelli in gioco. Vale infatti

constr, f ullρ2 =

RMSconstr−RMS f ull

RMSconstr=

=

RMSconstr−RMS f ullVar(Y )

RMSconstrVar(Y )

=

=

RMSconstrVar(Y ) −

RMS f ullVar(Y )

1−R2constr

=

=1−R2

constr− (1−R2f ull)

1−R2constr

=

=R2

f ull−R2constr

1−R2constr

.

23.68Si riportano le misure di effect size relative ai coefficienti dei modelli di regressione pre-sentati nell’Esercizio 6 per descrivere il prezzo di un’abitazione in funzione di alcunecaratteristiche.

eff.size (1) eff.size (2)lot.size.in.sq.feet 0.1610log(lot.size.in.sq.feet) 0.1945number.of.bedrooms 0.0057 0.0108number.of.full.bathrooms 0.1478 0.1107dummy.there.is.central.air.conditioning 0.1100 0.1023dummy.the.house.has.a.driveway 0.0196 0.0278dummy.the.house.has.a.recreational.room 0.0104 0.0092dummy.the.house.has.a.full.finished.basement 0.0216 0.0416dummy.the.house.uses.gas.for.hot.water.heating 0.0289 0.0302number.of.garage.places 0.0456 0.0317dummy.located.in.the.preferred.neighbourhood.of.the.city 0.0557 0.0596number.of.stories.excluding.basement 0.0860 0.0900

Si osserva come le variabili ’dimensione del lotto’ e ’numero di bagni’ abbiano, al nettodelle altre variabili esplicative, un’importanza più elevata. 23.69

342

Sezione 24Calcolo delle probabilità (1)

24.1

Indice

1 La probabilità 343

2 Oggetto della probabilità 345

3 Relazioni tra eventi 346

4 Operazioni elementari 347

5 Funzione di probabilità 349

6 Impostazione assiomatica 349

7 Teoremi calcolo probabilità 350

8 Elicitazione e interpretazione di P(A): altri approcci 3528.1 Approccio classico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3528.2 L’approccio frequentista . . . . . . . . . . . . . . . . . . . . . . . . . . 3538.3 Lo schema della scommessa . . . . . . . . . . . . . . . . . . . . . . . . 354

9 Gioco equo 355

10 Probabilità e Odds 357

11 Odds e logit 357 24.2

1 La probabilità

Nelle sezioni precedenti si sono trattate le mutabili, le serie e le seriazioni statistiche chesono riferite a un campione di osservazioni.Considereremo, ora, i corrispondenti modelli teorici per l’universo/popolazione

xi ϕix1 ϕ1x2 ϕ2...

...xh ϕh

ϕi = frequenze relative teoriche

Tali modelli descrivono i meccanismi generatori delle osservazioni che costituiscono ilcampione e sono rappresentati dalle cosiddette mutabili, variabili casuali. 24.3

343

Esempio 1 (Lancio di una moneta regolare). In 40 lanci di una moneta non truccata sisono osservate 25 teste e 15 croci.

xi ni fiT 25 0.625C 15 0.375

Da un punto di vista teorico, essendo la moneta regolare, ci si attende la stessa frequenzadi teste e croci. Nella corrispondente mutabile casuale, a entrambe le categorie T e C èassociata la medesima probabilità 0.5.

xi piT 0.5C 0.5

Problema. Come definire la probabilità? 24.4

Definizione 2 (Esperimento deterministico). Si definisce deterministico un esperimentoil cui risultato non è affetto da variabilità accidentale, è prevedibile con certezza.

Definizione 3 (Esperimento aleatorio). Si definisce aleatorio un esperimento il cui risul-tato è casuale, non è prevedibile con certezza.

Un esperimento aleatorio può, quindi, dare luogo a 2 o più risultati.Per descrivere le manifestazioni di un esperimento aleatorio parleremo di eventi.

Definizione 4 (Probabilità). È la misura del presentarsi di un evento; una valutazione sulfatto che un esperimento aleatorio dia luogo a un certo evento.

ObiettivoCostruire modelli teorici che permettano di calcolare la probabilità di tutti gli eventisperimentabili.

24.5

1-12

13-24

25-36

1-18

19-36

PAIR

IMPAIR

0 00

1 2 3

4 5 6

7 8 9

10 11 12

13 14 15

16 17 18

19 20 21

22 23 24

25 26 27

28 29 30

31 32 33

34 35 36

24.6

344

2 Oggetto della probabilità

Definizione 5 (Eventi elementari).

e1,e2, . . . ,ei, . . .

Risultati (manifestazioni) possibili del fenomeno aleatorio

Ad esempio:1,2,3, . . . ,36,0,00

24.7

Definizione 6 (Eventi generici).

A1,A2, . . . ,Ai, . . .

• Insiemi di eventi elementari• Insiemi di possibili modalità del fenomeno di specifico interesse

Ad esempio:

• nel gioco della roulette

– pari = 2∪4∪ . . .∪34∪36 = 2,4, . . . ,34,36,– dispari, rosso, nero, 1-12, 13-24, 25-36, . . .

– si puntano un gettone sul pari e un gettone sul rosso

2,4, . . . ,34,36∪1,3, . . . ,34,36

– si puntano un gettone su 1-12 e un gettone su dispari

– i numeri 8, 10, 11 si possono ottenere come intersezione degli insiemi: 7-12e nero

7,8,9,10,11,12∩2,4,6,8,10,11,13,15, . . . ,31,33,35

• nel lancio di un dado

– risultato pari = 2,4,6,– risultato dispari = 1,3,5.

24.8

Definizione 7 (Classi o famiglie di eventi). Collezioni di insiemi definite attraverso unaregola di appartenenza

Ad esempio:

• tutti gli eventi su cui è possibile puntare alla roulette24.9

Definizione 8 (Eventi particolari).

• L’insieme vuoto ∅ (evento impossibile)• Lo spazio probabilistico di tutti gli eventi elementari Ω (evento certo) o spazio

campionario dei possibili risultati

Ad esempio:

• scommessa sul numero 52 =∅• Ω = 1,2,3, . . . ,36,0,00.

24.10

345

3 Relazioni tra eventi

Definizione 9 (Eguaglianza).A = B

A e B hanno gli stessi elementi

Ω

B A

Ω

B A

24.11

Definizione 10 (Appartenenza).A⊂ B

gli elementi di A sono anche elementi di B(ma non necessariamente viceversa)

Ω

AB

24.12

Definizione 11 (Inclusione o contenimento).

A⊃ B

346

Ω

BA

24.13

Definizione 12 (Disgiunzione o Incompatibilità).

A∩B =∅

A e B non hanno elementi in comuneΩ

B A

24.14

4 Operazioni elementari

Definizione 13 (Insieme Unione).A∪B

i cui elementi appartengono ad A oppure a B

Ω

A B

347

24.15

Definizione 14 (Insieme Intersezione).

A∩B = AB

i cui elementi appartengono sia ad A che a B

Ω

Insieme intersezione tra A e B:

area scura comune ad A e B

A B

24.16

Definizione 15 (Insieme Differenza).

A−B

i cui elementi appartengono ad A ma non a B. Quindi A−B = A∩ B

Ω

A−B= area bianca nell'insieme A

A B

24.17

Definizione 16 (Insieme Complementare). A = Ω−A i cui elementi non appartengonoad A

Ω

A

A

348

24.18

Esempio 17 (Lancio del dado).

Ω = , , , , ,

A = dispari= 1,3,5 A = 2,4,6 A∩ A =∅ A∪ A = Ω.24.19

5 Funzione di probabilità

È una funzione di insieme, una legge che permette di calcolare P(A) per ogni eventoA⊂Ω.

Ipotesi di lavoroIndicata con S (Ω) la classe di tutti i sottoinsiemi di Ω (algebra degli eventi)(compresi ∅ e Ω)

assiomi del calcolo delle probabilità+

probabilità eventi elementari↓

calcolo di P(A) ∀A ∈S (Ω)

P : S (Ω)→ℜ

(tratteremo solo il caso di Ω finito) 24.20

6 Impostazione assiomatica

Definizione 18 (Impostazione assiomatica di Kolmogorov). Siano Ω lo spazio degli even-ti elementari ed S (Ω) la classe di tutti i sottoinsiemi di Ω.Una funzione P(·) definita su S (Ω) si definisce funzione di probabilità se soddisfa iseguenti assiomi:

1. P(A)≥ 0, ∀A ∈S (Ω)2. P(Ω) = 13. Data una sequenza di eventi A1,A2, . . . ,An a coppie disgiunti (Ai∩A j =∅) vale

P

(n⋃

i=1

Ai

)=

n

∑i=1

P(Ai).

Osservazione1) e 2) vincoli alla funzione misura 3) condizione operativa

24.21

OsservazioneDefinita una legge

P = P(ei) (∀ei ⊂Ω)

che soddisfa gli assiomi possiamo calcolare

P(A) (∀A⊂Ω).

Infatti, ogni evento A è interpretabile come unione di un certo numero di eventi elementari(disgiunti)

A =k⋃

i=1

ei

349

quindi

P(A) =k

∑i=1

P(ei).

Altre volte risulta più agevole non ricorrere alle P(ei) ma usare dei teoremi che derivanodai postulati. 24.22

7 Teoremi calcolo probabilità

Teorema 19.P(A∪B) = P(A)+P(B)−P(A∩B)

Ω

A B

P(A∩B) = 0 solo se A e B sono disgiunti 24.23

Teorema 20.P(A−B) = P(A)−P(A∩B)

Ω

A−B= area bianca nell'insieme A

A B

P(A∩B) = P(B) solo se B⊂ A 24.24

350

Teorema 21.P(A) = 1−P(A)

Ω

A

A

24.25

Dimostrazione. Valgono le seguenti relazioni

A∪ A = Ω e P(A∪ A) = P(Ω).

In base al secondo assioma abbiamo P(Ω) = 1 e, dal momento che A e A sono disgiunti,per il terzo assioma vale

P(A∪ A) = P(A)+P(A).

QuindiP(Ω) = 1 = P(A)+P(A),

da cui segue la tesi.24.26

Teorema 22.P(∅) = 0

Teorema 23. Se A⊂ B allora P(A)≤ P(B) (monotonicità)24.27

OsservazioneSe gli eventi A e B sono incompatibili allora

P(A∪B) = P(A)+P(B).

È il cosiddetto principio delle probabilità totali, postulato base dell’impostazione classicadella probabilità.

OsservazioneDall’ultimo teorema segue che P(A)≤ 1 essendo A⊂Ω

24.28

Esercizio 24 (T 168, 19.02.1999, 4). La probabilità che si verifichi l’evento A e non siverifichi l’evento B è pari a 0.12.La probabilità che si verifichi l’evento B è pari a 2 volte la probabilità che si verifichil’evento A.La probabilità che si verifichi l’evento A o non si verifichi l’evento B è pari a 0.68.

1. Calcolare la probabilità che si verifichi l’evento A e la probabilità che si verifichil’evento B.

24.29

351

8 Elicitazione e interpretazione di P(A): altri approcci

Si considerano i seguenti schemi che consentono l’elicitazione di P(A) e la sua interpre-tazione dal punto di vista operativo:

• approccio classico (Laplace/Pascal)• approccio frequentista (limite del rapporto di frequenze)• schema della scommessa (De Finetti)

24.30

8.1 Approccio classico

Definizione 25 (Formula classica di Laplace/Pascal). Se lo spazio probabilistico Ω

• è costituito da un numero finito n di eventi elementarie

• gli eventi elementari sono ’simmetrici’ (equiprobabili)

la probabilità del generico evento A⊂Ω può essere definita come

P(A) =# casi favorevoli ad A

# casi possibili=

# eventi elementari ∈ An

Possibili applicazioni:

• giochi d’azzardo• lotto e tombola

24.31

Dimostrazione.Ω = e1,e2 . . . ,en

Se gli eventi ei sono simmetrici (equiprobabili) vale

P(ei) = costante = p =?

Per il secondo e terzo postulato

P(Ω) = P

(n⋃

i=1

ei

)=

n

∑i=1

P(ei) =n

∑i=1

p = np = 1

quindi

p =1n

eP(A) = ∑

i:ei∈A

1n=

nA

n.

24.32

Esempio 26. Calcolare la probabilità che estraendo una carta da un mazzo di 52 carte siottenga una carta di fiori.Siamo interessati all’evento

F = carta di fiori

Con riferimento allo spazio probabilistico Ω formato dalle 52 carte

A♥ 2♥ 3♥ 4♥ 5♥ 6♥ 7♥ 8♥ 9♥ 10♥ J♥ Q♥ K♥A♦ 2♦ 3♦ 4♦ 5♦ 6♦ 7♦ 8♦ 9♦ 10♦ J♦ Q♦ K♦A♣ 2♣ 3♣ 4♣ 5♣ 6♣ 7♣ 8♣ 9♣ 10♣ J♣ Q♣ K♣A♠ 2♠ 3♠ 4♠ 5♠ 6♠ 7♠ 8♠ 9♠ 10♠ J♠ Q♠ K♠

352

P(F) =1352

= 0.25

Con riferimento allo spazio probabilistico Ω formato dai 4 semi (simmetrici, essendociascuno costituito da 13 carte)

♥ ♦ ♣ ♠ P(F) =14= 0.25

24.33

Esempio 27. Calcolare la probabilità che la somma dei punteggi ottenuti nel lancio di 2dadi (equilibrati) sia almeno pari a 11.

Siano D1 e D2 i punteggi ottenuti con i due dadi ed S = D1 +D2 la loro somma.Lo spazio probabilistico Ω è costituito da tutte le possibili coppie di risultati

0 1 2 3 4 5 6 7

01

23

45

67

0 1 2 3 4 5 6 7

01

23

45

67

P(S≥ 11) = P(D1 +D2 ≥ 11) =336

= 0.0833.24.34

L’assegnazione della funzione di probabilità in base all’approccio classico può essereutilizzata se sono verificate le seguenti due assunzioni

• lo spazio probabilistico Ω consta di un numero finito di eventi• simmetria degli eventi elementari

Come è possibile operare se le precedenti ipotesi non sono verificate?Si pensi, ad esempio, alla probabilizzazione dei seguenti eventi:

• evento testa nel caso di una moneta non equilibrata• in una partita di calcio disputata tra le squadre a e b vinca la squadra a

24.35

8.2 L’approccio frequentista

Definizione 28 (Esperimento aleatorio ripetibile). Si definisce ripetibile un esperimentoaleatorio che può essere ripetuto nelle stesse condizioni sperimentali.

Definizione 29 (Legge empirica del caso). In presenza di un esperimento aleatorio ripe-tibile ∀A ∈S (Ω) esiste un valore oggettivo P(A)

limN→∞

NA

N= P(A).

dove

• N è il numero di volte che si è replicato l’esperimento,• NA è il numero di volte che l’esperimento ha dato luogo, nelle N prove, a un risultato

in A.

353

24.36

OsservazioneLa frequenza relativa di successo NA

N (detta anche rapporto di frequenze) soddisfa gliassiomi.P(A) è definito come limite del rapporto di frequenze. Tale limite costituisce un approcciooggettivo alla elicitazione della probabilità.

24.37

Limite in senso matematico

limN→∞ f (N) = p

∀ε > 0, ∃N0(ε) : se N > N0 allora

| f (N)− p|< ε

0.3

0.4

0.5

0.6

0.7

0 200 400 600 800 1000

Limite in senso probabilistico

limN→∞ f (N) = p

∀ε > 0, ∃N0(ε,s) : se N > N0 allora| f (N)− p|< ε

N0 dipende anche dalla successiones di esperimenti.

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70

24.38

8.3 Lo schema della scommessa

Si tratta di uno approccio soggettivo all’elicitazione della probabilità.Può essere applicato anche in presenza di esperimenti non necessariamente ripetibili.Può dare luogo a valutazioni soggettive differenti.

Definizione 30. ∀A ∈ S (Ω) la probabilità P(A) è quantificata come la posta p che undato soggetto, che partecipa a una scommessa coerente, è disposto a pagare

• per riscuotere 1 se A si verifica,• per riscuotere 0 se A non si verifica.

La scommessa è coerente se non dà luogo ad aspettative non nulle di guadagno o diperdita.

Per garantire la coerenza la valutazione non deve cambiare se l’individuo passa da scom-mettitore a banco.

Una valutazione coerente soddisfa gli assiomi. 24.39

354

Imporre che la scommessa sia coerente implica che il soggetto non sottovaluti o soprav-valuti, mediante la dichiarazione di una posta p0, il valore p della probabilità che supponeessere quello vero.Si consideri, al riguardo, un evento A e siano

• p = P(A) il valore della probabilità dell’evento A secondo l’opinione del soggetto• p0 il valore dichiarato effettivamente dal soggetto (posta).

È possibile calcolare il valore atteso del guadagno, X , associato alla scommessa comemedia tra l’opposto di p0, posta che il soggetto ha dichiarato di essere disposto a pagareper partecipare al gioco, e il guadagno 1− p0 che il soggetto realizza nel caso si verifichil’evento A. 24.40

Nel calcolo del valore atteso (media) occorre tenere conto delle probabilità 1− p e p,ipotizzate come vere dal soggetto con riferimento agli eventi A e A.

evento posta vincitaguadagno (xi)vincita−posta P(X = xi) xi ·P(X = xi)

A p0 0 −p0 1− p −p0(1− p)A p0 1 1− p0 p (1− p0)p

1−p0 + p0 p+ p− p0 p =

= p− p0

Si osserva che

• dichiarando p0 = p, l’aspettativa di guadagno o perdita è nulla,• dichiarando p0 < p il soggetto sta effettuando un arbitraggio, in quanto si aspetta

di realizzare un guadagno pari a p− p0,• il soggetto non dichiarerà mai p0 > p; in tal caso si aspetterebbe, infatti, una perdita

pari a |p0− p|.24.41

Imponendo al soggetto il vincolo, che può avere luogo in qualunque momento del gioco,di dover scambiare la sua posizione con quella del banco, egli non dichiarerà come postap0 un valore diverso dalla probabilità p corrispondente alla sua opinione. 24.42

9 Gioco equo

Il concetto di gioco equo è strettamente legato a quello di scommessa coerente.

Definizione 31 (Gioco equo). Un gioco si definisce equo se non dà luogo a guadagni operdite certi, ovvero se il guadagno ’medio’ del giocatore è nullo.

OsservazioneUna scommessa su un evento A, per il quale P(A) = p, corrisponde a un gioco equo sepuntando p si vince 1 ovvero se puntando 1 si vince 1/p.

Abbiamo, infatti,

xi = vincita−posta P(X = xi) xi ·P(X = xi)−1 1− p −(1− p)

1/p−1 p 1− p1 0

e M(X) = E(X) = 0. 24.43

355

Esempio 32 (Lancio di una moneta equilibrata). I risultati possibili sono: T = testa e C =croce:

• in base all’impostazione classica si tratta di eventi elementari simmetrici:

P(T ) = P(C) = 0.5;

• in base all’impostazione soggettiva un soggetto razionale è disposto a scommettere,ad esempio, sull’evento T 0.5 unità per ricevere 1 (il rapporto tra posta e vincita èdi 1 a 2, ovvero punto 1 per ricevere 2);

quindi: posta = 1 vincita =

0 se risultato = T2 se risultato = T

risultato xi P(X = xi) xi ·P(X = xi)T −1 0.5 −0.5T 1 0.5 0.5

1 0

dove xi = guadagno = vincita − posta

M(X) = E(X) = 0

Il gioco è equo: non dà, infatti, luogo a guadagni o perdite certi.24.44

Si considerano con riferimento a 4 possibili sequenze di 1000 replicazioni dell’esperi-mento ripetibile ’lancio di una moneta equilibrata’

• l’andamento della convergenza della frequenza di T = testa (grafici A)• la corrispondente evoluzione della situazione patrimoniale di un ipotetico giocatore

che scommette su T (grafici B)

A

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70 B

0 200 400 600 800 1000

−60

−30

020

50

A

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70 B

0 200 400 600 800 1000

−60

−30

020

50

A

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70 B

0 200 400 600 800 1000

−60

−30

020

50

A

0 200 400 600 800 10000.30

0.40

0.50

0.60

0.70 B

0 200 400 600 800 1000

−60

−30

020

50

Si dimostra (Teorema della rovina del giocatore) che la situazione di pareggio si verifica inmaniera stabile solo al divergere del numero di lanci e che le perdite possibili potrebberosuperare qualsiasi disponibilità finanziaria finita. 24.45

Esempio 33 (Gioco della roulette). I risultati possibili sono i simboli 0,00,1,2,3, . . . ,36:

• in base all’impostazione classica:

P(0) = P(00) = P(1) = . . .= P(36) =1

38;

• in base all’impostazione soggettiva un soggetto razionale è disposto a scommetteresul generico simbolo 1

38 unità per ricevere 1 (il rapporto tra posta razionale e vincitaè di 1 a 38);

356

In caso di uscita del simbolo su cui è stata effettuata una scommessa unitaria si ottieneperò solo una somma pari a 36 e il guadagno risulta, quindi, pari a 35:

xi = vincita−posta P(X = xi) xi ·P(X = xi)

−1 3738 − 37

3835 1

383538

1 − 238 =−0.05263

M(X) = E(X)< 0

Il gioco non è equo: ci si attende ’in media’ una perdita certa.24.46

10 Probabilità e Odds

Si ricorda che una scommessa su un evento A, per il quale P(A) = p, corrisponde a ungioco equo se puntando 1 si vince 1/p ovvero se puntando p si vince 1.Abbiamo, infatti,

xi = vincita−posta P(X = xi) xi ·P(X = xi)

−p 1− p −p+ p2

1− p p p− p2

1 0

e M(X) = E(X) = 0. 24.47

Si riprende, nel contesto del calcolo delle probabilità e del gioco equo, la definizione diodds introdotta nella Sezione 15.

Definizione 34 (Odds). Con riferimento a un evento A si definisce odds il rapporto traP(A) = p e P(A) = 1− p

P(A)P(A)

=p

1− p.

L’odds può essere interpretato, in presenza di un gioco equo, come il rapporto tra la posta,p, e il guadagno, 1− p, che si ottiene nel caso si verifichi l’evento A. 24.48

11 Odds e logit

Spesso gli odds vengono utilizzati, ad esempio in ambito medico, assicurativo od econo-mico, come misura del rischio di incorrere in un determinato evento A, ad esempio:

• ’essere affetti da una patologia’,• ’verificarsi di una tipologia di sinistro’• ’appartenere allo status neet’

24.49Una seconda importante misura utilizzata per quantificare il rischio in oggetto è il cosid-detto logit, logaritmo dell’odds.

Definizione 35 (Logit). Con riferimento a un evento A si definisce logit il logaritmo delrapporto tra P(A) = p e P(A) = 1− p

ln(

P(A)P(A)

)= ln

(p

1− p

).

357

24.50Il logit può essere utilizzato come variabile dipendente in un modello di regressione li-neare al fine di studiare la relazione tra il rischio di incorrere nell’evento A e una o più va-riabili esplicative. In questa situazione il modello di regressione lineare viene denominatomodello di regressione logistica.

OsservazioneNon è possibile considerare come variabile dipendente in modello di regressione linearela probabilità p di incorrere nell’evento in quanto assume valori limitati all’insieme [0,1].È invece lecito utilizzare il logit in quanto assume valori nell’intervallo (−∞,+∞).

Si rimanda al corso di Statistica applicata per ulteriori approfondimenti sul modello diregressione logistica. 24.51

L’odds ha il seguente andamento al variare della probabilità P(A) = p

0.0 0.2 0.4 0.6 0.8 1.0

010

2030

4050

p

p

1 − p

24.52

Il logit ha il seguente andamento al variare della probabilità P(A) = p

0.0 0.2 0.4 0.6 0.8 1.0

−8

−7

−6

−5

−4

−3

−2

−1

01

23

45

67

8

p

log p

1 − p

24.53

358


25.1

Indice

1 La probabilità condizionata P(A|B) 359

2 La probabilità composta 361

3 Indipendenza stocastica 3623.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

4 La probabilità composta (caso generale) 3634.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3634.2 Le permutazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3644.3 Le combinazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3654.4 Il coefficiente binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . 3664.5 Combinazioni multiple e coefficiente multinomiale . . . . . . . . . . . . 368

5 Legge delle probabilità totali 3685.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369

6 Formula di Bayes 370

7 I grafi di probabilità 3727.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 25.2

1 La probabilità condizionata P(A|B)In presenza di due eventi A e B

Ω

A B

359

siamo interessati a calcolare la probabilità dell’evento condizionato A|B, ossia la probabi-lità che si verifichi l’evento A a condizione che B si sia verificato.L’evento B deve potersi verificare: P(B)> 0. 25.3

Si opera una restrizione dello spazio probabilistico Ω al solo evento B, che diventa lospazio di riferimento (Ω∗ = B) su cui definire una nuova legge P∗(A) = P(A|B).È possibile utilizzare la legge P definita su Ω per costruire P∗?

Ω

A B

L’evento A si verifica ora nella sola intersezione con B, quindi

P(A|B) = P(A∩B)P(B)

.

Si osserva come con riferimento allo spazio Ω vale

P(A) =P(A∩Ω)

P(Ω)=

P(A)1

.

25.4

Definizione 1 (Probabilità condizionata).


, P(B) 6= 0

Esempio 2. Si estragga una carta da un mazzo di 52 carte. Si calcoli la probabilità che siaun asso, condizionatamente al fatto che la carta estratta abbia il seme ’cuori’.

• ottenere un asso all’interno delle cuori (A∩B)• considerando solo le uscite di cuori (B)

A♥ 2♥ 3♥ 4♥ 5♥ 6♥ 7♥ 8♥ 9♥ 10♥ J♥ Q♥ K♥A♦ 2♦ 3♦ 4♦ 5♦ 6♦ 7♦ 8♦ 9♦ 10♦ J♦ Q♦ K♦A♣ 2♣ 3♣ 4♣ 5♣ 6♣ 7♣ 8♣ 9♣ 10♣ J♣ Q♣ K♣A♠ 2♠ 3♠ 4♠ 5♠ 6♠ 7♠ 8♠ 9♠ 10♠ J♠ Q♠ K♠


=1521352

=1

1325.5

Si osserva come l’ultimo passaggio nella precedente espressione non sia una semplicesemplificazione della formula.

360

Il condizionamento rappresenta, infatti, una restrizione all’insieme condizionante (B).Risulta, quindi, definita una nuova misura di probabilità P∗ riferita allo spazio probabili-stico Ω∗ = B = carte di cuori.

P(A∩B)P(B)

=1521352

=

#AC in Ω

#casi poss. in Ω

#C in Ω

#casi poss. in Ω

=1

13=

#AC in B#casi poss. in B

= P∗(A)

25.6

OsservazioneCon riferimento a particolari sequenze di eventi A1,A2, . . . ,An il terzo postulato del-l’impostazione assiomatica potrebbe applicarsi per P∗ definita su B e non per P definitasu Ω.

Ω

B

A1

A2

A3

A4

A1∩A2 6=∅, A3∩A4 6=∅, (A1|B)∩ (A2|B) = (A3|B)∩ (A4|B) =∅

25.7

2 La probabilità composta

Da

P(B|A) = P(B∩A)P(A)

, P(A) 6= 0


, P(B) 6= 0

segue la definizione di probabilità composta.

Definizione 3 (Probabilità composta).

P(A∩B) = P(A) ·P(B|A) = P(B) ·P(A|B)25.8

361

3 Indipendenza stocastica

Definizione 4 (Indipendenza stocastica). Due eventi A e B si dicono stocasticamenteindipendenti se

P(A∩B) = P(A) ·P(B)Se A e B sono stocasticamente indipendenti, dalla formula della probabilità condizionatasegue che:

•


=P(A) ·P(B)

P(B)= P(A)

l’evento B non ha alcuna influenza sulla manifestazione dell’evento A.•

P(B|A) = P(B∩A)P(A)

=P(B) ·P(A)

P(A)= P(B)

l’evento A non ha alcuna influenza sulla manifestazione dell’evento B. 25.9

3.1 Esercizi

Esercizio 5. Due eventi disgiunti sono indipendenti?25.10

Esercizio 6 (T 168, 19.02.1999, 4). La probabilità che si verifichi l’evento A e non siverifichi l’evento B è pari a 0.12.La probabilità che si verifichi l’evento B è pari a 2 volte la probabilità che si verifichil’evento A.La probabilità che si verifichi l’evento A o non si verifichi l’evento B è pari a 0.68.

1. Calcolare la probabilità che si verifichi l’evento A e la probabilità che si verifichil’evento B.

2. Calcolare la probabilità che si verifichi l’evento A dato che non si è verificatol’evento B.

3. Indicare, giustificando la risposta, se A e il complementare di B sono tra lorostocasticamente indipendenti.

4. Dimostrare che A e B sono tra loro stocasticamente indipendenti.25.11

Esercizio 7 (T 156, 13.09.1997, 4). Dati due eventi tali che P(A) = 0.3, P(B) = 0.4;calcolare P(A∪B) nelle seguenti ipotesi:

1. A e B sono stocasticamente indipendenti;2. A e B sono disgiunti;3. P(A|B) = 0.8.

25.12

Esercizio 8 (T 173, 13.09.1997, 4). Sapendo che la probabilità che si verifichi l’evento Aè pari a 0.4 e che la probabilità che si verifichi l’evento B è pari a 0.9, dire, giustificandola risposta data, se:

1. A e B sono due eventi incompatibili (o disgiunti);2. A e B sono due eventi tra loro stocasticamente indipendenti, sapendo che P(A∪B)=

0.9.25.13

Esercizio 9 (T 231, 11.01.2007, 4). Sapendo che A, B e C sono tre eventi che costituisco-no una partizione dello spazio Ω e che P(A) = 0.2 e P(B) è 2 volte P(C):

1. calcolare P(B∪C), P(A∩C), P(A−B), P(A|B),2. dire se A e C sono stocasticamente indipendenti.

25.14

362

4 La probabilità composta (caso generale)

Definizione 10 (Probabilità composta). Si considerino gli eventi A1,A2, . . . ,An. Allora

P(A1∩A2∩ . . .∩An) = P(A1) ·P(A2|A1) ·P(A3|A1∩A2) · . . . ·P(An|A1∩A2∩ . . .∩An−1)

con P(A1∩A2∩ . . .∩An) 6= 0.

Teorema 11. Si considerino gli eventi A1,A2, . . . ,An con P(A1∩A2∩ . . .∩An) 6= 0. Allora

0 < P(A1∩ . . .∩An)≤ P(A1∩ . . .∩An−1)≤ . . .≤ P(A1)

Dimostrazione. Dal momento che

(A1∩ . . .∩An)⊂ (A1∩ . . .∩An−1)⊂ . . .⊂ (A1∩A2)⊂ A1,

la tesi segue applicando il Teorema della monotonicità.25.15

4.1 Esercizi

Esercizio 12 (T 164, 16.09.1998, 9). In un’urna sono contenute 21 palline, ciascunarecante impressa una lettera dell’alfabeto italiano.Calcolare la probabilità che estraendo contemporaneamente 5 palline escano:

1. 5 consonanti;2. le 5 lettere che compongono il sostantivo ombra;

(suggerimento: calcolare le seguenti probabilità: P(o1∩m2∩b3∩ r4∩a5), P(a1∩m2 ∩ b3 ∩ r4 ∩ o5); conteggiare poi il numero di sequenze che possono essere co-struite con le lettere o,m,b,r,a, cfr. il paragrafo successivo ’le permutazioni’).

25.16

363

4.2 Le permutazioniEsempio 13. Quante sequenze si possono costruire con le quattro lettere (elementi distin-ti) r,o,m,a

r o m ar o a mr m o ar m a or a o mr a m oo r m ao r a mo m r ao m a ro a r mo a m rm r o am r a om o r am o a rm a r om a o ra r o ma r m oa o r ma o m ra m r oa m o r

4 3 2 1

In totale 24 sequenze, ottenibili mediante il prodotto

4 ·3 ·2 ·1 = 2425.17

Definizione 14 (Permutazioni). Numero di sequenze che possono essere costruite con nelementi distinti:

n · (n−1) · . . . ·2 ·1Definizione 15 (Fattoriale). Si definisce fattoriale di un numero n il prodotto dei numerida 1 a n

n! = n · (n−1) · . . . ·2 ·1Per definizione vale

0! = 125.18

Esempio 16 (Soluzione Esercizio 12). Abbiamo

P(o1∩m2∩b3∩ r4∩a5) = P(o1) ·P(m2|o1) ·P(b3|o1∩m2) ·P(r4|o1∩m2∩b3)·

·P(a5|o1∩m2∩b3∩ r4) =1

21· 1

20· 1

19· 1

18· 1

17.

Si osserva come valga

P(a1∩m2∩b3∩ r4∩o5) = P(o1∩m2∩b3∩ r4∩a5)

e come tale probabilità coincida con quella di qualsiasi sequenza che può essere costruitacon le lettere o,m,b,r,a.

364

Il numero di tali sequenze (permutazioni) è pari a 5! = 120, abbiamo quindi:

P(5 lettere o,m,b,r,a) = 5! · 121· 1

20· 1

19· 1

18· 1

17= n. sequenze ·P(generica sequenza).

25.19

Esercizio 17 (T 164, 16.09.1998, 9). In un’urna sono contenute 21 palline, ciascunarecante impressa una lettera dell’alfabeto italiano.Calcolare la probabilità che estraendo contemporaneamente 5 palline escano:

3. le 5 lettere che compongono il sostantivo sasso.4. 3 vocali e 2 consonanti;

(suggerimento: calcolare le seguenti probabilità: P(v1 ∩ v2 ∩ v3 ∩ c4 ∩ c5), P(c1 ∩c2∩v3∩v4∩v5); conteggiare poi il numero di sequenze che possono essere costrui-te con 3 vocali e 2 consonanti, cfr. il paragrafo successivo ’le combinazioni’).

25.20

4.3 Le combinazioni

Esempio 18. Si considerino 5 elementi dei quali 3 di un tipo e 2 di un secondo tipo (adesempio 3 lettere f e 2 lettere g).Quante sequenze si possono costruire con i 5 elementi?

Ipotizziamo in primo luogo che i 5 elementi siano distinti:

a,b,c,d,e

Il numero delle possibili sequenze è 5! = 5 ·4 ·3 ·2 ·1 = 120

abcde bacde cabde dabce eabcdabced baced cabed dabec eabdcabdce badce cadbe dacbe eacbdabdec badec cadeb daceb eacdbabecd baecd caebd daebc eadbcabedc baedc caedb daecb eadcbacbde bcade cbade dbace ebacdacbed bcaed cbaed dbaec ebadcacdbe bcdae cbdae dbcae ebcadacdeb bcdea cbdea dbcea ebcdaacebd bcead cbead dbeac ebdacacedb bceda cbeda dbeca ebdcaadbce bdace cdabe dcabe ecabdadbec bdaec cdaeb dcaeb ecadbadcbe bdcae cdbae dcbae ecbadadceb bdcea cdbea dcbea ecbdaadebc bdeac cdeab dceab ecdabadecb bdeca cdeba dceba ecdbaaebcd beacd ceabd deabc edabcaebdc beadc ceadb deacb edacbaecbd becad cebad debac edbacaecdb becda cebda debca edbcaaedbc bedac cedab decab edcabaedcb bedca cedba decba edcba

25.21

Si sostituisca alle lettere a,b,c la lettera f .

365

Tutte le sequenze che contengono la coppia (d,e) in posizione prefissata, ad esempio in4a e 5a posizione divengono indistinguibili

abcdebacdecabdeacbdebcadecbade

→ f f f de

Il numero di sequenze distinte (per l’ordine) risulta allora ridotto a

1206

=5!3!

= 20,

essendo 3!, permutazione delle 3 lettere a,b,c, il numero di elementi ’indistinguibili’ cond ed e in posizione prefissata e a,b,c sostituite con f

f f f de f f de f f d f e f d f f f e d f e f ff f f ed f f ed f f e f d f e f f f d e f d f ff f d f e f d f f e f de f f d f f e f de f f ff f e f d f e f f d f ed f f e f f d f ed f f f

25.22

Sostituendo, ora, alle lettere d,e la lettera g, il numero di sequenze distinte (per l’ordine)risulta

5!3! ·2!

=1206 ·2 = 10,

dove 2!, permutazione delle lettere d,e, è il numero di elementi ’indistinguibili’ con a,b,c(o f f f ) in posizione prefissata e d,e sostituite con g

f f f gg f f gg f f g f g f g f f f g g f g f ff f g f g f g f f g f gg f f g f f g f gg f f f

25.23

In conclusione, disponendo di 5 elementi di cui 3 di un primo tipo e 2 di un secondo tipo,è possibile costruire

5!3! ·2!

=1206 ·2 = 10

ordinamenti (sequenze) distinte.

Definizione 19 (Combinazioni). Il numero di sequenze che possono essere costruite conn elementi dei quali k di un primo tipo e n− k di un secondo tipo

•• · · ·•︸︷︷︸ · · ·︸︷︷︸k n− k

è pari a:n!

k! · (n− k)!.

25.24

4.4 Il coefficiente binomiale

Definizione 20 (Coefficiente binomiale).(nk

)=

n!k! · (n− k)!

.

366

Per il calcolo del coefficiente binomiale risulta utile la seguente proprietà(nk

)=

n!k! · (n− k)!

=n!

(n− k)! · k!=

(n

n− k

)Inoltre (

nk

)=

n!k! · (n− k)!

=n(n−1) · . . . · (n− k+1)(n− k)!

k! · (n− k)!

=n(n−1) · . . . · (n− k+1)

k(k−1) · . . . ·1

=k fattori decrescenti a partire da n

k fattori (i primi k interi).

25.25

Esempio 21. Si calcolino(80

78

),(70

3

),(70

66

)(

8078

)=

(802

)=

80 ·792 ·1 = 3160;(

703

)=

70 ·69 ·683 ·2 ·1 = 54740;(

7066

)=

(704

)=

70 ·69 ·68 ·674 ·3 ·2 ·1 = 916895.

25.26

Esempio 22 (Soluzione Esercizio 17). Abbiamo

P(v1∩ v2∩ v3∩ c4∩ c5) = P(v1) ·P(v2|v1) ·P(v3|v1∩ v2) ·P(c4|v1∩ v2∩ v3)·

·P(c5|v1∩ v2∩ v3∩ c4) =521· 4

20· 3

19· 16

18· 15

17.

Si osserva come valga

P(v1∩ v2∩ v3∩ c4∩ c5) = P(c1∩ c2∩ v3∩ v4∩ v5)

e come tale probabilità coincida con quella di qualsiasi sequenza che può essere costruitacon 3 vocali e 2 consonanti (o, equivalentemente, con 2 consonanti e 3 vocali).Il numero di tali sequenze (combinazioni) è pari a

(53

)= 10 (equivalente a

(52

)= 10),

abbiamo quindi:

P(3 vocali e 2 consonanti)=(

53

)· 521· 420· 319· 1618· 1517

= n. sequenze ·P(generica sequenza).

25.27

Esercizio 23 (T 121, 26.06.1993, 5). Papà, mamma con i due figli vanno in gelateria esi siedono a un tavolo quadrato a 4 posti; determinare la probabilità che i due figli sianoseduti uno di fronte all’altro, ritenendo equiprobabile ogni configurazione.

25.28

Esercizio 24 (T 158, 24.01.1998, 5). Sia dato un gruppo di n = 12 individui.

1. Si valuti la probabilità che, dopo aver disposto gli stessi in fila, due persone sitrovino vicine.

2. Si valuti la probabilità che, dopo aver disposto gli stessi in fila, tre persone si trovinovicine.

25.29

367

4.5 Combinazioni multiple e coefficiente multinomiale

Esempio 25. Si considerino 7 elementi dei quali 1 di un primo tipo, 3 di un secondo tipo,2 di un terzo tipo e 1 di un quarto tipo (ad esempio ahhhllg). Quante sequenze si possonocostruire?Ipotizziamo in primo luogo che i 7 elementi siano distinti:

a,b,c,d,e, f ,g

Il numero delle possibili sequenze è 7! = 5040.

Si sostituisca alle lettere b,c,d la lettera h e alle lettere e, f la lMolte sequenze divengono indistinguibili, ad esempio

abcde f gabdce f gacbde f gacdbe f gadbce f gadcbe f gabcd f egabdc f egacbd f egacdb f egadbc f egadcb f eg

→ ahhhllg

Il numero totale di sequenze distinte (per l’ordine) risulta

7!1! ·3! ·2! ·1!

= 420

25.30

5 Legge delle probabilità totali

Si consideri una partizione di Ω costituita dagli eventi A1,A2, . . . ,Ak

Ω

A1 A2 . . . Ak

⋃ki=1 Ai = Ω, Ai∩A j =∅ (∀i 6= j) 25.31

Si consideri ora un generico insieme B

Ω

A1 A2 . . . Ak

B

368

Siamo interessati a determinare P(B) supponendo di conoscere

• P(A1),P(A2), . . . ,P(Ak)• P(B|A1),P(B|A2), . . . ,P(B|Ak).

Si osserva, innanzitutto, che l’insieme B può essere espresso come:

B = Ω∩B = (A1∪ . . .∪Ak)∩B = (A1∩B)∪ . . .∪ (Ak ∩B).

PertantoP(B) = P(A1∩B)+ . . .+P(Ak ∩B)

che, in base agli elementi noti, può essere riformulata come

P(B) = P(A1)P(B|A1)+ . . .+P(Ak)P(B|Ak).

25.32

Teorema 26 (Legge delle probabilità totali). Si considerino

• una partizione di Ω costituita dagli eventi A1,A2, . . . ,Ak,• un insieme B.

Si supponga di conoscere

• P(A1),P(A2), . . . ,P(Ak),• P(B|A1),P(B|A2), . . . ,P(B|Ak).

AlloraP(B) = P(A1)P(B|A1)+ . . .+P(Ak)P(B|Ak).

25.33

5.1 Esercizi

Esercizio 27 (T 154, 28.06.1997, 5). Siano date due urne così composte:

• la prima contiene 18 palline bianche, 17 palline rosse e 5 palline verdi,• la seconda contiene 10 palline bianche, 16 palline rosse e 24 palline verdi.

Si proceda allo svolgimento del seguente esperimento casuale: si lanci un dado regolare.Se si ottiene un numero multiplo di 3 si estrae una pallina dalla prima urna contrariamentesi estrae una pallina dalla seconda urna.Determinare la probabilità che la pallina estratta sia bianca.

25.34

Esercizio 28 (T 152, 22.02.1997, 4). Tre scatole contengono rispettivamente:

• due palline bianche e una nera;• due palline nere e una bianca;• tre palline bianche.

Estraendo in modo indipendente una pallina da ciascuna scatola, calcolare la probabilitàdi estrarre due palline bianche e una nera.

25.35

369

6 Formula di Bayes

Teorema 29 (Formula di Bayes). Si considerino

• una partizione di Ω costituita dagli eventi A1,A2, . . . ,Ak,• un insieme B.

Si supponga di conoscere

• P(A1),P(A2), . . . ,P(Ak),• P(B|A1),P(B|A2), . . . ,P(B|Ak).

Allora

P(Ai|B) =P(Ai)P(B|Ai)

P(A1)P(B|A1)+ . . .+P(Ak)P(B|Ak), i = 1, . . . ,k.

Dimostrazione.

P(Ai|B) =P(Ai∩B)

P(B)=

P(Ai)P(B|Ai)

∑ki=1 P(Ai)P(B|Ai)

ricordando la formula della probabilità composta e la legge delle probabilità totali.25.36

Interpretazione della Formula di BayesSe si attribuisce agli eventi Ai il significato di possibili cause dell’effetto B, la formula diBayes consente di effettuare uno ’scambio’ tra le cause e l’effetto.Infatti, note le probabilità, P(Ai), di ciascuna causa e le probabilità dell’effetto data cia-scuna causa P(B|Ai), consente di determinare la probabilità P(Ai|B) della causa datol’effetto, vale a dire che essendosi verificato l’evento B sia stata la causa Ai a determinarlo.

25.37

Esempio 30. Si consideri un paziente che si presenta dal medico con un determinatosintomo. Il medico sa che detto sintomo potrebbe essere causato da k patologie che sisuppongono mutuamente esclusive.Sia B l’evento che rappresenta il sintomo e Ai l’evento che si identifica con la i-esimapatologia (i = 1,2, . . . ,k).Il medico conosce (a priori) la probabilità P(B|Ai) che si manifesti il sintomo B essendoil paziente affetto dalla patologia Ai. È, però, interessato a determinare la probabilità

P(Ai|B)

che essendosi manifestato il sintomo B sia stata la patologia Ai a determinarlo.A tal fine può utilizzare la formula di Bayes.

25.38

UtilizzazioneLa formula di Bayes trova utilizzo nell’approccio soggettivo all’inferenza statistica, cosid-detta Bayesiana, nella quale in aggiunta al risultato sperimentale B, si suppone di disporredi una ’elicitazione’, come distribuzione di probabilità a priori, riguardo agli eventi Aioggetto di inferenza.

Esempio 31. Con riferimento all’Esempio 5 della Sezione 1, relativo alla determinazionedella quota di mercato di un’azienda, si utilizzano, in aggiunta all’informazione campio-naria, anche altre valutazioni (soggettive), in forma di distribuzione di probabilità a priori,relative ai possibili valori della quota di mercato oggetto di stima.

25.39

370

Esempio 32. Una linea di produzione è costituita da 3 macchinari, m1,m2,m3, che contri-buiscono rispettivamente al 20%, al 30% e al 50% della produzione. I 3 macchinari sonocaratterizzati dai seguenti tassi di difettosità: 5%, 4% e 2%.

• Si calcoli la probabilità che estratto a caso un pezzo dalla linea di produzione,questo sia difettoso.

• Si calcoli la probabilità che avendo estratto un pezzo difettoso, questo provenga dalmacchinario m1.

macchina m1 m2 m3% produzione 20% 30% 50%% difettosità 5% 4% 2%

DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD ←25.40

Indicando con Mi l’evento ’pezzo prodotto da mi’ e con D l’evento ’pezzo difettoso’abbiamo:

macchina m1 m2 m3P(Mi) 0.20 0.30 0.50

P(D|Mi) 0.05 0.04 0.02

Siamo interessati a conoscere P(D) e P(M1|D)

M1 M2 M3

ND

D

Ω

25.41

Abbiamo:

P(D) = P(Ω∩D) = P((M1∪M2∪M3)∩D) =

= P((M1∩D)∪P(M2∩D)∪P(M3∩D)) =

= P(M1∩D)+P(M2∩D)+P(M3∩D) =

= P(M1)P(D|M1)+P(M2)P(D|M2)+P(M3)P(D|M3) =

= 0.20 ·0.05+0.30 ·0.04+0.50 ·0.02 =

= 0.01+0.012+0.01 = 0.032

e

P(M1|D) =P(M1∩D)

P(D)=

P(M1)P(D|M1)

P(D)=

0.010.032

= 0.3125.

25.42

371

7 I grafi di probabilità

Sono delle strutture ’orientate’, denominate anche alberi di probabilità, costituite da nodie archi, mediante le quali è possibile rappresentare la struttura di casualità di un problema.Ad esempio, con riferimento alla legge delle probabilità totali applicata agli eventi D e Dspecificati nel precedente Esempio 32 abbiamo il grafo nella seguente figura. 25.43

M1

M2

M3

D

D

D

D

D

D

P (M1 ∩D) = 0.2 · 0.05 = 0.01 = P (M1)P (D|M1)

0.2

0.3

0.5

0.05

0.95

0.04

0.96

0.02

0.98

P (M1 ∩ D) = 0.2 · 0.95 = 0.19 = P (M1)P (D|M1)

P (M2 ∩D) = 0.3 · 0.04 = 0.012 = P (M2)P (D|M2)

P (M2 ∩ D) = 0.3 · 0.96 = 0.288 = P (M2)P (D|M2)

P (M3 ∩D) = 0.5 · 0.02 = 0.01 = P (M3)P (D|M3)

P (M3 ∩ D) = 0.5 · 0.98 = 0.49 = P (M3)P (D|M3)

• Dal nodo iniziale partono 3 archi relativi alla possibile ’scelta’ del macchinario; lasomma delle probabilità a essa associate è pari a 1.

• Da ciascun nodo intermedio partono 2 archi relativi alla realizzazione del prodottoeffettuata mediante il macchinario Mi. Il prodotto può essere ’difettoso’ oppure’non difettoso’ e la somma delle probabilità associate ai due eventi è sempre pari a1.

• Effettuando il prodotto tra i valori delle probabilità presenti lungo i diversi archi cheportano dal nodo iniziale ai nodi terminali si ottengono le probabilità composte.

25.44

7.1 Esercizi

Esercizio 33 (T 214, 23.09.2004, 3). Un manager ha nel proprio ufficio tre linee telefo-niche (A, B e C) che risultano libere con probabilità rispettivamente pari a 0.70, 0.20 e0.40.

1. Scegliendo a caso una delle linee, si determini la probabilità che la linea sceltarisulti essere libera.

2. Ipotizzando che la linea scelta sia libera, qual è la probabilità che sia la linea C?25.45

372


26.1

Indice

1 La variabile casuale 373

2 Esperimenti aleatori descritti da variabili casuali discrete 374

3 La variabile casuale di Bernoulli 377

4 La variabile casuale binomiale 378

5 La variabile casuale ipergeometrica 382

6 La variabile casuale uniforme discreta 386

7 Esercizi 386

8 La Funzione di Ripartizione 387

9 Altri esempi di variabili casuali 389 26.2

1 La variabile casuale

Denominata anche ’numero aleatorio’, la variabile casuale è il corrispondente stocasticodella serie statistica.Al posto degli eventi elementari ωi ∈Ω abbiamo valori numerici appartenenti a un insie-me S detto supporto.In genere S⊂ℜ e gli eventi di interesse sono, quindi, insiemi numerici del tipo

X = x0 X ≤ x0 a < X ≤ b

e si parla di probabilità che X assuma determinati valori.Analogamente al caso delle variabili statistiche, il simbolo X riassume, ora, valori eprobabilità.

Tipologie di variabili casuali

• discrete (Ω assume valori in un insieme finito o numerabile)• continue (Ω corrisponde a un intervallo di valori reali)

26.3

Definizione 1 (Esperimento aleatorio). Un esperimento aleatorio è definito dalla ternaΩ,S (Ω),P(·), dove

373

• Ω è lo spazio probabilistico,• S (Ω) la corrispondente algebra degli eventi (elementari e non),• P(·) è la misura di probabilità operante su S (Ω).

Definizione 2 (Variabile casuale). Dato un esperimento aleatorio, una trasformazione X :Ω→ℜ dello spazio probabilistico Ω in ℜ è detta variabile casuale, X , se ogni elementoB ∈ S (ℜ) ha controimmagine in S (Ω), dove S (ℜ) è una opportuna algebra su ℜ,costruita, ad esempio, a partire dalla classe delle semirette.Vale a dire:

PX (B) = P(

X−1(B))

, ∀B ∈S (ℜ).26.4

OsservazioneCon riferimento alla terna ℜ,S (ℜ),PX (·), relativa a una variabile casuale continua, èconveniente usare la legge di probabilità P(X ≤ x).

26.5

2 Esperimenti aleatori descritti da variabili casuali di-screte

Esempio 3 (Guadagno di un giocatore). Si riprende l’esempio sul gioco della roulette,visto nel contesto della definizione di gioco equo.I risultati possibili sono i simboli 0,00,1,2,3, . . . ,36, a ciascuno dei quali è associata unaprobabilità costante pari a 1

38 .Indicato con A l’evento ’uscita del simbolo su cui è stata effettuata la scommessa’, lospazio degli eventi è

Ω = A, Aed è, quindi, assegnata la probabilità a ogni elemento della algebra degli eventi

S (Ω) = ∅,A, A,A∪ A≡Ω;

abbiamoP(∅) = 0,P(A) =

138

,P(A) =3738

,P(Ω) = 1.26.6

• In caso di uscita del simbolo su cui è stata effettuata una scommessa unitaria, eventoA, si ottiene una somma pari a 36 e il guadagno risulta, quindi, pari a 36−1 = 35.

• In caso di non uscita del simbolo su cui è stata effettuata la scommessa, evento A,si perde la posta, vale a dire l’unità scommessa.

26.7Si considera la variabile casuale X = ’guadagno del giocatore’

X : Ω→ℜ

Ω

A A

−1 35

ℜ

374

La variabile casuale X ha come supporto S = −1,35

xi P(X = xi)−1 37/3835 1/38

1 26.8

Per verificare che, effettivamente, X è una variabile casuale si osserva come i tre seguentigenerici elementi di S (ℜ)

B1 = 10 B2 = (34,36] B3 = (−∞,4]

corrispondenti ai tre esempi X = x0, a < X ≤ b e X ≤ x0 di generici eventi di interesse inℜ, hanno come controimmagine in S (Ω)

X−1(B1) =∅ X−1(B2) = A∪∅ X−1(B3) = A∪∅;

le controimmagini sono caratterizzate dalle probabilità, definite su Ω,

P(∅) = 0 P(A∪∅) = P(A) =1

38P(A∪∅

)= P(A) =

3738

.

Seguono in S (Ω) le misure di probabilità indotte, PX (Bi), riportate nella seguente tabella

Bi X−1(Bi) PX (Bi) = P(

X−1(Bi))

10 ∅ PX (10) = P(

X−1(10))

= P(∅) = 0(34,36] A∪∅ PX ((34,36]) = P

(X−1((34,36])

)= P(A∪∅) = P(A) = 1

38(−∞,4] A∪∅ PX ((−∞,4]) = P

(X−1((−∞,4])

)= P

(A∪∅

)= P

(A)= 37

3826.9

Esempio 4. Esperimento di estrazione di 2 palline senza reimmissione da un’urna conte-nente 10 palline bianche e 6 palline nere

Ω

ω1 = (B1∩B2)

ω2 = (B1∩N2)

ω3 = (N1∩B2)

ω4 = (N1∩N2)

P(ω1) = P(B1∩B2) = P(B1)P(B2|B1) =1016

915

= 0.375

P(ω2) = P(B1∩N2) = P(B1)P(N2|B1) =1016

615

= 0.250

P(ω3) = P(N1∩B2) = P(N1)P(B2|N1) =6

161015

= 0.250

P(ω4) = P(N1∩N2) = P(N1)P(N2|N1) =6

16515

= 0.125

26.10L’algebra degli eventi S (Ω) risulta:

S (Ω) =

∅

ω1, ω2, ω3, ω4(ω1∪ω2), (ω1∪ω3), (ω1∪ω4), (ω2∪ω3), (ω2∪ω4), (ω3∪ω4)(ω1∪ω2∪ω3), (ω1∪ω2∪ω4), (ω1∪ω3∪ω4), (ω2∪ω3∪ω4)

(ω1∪ω2∪ω3∪ω4) = Ω

OsservazioneIl numero di elementi che costituiscono S (Ω) è pari a 24, essendo 4 la cardinalità di Ω

(numero di eventi elementari in Ω).

375

L’affermazione si dimostra ponendo a = b = 1 nella formula di Newton per la potenza diun binomio

(a+b)n =n

∑k=0

(nk

)an−kbk.(n

k

)è la numerosità dei gruppi formati con k elementi.

Nel caso in esame abbiamo

24 =

(40

)+

(41

)+

(42

)+

(43

)+

(44

)= 1+4+6+4+1.

Gli addendi corrispondono alle numerosità in S (Ω) di: ∅, degli elementi singoli ωi, delleunioni di coppie (ωi∪ω j), di terne (ωi∪ω j∪ωk) e della quaterna (ω1∪ω2∪ω3∪ω4) =Ω. 26.11

OsservazioneMediante la funzione P(·) siamo in grado di assegnare la probabilità a ciascun elementodi S (Ω).

Esercizio 5. Si costruisca la variabile casuale X = ’n palline nere estratte’.26.12

Variabile casuale X = ’n palline nere estratte’X : Ω→ℜ

Ω

(B1 ∩ B2) (B1 ∩N2) (N1 ∩ B2) (N1 ∩N2)

0 1 2

<

supporto S = 0,1,2

xi P(X = xi) = pi0 P(ω1) 0.3751 P(ω2∪ω3) = P(ω2)+P(ω3) 0.5002 P(ω4) 0.125

126.13

Esempio 6. Si considera un’urna contenente elementi di due tipi, A e A, in frazione p e1− p.

p 1− p

A AL’esperimento consiste nell’estrazione di una pallina dall’urna.Abbiamo

P(A) = p P(A) = 1− p

Infatti, nel caso fosse noto il numero totale di elementi nell’urna, diciamo N, si avrebbero:

376

• N p elementi del tipo A• N−N p = N(1− p) elementi del tipo A

che sarebbero tutti alla pari di fronte all’operazione di estrazione (eventi simmetrici),quindi

P(A) =N pN

= p P(A) =N(1− p)

N= 1− p

26.14

Esercizio 7. Si costruisca la variabile casuale X = ’n elementi di tipo A’ ottenuti in unaestrazione dall’urna considerata nell’Esempio 6.

26.15

3 La variabile casuale di Bernoulli

Definizione 8 (Variabile casuale di Bernoulli). X = ’n elementi di tipo A’ in una estra-zione da un’urna contenente elementi di due tipi, A e A, in frazione p e 1− p.

Supporto S = 0,1xi P(X = xi) = pi0 1− p1 p

126.16

Esempio 9 (Estrazioni bernoulliane). Esperimento di estrazione di 2 elementi con reim-missione da un’urna contenente elementi di due tipi, A e A, in frazione p e 1− p.Le estrazioni in questo caso sono dette bernoulliane o prove indipendenti

Ω

(A1∩A2)

(A1∩ A2)

(A1∩A2)

(A1∩ A2)

P(A1∩A2) = P(A1)P(A2|A1) = P(A)P(A) = p2

P(A1∩ A2) = P(A1)P(A2|A1) = P(A)P(A) = p(1− p)

P(A1∩A2) = P(A1)P(A2|A1) = P(A)P(A) = (1− p)p

P(A1∩ A2) = P(A1)P(A2|A1) = P(A)P(A) = (1− p)2

Si costruisca la variabile casuale X = ’n elementi di tipo A estratti nelle 2 estrazioni conreimmissione’ 26.17

Variabile casuale X = ’n elementi di tipo A estratti nelle 2 estrazioni con reimmissione’X : Ω→ℜ

Ω

(A1 ∩ A2) (A1 ∩ A2) (A1 ∩ A2) (A1 ∩ A2)

0 1 2

<

377

supporto S = 0,1,2

xi P(X = xi) = pi

0 P(A1∩ A2) (1− p)2

1 P(A1∩A2)+P(A1∩ A2) (1− p)p+ p(1− p)2 P(A1∩A2) p2

126.18

OsservazioneNel caso fosse noto il numero totale di elementi nell’urna, diciamo N, si avrebbero:

• N p elementi del tipo A• N−N p = N(1− p) elementi del tipo A

Si potrebbe quindi anche considerare lo spazio probabilistico Ω costituito da N2 coppiesimmetriche (dal momento che le estrazioni sono con reimmissione) del tipo (A1 ∩A2),(A1∩ A2), (A1∩A2) e (A1∩ A2)

Ω

N p ·N p N p ·N(1− p) N(1− p) ·N p N(1− p) ·N(1− p)

(A1∩A2) (A1∩ A2) (A1∩A2) (A1∩ A2)

P(A1∩A2) =N p ·N p

N2 = p2, P(A1∩ A2) =N(1− p) ·N(1− p)

N2 = (1− p)2

P(A1∩A2) =N(1− p) ·N p

N2 = (1− p)p, P(A1∩ A2) =N p ·N(1− p)

N2 = p(1− p)

26.19

OsservazioneCosa succede in presenza di n estrazioni?

Gli eventi elementari diventano delle n-ple e vengono definite le variabili casuali

• binomiale, nel caso le estrazioni siano con reimmissione, ovvero in presenza diprove indipendenti

• ipergeometrica, nel caso di estrazioni senza reimmissione26.20

4 La variabile casuale binomiale

Definizione 10 (Variabile casuale binomiale X ∼ Bin(n, p)). Si consideri l’esperimentodi estrazione di n elementi con reimmissione da un’urna contenente elementi di due tipi,A e A, in frazione p e 1− p.

p 1− p

A A

378

La variabile casuale X = ’n elementi di tipo A estratti nelle n estrazioni con reimmissio-ne’ si definisce variabile casuale binomiale con parametri n e p.X ha distribuzione di probabilità

P(X = x) =(

nx

)px(1− p)n−x, (x = 0,1, . . . ,n).

26.21

OsservazioneL’esperimento potrebbe anche consistere nella ripetizione di n prove indipendenti, ciascu-na delle quali può dare luogo a un successo, A, con probabilità p, ovvero a un insuccesso,A, con probabilità 1− p.

OsservazionePer n = 1 si ottiene la variabile casuale di Bernoulli.

OsservazioneLa variabile casuale binomiale può essere interpretata come somma di n variabili casualidi Bernoulli indipendenti.

26.22

Osservazione

• se p = 0.5 allora X ∼ Bin(n, p) ha distribuzione di probabilità simmetrica• se p→ 0 oppure p→ 1 la distribuzione è asimmetrica

OsservazioneLa distribuzione di probabilità può presentare 1 moda oppure 2 mode contigue.

26.23

Esempio 11.

X ∼ Bin(n = 15, p = 0.1)

x P(X = x)0 0.205891 0.343152 0.26693 0.128514 0.042845 0.010476 0.001947 0.000288 3e−059 010 011 012 013 014 015 0

1

X ∼ Bin(n = 15, p = 0.5)

x P(X = x)0 3e−051 0.000462 0.00323 0.013894 0.041665 0.091646 0.152747 0.196388 0.196389 0.1527410 0.0916411 0.0416612 0.0138913 0.003214 0.0004615 3e−05

126.24

379

X ∼ Bin(n = 15, p = 0.75)

x P(X = x)0 01 02 03 1e−054 1e−045 0.000686 0.00347 0.013118 0.039329 0.0917510 0.1651511 0.225212 0.225213 0.1559114 0.0668215 0.01336

1

X ∼ Bin(n = 15, p = 0.9)

x P(X = x)0 01 02 03 04 05 06 07 3e−058 0.000289 0.00194

10 0.0104711 0.0428412 0.1285113 0.266914 0.3431515 0.20589

126.25

x

n =

15,

p =

0.1

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

p =

0.7

5

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

p =

0.5

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

p =

0.9

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

26.26

Esempio 12. Calcolare la probabilità che esca 2 volte testa in 2 successivi lanci di unamoneta

Ti = testa all’iesimo lancio (i = 1,2)

380

A = T1∩T2

P(A) = P(T1∩T2) = P(T1) ·P(T2|T1) = P(T1) ·P(T2) = 0.52

(si poteva usare la binomiale con p = 0.5)

P(X = 2) =(

22

)0.52(1−0.5)2−2 = 1 ·0.52 ·0.50

26.27

OsservazioneLa distribuzione di probabilità della variabile casuale binomiale

P(X = x) =(

nx

)px(1− p)n−x, (x = 0,1, . . . ,n)

può essere ottenuta, avvalendosi della probabilità composta e della legge delle probabilitàtotali, come prodotto tra (

nx

)=

n!x! · (n− x)!

,

numero di sequenze (combinazioni) che possono essere ottenute con n elementi, x deiquali sono del tipo A ed n− x del tipo A, e

P(A1∩ . . .∩Ax∩ Ax+1∩ . . .∩ An) = P(A) · . . . ·P(A) ·P(A)· . . . ·P

(A)=

= p · . . . · p · (1− p) · . . . · (1− p) = px · (1− p)n−x

probabilità che si verifichi una qualunque di queste sequenze (che risultano equiprobabili).26.28

Con riferimento a un’urna contenente N elementi di due tipi, A e A, con numerosità M edN−M, si può pervenire alla distribuzione di probabilità della variabile casuale binomialeanche applicando la formula classica di Laplace/Pascal, come rapporto tra il numero deicasi favorevoli e il numero dei casi possibili. 26.29

Il numero dei casi possibili coincide con il numero delle ’sequenze di lunghezza n’ chepossono essere costruite estraendo ’con reimmisione’ n elementi dagli N presenti nel-l’urna, le cosiddette ’combinazioni con ripetizione’ di N elementi di classe n, (due com-binazioni si considerano distinte se differiscono per almeno un elemento, a prescinderedall’ordine degli elementi)1

Nn

n!=

N ·N · . . . ·Nn · (n−1) · . . . ·1 .

26.30

Il numero dei casi favorevoli coincide con il prodotto tra il numero delle ’sequenze dilunghezza x’ che possono essere costruite con gli M elementi del tipo A presenti nell’urna

Mx

x!=

M ·M · . . . ·Mx · (x−1) · . . . ·1 .

e il numero delle ’sequenze di lunghezza (n− x)’ che possono essere costruite con gli(N−M) elementi del tipo A presenti nell’urna

(N−M)(n−x)

(n− x)!=

(N−M) · (N−M) · . . . · (N−M)

(n− x) · (n− x−1) · . . . ·1 .

26.31

1Al numeratore figura il numero delle cosiddette ’disposizioni con ripetizione’ di N elementi di classe n,(due disposizioni sono distinte se differiscono per almeno un elemento, o per l’ordine degli elementi). Al fine diottenere il numero delle combinazioni occorre dividere per il numero delle permutazioni degli n elementi nellasequenza (due sequenze che differiscono solo per l’ordine degli elementi rappresentano un’unica combinazione).

381

Abbiamo, infatti

Mx

x!(N−M)n−x

(n−x)!Nn

n!=

n!x! · (n− x)!

(MN

)x

·(

N−MN

)n−x

=

(nx

)px(1− p)n−x

avendo indicato con p = MN la frazione di elementi del tipo A presenti nell’urna. 26.32

5 La variabile casuale ipergeometrica

Definizione 13 (Variabile casuale ipergeometrica). Si consideri l’esperimento di estra-zione di n elementi senza reimmissione da un’urna contenente N elementi di due tipi, A eA, con numerosità M ed N−M.

M N−M

A ALa variabile casuale X = ’n elementi di tipo A estratti nelle n estrazioni senza reimmis-sione’ si definisce variabile casuale ipergeometrica.X ha distribuzione di probabilità

P(X = x) =

(Mx

)(N−Mn−x

)(Nn

) .

26.33

OsservazioneRicostruzione mnemonica della formula di calcolo

1 tipo 2tipo(Mx

) (N−Mn−x

) ( urnacampione

)(N

n

) ( urnacampione

)tutti

26.34

OsservazioneLa variabile casuale ipergeometrica trova applicazione nell’ambito della teoria dei cam-pioni nel cosiddetto schema di campionamento in blocco.

OsservazioneMN = p= frazione iniziale elementi di 1 tipo =P(elemento di 1 tipo alla prima estrazione)

OsservazioneNel caso il numero n di elementi estratti sia molto inferiore al numero N di elementi con-tenuti nell’urna, la variabile casuale ipergeometrica può essere approssimata da una va-riabile casuale binomiale. In tal caso, infatti, la composizione dell’urna rimane pressochéinalterata al susseguirsi delle estrazioni.Affinché si abbia una buona approssimazione in presenza di una frazione iniziale p dielementi di 1 tipo prossima a 0 oppure a 1 è necessario che l’urna contenga un numeroN di elementi molto elevato.

26.35

382

Esempio 14.

n = 15,M = 2,N−M = 48

x P(X = x)0 0.485711 0.428572 0.085713 04 05 06 07 08 09 0

10 011 012 013 014 015 0

1

n = 15,M = 25,N−M = 25

x P(X = x)0 01 5e−052 0.000693 0.005314 0.025055 0.077166 0.160757 0.230998 0.230999 0.16075

10 0.0771611 0.0250512 0.0053113 0.0006914 5e−0515 0

1

Si osserva che non è possibile estrarre più di M elementi di primo tipo: se M = 2 abbiamoP(X = x) = 0 per x≥ 3.

26.36

n = 15,M = 30,N−M = 20

x P(X = x)0 01 02 1e−053 0.000234 0.002045 0.01176 0.044317 0.113948 0.201589 0.24637

10 0.2069511 0.1175912 0.0438113 0.0101114 0.0012915 7e−05

1

n = 15,M = 45,N−M = 5

x P(X = x)0 01 02 03 04 05 06 07 08 09 010 0.0014211 0.0225512 0.1277813 0.3243514 0.3706915 0.15322

126.37

383

x

n =

15,

M =

2,

N−

M =

48

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

M =

30,

N−

M =

20

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

M =

25,

N−

M =

25

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

x

n =

15,

M =

45,

N−

M =

5

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

26.38

Esempio 15. Calcolare la probabilità che i primi 2 numeri estratti alla tombola sianodispari

Di = estrazione dispariA = D1∩D2

P(A) = P(D1∩D2) = P(D1) ·P(D2|D1) =4590

4489

45 45

D D

prima estrazione

44 45

D D

seconda estrazione

(si poteva usare la ipergeometrica)

P(X = 2) =

(452

)(450

)(902

)26.39

OsservazioneLa distribuzione di probabilità della variabile casuale ipergeometrica

P(X = x) =

(Mx

)(N−Mn−x

)(Nn

)384

può essere ottenuta dalla formula della probabilità composta e dalla legge delle probabilitàtotali considerando il prodotto tra (

nx

)=

n!x! · (n− x)!

,

numero di sequenze che possono essere ottenute con n elementi, x dei quali sono del tipoA ed n− x del tipo A, e la probabilità che si verifichi una qualunque di queste sequenze(che risultano equiprobabili)

P(A1∩ . . .∩Ax∩ Ax+1∩ . . .∩ An) =MN· . . . ·M− x+1

N− x+1· N−M

N− x· . . . · N−M− (n− x)+1

N−n+1.

Vale, infatti, l’eguaglianza(nx

)· M

N· . . . · M− x+1

N− x+1· N−M

N− x· . . . · N−M− (n− x)+1

N−n+1=

(Mx

)(N−Mn−x

)(Nn

)come viene mostrato nella seguente relazione (1).

26.40Con riferimento a un’urna contenente N elementi di due tipi, A e A, con numerosità Med N−M, si può pervenire alla distribuzione di probabilità della variabile casuale iper-geometrica anche applicando la formula classica di Laplace/Pascal, come rapporto tra ilnumero dei casi favorevoli e il numero dei casi possibili. 26.41

Il numero dei casi possibili coincide con il numero delle ’sequenze di lunghezza n’ chepossono essere costruite estraendo ’senza’ reimmissione n elementi dagli N presenti nel-l’urna, le cosiddette ’combinazioni’ di N elementi di classe n, (due combinazioni si con-siderano distinte se differiscono per almeno un elemento, a prescindere dall’ordine deglielementi)2

N · (N−1) · . . . · (N−n+1)n · (n−1) · . . . ·1 =

N!n! · (N−n)!

=

(Nn

).

26.42

Il numero dei casi favorevoli coincide con il prodotto tra il numero delle ’sequenze dilunghezza x’ che possono essere costruite con gli M elementi del tipo A presenti nell’urna

M · (M−1) · . . . · (M− x+1)x · (x−1) · . . . ·1 =

M!x! · (M− x)!

=

(Mx

)e il numero delle ’sequenze di lunghezza (n− x)’ che possono essere costruite con gli(N−M) elementi del tipo A presenti nell’urna

(N−M) · (N−M−1) · . . . · (N−M− (n− x)+1)(n− x) · (n− x−1) · . . . ·1 =

(N−M)!(n− x)! · (N−M− (n− x))!

=

(N−Mn− x

).

26.43

Segue che(Mx

)(N−Mn−x

)(Nn

) =

M·(M−1)·...·(M−x+1)x·(x−1)·...·1

(N−M)·(N−M−1)·...·(N−M−(n−x)+1)(n−x)·(n−x−1)·...·1

N·(N−1)·...·(N−n+1)n·(n−1)·...·1

=

=n!

x! · (n− x)!· M

N· . . . · M− x+1

N− x+1· N−M

N− x· . . . · N−M− (n− x)+1

N−n+1. (1)

26.44

2Al numeratore figura il numero delle cosiddette ’disposizioni’ di N elementi di classe n, (due disposizionisono distinte se differiscono per almeno un elemento, o per l’ordine degli elementi). Al fine di ottenere ilnumero delle combinazioni occorre dividere per il numero delle permutazioni degli n elementi nella sequenza(due sequenze che differiscono solo per l’ordine degli elementi rappresentano un’unica combinazione).

385

6 La variabile casuale uniforme discreta

Definizione 16 (Variabile casuale uniforme discreta). Ha supporto S = 1,2, . . . ,n conprobabilità costante

P(X = x) =1n

(x = 1, . . . ,n).

Ad esempio: n = 2 per una moneta equilibrata; n = 6 nel caso di un dado non truccato.

OsservazioneA volte si considera come supporto S = 0,1,2, . . . ,n e in tal caso la probabilità risulta

P(X = x) =1

n+1, (x = 0,1, . . . ,n).

26.45

x

n =

2

0 1 2 3 4 5 6 7 8 9 10

0.0

0.1

0.2

0.3

0.4

0.5

x

n =

4

0 1 2 3 4 5 6 7 8 9 10

0.0

0.1

0.2

0.3

0.4

0.5

x

n =

6

0 1 2 3 4 5 6 7 8 9 10

0.0

0.1

0.2

0.3

0.4

0.5

x

n =

10

0 1 2 3 4 5 6 7 8 9 10

0.0

0.1

0.2

0.3

0.4

0.5

26.46

7 Esercizi

Esercizio 17. Un’urna contiene 10 palline bianche e 40 palline rosse.Si descriva la natura della variabile casuale ’numero di palline bianche ottenute nell’estra-zione di 5 palline dall’urna’ e si calcoli la probabilità di ottenere almeno 2 palline bianche(nell’estrazione di 5 palline dall’urna) nelle seguenti ipotesi:

1. l’estrazione delle palline è effettuata con reimmissione;2. l’estrazione delle palline è effettuata senza reimmissione.

26.47

386

Esercizio 18 (T 168, 19.02.1999, 5). Un’urna contiene palline rosse e palline nere.Il rapporto tra la probabilità di ottenere 2 palline nere in 4 estrazioni con reinserimento ela probabilità di ottenere 2 palline nere in 3 estrazioni con reinserimento è pari a 0.9.Individuare la percentuale di palline rosse contenute nell’urna.

26.48

Esercizio 19 (T 234, 07.06.2007, 4). Si consideri un dado regolare le cui 6 facce riportanoin eguale numero i segni: ’1’, ’X’ e ’2’.Calcolare le probabilità che lanciando 11 volte il dado:

1. il segno ’X’ compaia al più una volta;2. essendosi presentati solo segni numerici (’1’ oppure ’2’), questi siano solo dispari.

26.49

8 La Funzione di Ripartizione

Definizione 20 (Funzione di Ripartizione). Data una variabile casuale X si definiscefunzione di ripartizione la seguente funzione

F(x) = P(X ≤ x)

È uno strumento unico, legge di probabilità, per i casi discreto e continuo che consente diattribuire una probabilità al generico intervallo a < x≤ b, infatti

P(a < X ≤ b) = P(X ≤ b)−P(X ≤ a) = F(b)−F(a)

Si osserva come nel caso continuo gli insiemi probabilizzabili sono costituiti dagli insiemiappartenenti a una cosiddetta σ -algebra costruita a partire dalle semirette. 26.50

Caso discretoP(X = xi) = pi > 0 ∑

ipi = 1

F(x) = ∑xi≤x

pi

Caso continuoSe la funzione di ripartizione è assolutamente continua, allora esiste una funzione

f (x) = densità di probabilità

tale chef (x)≥ 0

∫ +∞

−∞

f (x)dx = 1.

Vale

F(x) =∫ x

−∞

f (t)dt, f (x) =dF(x)

dx.

26.51

387

x

F(x)

x

F(x) = P(X ≤ x) =∫ x

−∞

f (t)dt

26.52

a b

P(a < X ≤ b) =∫ b

af (x)dx

ovveroP(a < X ≤ b) = P(X ≤ b)−P(X ≤ a) = F(b)−F(a)

26.53

388

9 Altri esempi di variabili casuali

Variabile casuale di PoissonLa variabile casuale (discreta) di Poisson

P(X = x) =λ xe−λ

x!, x = 0,1,2, . . .

è utilizzata, nei sistemi di gestione delle code, per descrivere il numero di persone chesono in attesa a uno sportello.

0 1 2 3 4 5 6 7 8 9 10E(X)=λ=1.5

26.54

Variabile casuale uniformeLa variabile casuale (continua) uniforme

f (x) =1

b−a, a≤ x≤ b

è caratterizzata da densità costante sul supporto [a,b].

a b

1b − a

Un caso di particolare importanza con riferimento alla generazione di numeri pseudo-casuali si ottiene ponendo a = 0 e b = 1.

26.55

389

Variabile casuale esponenziale negativaLa variabile casuale (continua) esponenziale negativa

f (t) = λe−λ t , t ≥ 0

descrive la distribuzione del tempo di attesa per la prima persona in coda.

time

26.56

Variabile casuale GammaLa variabile casuale (continua) Gamma

f (t) =1

Γ(α)λ

α xα−1e−λ t , t ≥ 0,

dove Γ(·) è la funzione Gamma di Eulero, descrive la distribuzione del tempo di attesaper la α-esima persona in coda.

time

α = 2

time

α = 3

26.57

390


27.1

Indice

1 La variabile casuale Normale 391

2 Tavola variabile casuale Normale standardizzata 3932.1 Utilizzo tavola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3942.2 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397

3 Media e varianza di variabile casuale 3983.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

4 Schema interpretativo della variabile casuale Normale 399

5 Approssimazione della variabile casuale binomiale con la Normale 3995.1 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

6 Esercizi 402 27.2

1 La variabile casuale Normale

Definizione 1 (Variabile casuale Normale X ∼ N(µ,σ2)). Ha la seguente funzione didensità

f (x) =1√

2πσexp

−1

2

(x−µ

σ

)2

con −∞ < µ < ∞ e σ > 0.27.3

La densità di probabilità è simmetrica rispetto a µ

x

µ − σ µ µ + σ

27.4

391

P(a < X ≤ b) = F(b)−F(a) =∫ b

af (x)dx

x

a b

=

x

a b

−

x

a b

Valgono, in particolare, le seguenti relazioni

P(µ−σ ≤ X ≤ µ +σ) = 0.6826P(µ−2σ ≤ X ≤ µ +2σ) = 0.9545

P(|X−µ| ≤ 3σ) = 0.9973.

27.5

La funzione di ripartizione può essere ottenuta mediante il calcolo di un integrale moltocomplesso

F(x) = P(X ≤ x) =∫ x

−∞

f (t)dt

però, tenendo conto che

P(X ≤ x) = P(X−µ ≤ x−µ) = P(

X−µ

σ≤ x−µ

σ

)= P

(Z ≤ x−µ

σ

)che corrisponde al cambiamento di variabili che conduce alla variabile standardizzataZ = X−µ

σ, abbiamo

P(X ≤ x) = P(

Z ≤ x−µ

σ

)=∫ x−µ

σ

−∞

1√2π

exp(−1

2z2)

dz = Φ

(x−µ

σ

)dove si è indicata con Φ(z) la funzione di ripartizione della variabile casuale Z ∼ N(µ =0,σ2 = 1) Normale standardizzata. 27.6

Pertanto se X ∼ N(µ,σ2)

F(x) = Φ

(x−µ

σ

)inoltre

P(a < X ≤ b) = F(b)−F(a) = Φ

(b−µ

σ

)−Φ

(a−µ

σ

)basta quindi conoscere la funzione di ripartizione della N(0,1).Tale funzione di ripartizione è tabulata. 27.7

392

2 Tavola variabile casuale Normale standardizzata0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

x

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

x

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

27.8

OsservazioneValgono, inoltre, approssimativamente, le seguenti relazioni

P(Z ≤ z)' 0 se z≤−3.10P(Z ≤ z)' 1 se z≥ 3.10P(Z ≥ z)' 0 se z≥ 3.10.

27.9

393

2.1 Utilizzo tavola

Lettura diretta (1)Sia Z ∼ N(µ = 0,σ2 = 1) si calcoli P(Z ≤ 1.24).Tenendo conto che 1.24 = 1.20+ 0.04 possiamo leggere sulla tavola l’elemento corri-spondente a 1.20 e 0.04.

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

P(Z ≤ 1.24) = 0.8925.

27.10

Lettura diretta (2)Sia X ∼ N(µ = 5,σ2 = 9) si calcoli P(X ≤ 8.72).Occorre passare alla variabile Normale standardizzata

P(X ≤ 8.72) = P(

X−µ

σ≤ 8.72−µ

σ

)=

= P(

Z ≤ 8.72−53

)= P(Z ≤ 1.24) = 0.8925.

27.11

394

Lettura diretta (3)Sia X ∼ N(µ = 5,σ2 = 9) si calcoli P(X > 8.72).Occorre passare alla variabile Normale standardizzata

P(X > 8.72) = P(

X−µ

σ>

8.72−µ

σ

)=

= P(

Z >8.72−5

3

)=

= P(Z > 1.24) = 1−P(Z ≤ 1.24) == 1−0.8925 = 0.1075.

27.12

Lettura diretta (4)Sia X ∼ N(µ = 5,σ2 = 9) si calcoli P(X ≥ 1.28).Occorre passare alla variabile Normale standardizzata

P(X ≥ 1.28) = P(

X−µ

σ≥ 1.28−µ

σ

)=

= P(

Z ≥ 1.28−53

)= P(Z ≥−1.24).

Ora, tenendo conto che la distribuzione della variabile casuale Normale è simmetricaabbiamo (costruire il grafico della funzione di densità di probabilità)

P(Z ≥−1.24) = P(Z ≤ 1.24) = 0.8925.

27.13

Lettura diretta (5)Sia X ∼ N(µ = 5,σ2 = 9) si calcoli P(X ≤ 1.28).Occorre passare alla variabile Normale standardizzata

P(X ≤ 1.28) = P(

X−µ

σ≤ 1.28−µ

σ

)=

= P(

Z ≤ 1.28−53

)= P(Z ≤−1.24).

Ora, tenendo conto che la distribuzione della variabile casuale Normale è simmetricaabbiamo (costruire il grafico della funzione di densità di probabilità)

P(Z ≤−1.24) = P(Z ≥ 1.24)= 1−P(Z < 1.24) = 1−P(Z ≤ 1.24) == 1−0.8925 = 0.1075.

In definitivaΦ(−z) = 1−Φ(+z).

27.14

395

Lettura indiretta (1)Sia Z ∼ N(µ = 0,σ2 = 1). Sapendo che P(Z ≤ z) = 0.8925 si ricavi z.Dobbiamo ora cercare il valore 0.8925 all’interno della tavola.

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

Il valore si ottiene in corrispondenza delle ’coordinate’ 1.20 (riga) e 0.04 (colonna),quindi risulta z = 1.24. 27.15

Lettura indiretta (2)Sia X ∼ N(µ = 5,σ2 = 9). Sapendo che P(X ≤ x) = 0.8925 si ricavi x.Occorre passare alla variabile Normale standardizzata

P(X ≤ x) = P(

X−µ

σ≤ x−µ

σ

)=

= P(

Z ≤ x−53

)= P(Z ≤ z) = 0.8925.

All’interno della tavola della Normale standardizzata troviamo 0.8925 in corrispondenzadelle ’coordinate’ 1.20 (riga) e 0.04 (colonna), quindi z = 1.24;

x−53

= z = 1.24

x−5 = 1.24 ·3x = 5+1.24 ·3 = 8.72.

27.16

396

Lettura indiretta (3)Sia X ∼ N(µ = 5,σ2 = 9). Sapendo che P(X ≤ x0) = 0.1075 si ricavi x0.Occorre passare alla variabile Normale standardizzata

P(X ≤ x0) = P(

X−µ

σ≤ x0−µ

σ

)=

= P(

Z ≤ x0−53

)= P(Z ≤ z0) = 0.1075.

All’interno della tavola della Normale standardizzata non figura il valore 0.1075; inoltrequesto valore è minore di 0.5, pertanto z0 è sicuramente negativo. 27.17

Tenendo poi conto che la distribuzione della Normale è simmetrica vale

P(Z ≤ z0) = 0.1075 = P(Z ≥ z1)

con z0 =−z1. Dal momento che

P(Z ≤ z1) = 1−0.1075 = 0.8925

abbiamo z1 = 1.24 e z0 =−1.24. Otteniamo, infine

x0−53

= z0 =−1.24

x0−5 =−1.24 ·3x0 = 5−1.24 ·3 = 1.28.

27.18

2.2 Esercizi

Esercizio 2 (T 233, 08.02.2007, 4). Si supponga che X sia distribuita come una variabilecasuale Normale con media µ = 10 e varianza σ2 incognita.Sapendo che P(X > 21) = 0.025 si determini il valore di σ2.

27.19

Esercizio 3 (T 219, 30.06.2005, 5). Una macchina produce pezzi meccanici la cui lun-ghezza X si distribuisce normalmente, con media pari a 10 cm e varianza pari a 2.Un pezzo è ritenuto difettoso se risulta più lungo di un certo valore ritenuto accettabile.Sapendo che i difettosi sono il 5%:

1. indicare il valore x0 al di sopra del quale si ritiene che un pezzo sia difettoso;2. calcolare la probabilità che, estratti a caso 10 pezzi, uno sia difettoso.

27.20

Quadro riassuntivoAbbiamo visto le seguenti variabili casuali

• caso discreto

– uniforme discreta

– binomiale

– ipergeometrica

– Poisson

• caso continuo

– Normale o gaussiana

– uniforme

– esponenziale negativa

– gamma

397

Si ricordi che al simbolo X corrispondono:

• nel caso discretovalori xi e probabilità pi (distribuzione)

• nel caso continuosupporto S e densità f (x) (x ∈ S)

27.21

3 Media e varianza di variabile casuale

• caso discreto

M(X) = ∑i

xi pi = µ

Var(X) = ∑i(xi−µ)2 pi = σ

2

• caso continuo

M(X) =∫ +∞

−∞

x f (x)dx = µ

Var(X) =∫ +∞

−∞

(x−µ)2 f (x)dx = σ2

27.22

X parametri M(X) Var(X)

uniforme discreta n n+12

n2−112

binomiale n, p np np(1− p)

ipergeometrica n, p = MN np np(1− p)N−n

N−1

Poisson λ λ λ

Normale µ,σ2 µ σ2

uniforme a,b a+b2

(b−a)2

12

esponenziale negativa λ1λ

1λ 2

gamma α,λ α

λ

α

λ 2

27.23

3.1 Esercizi

Esercizio 4 (T 156, 13.09.1997, 5). Sia X una variabile casuale Binomiale; sapendo cheil suo valore atteso e la varianza assumono valori rispettivamente uguali a 2 e 1.2:

1. individuare n (numero di prove indipendenti) e p (probabilità del singolo successo);2. calcolare la probabilità che X assuma valori maggiori o uguali a 4.

27.24

398

Esercizio 5 (T 216, 04.02.2005, 6). Si consideri l’esperimento di estrazione, con ripe-tizione, di n palline da un’urna contenente palline rosse e bianche in proporzione p e(1− p).Sia X la v.c. n di palline rosse estratte e Y n di bianche.

1. Sapendo che M(X) = 3 e M(Y ) = 1, determinare n e calcolare P(X > 2).2. Nel caso di 100 estrazioni con reimmissione dalla stessa urna, calcolare P(X > 70).

27.25

4 Schema interpretativo della variabile casuale Norma-le

Il seguente risultato fornisce una giustificazione al fatto che molti fenomeni in natura simanifestano con una distribuzione di probabilità che segue la legge Normale. 27.26

Teorema 6 (del limite centrale). Sia

Xn = µ +E1 +E2 + . . .+En

con

• En= successione di v.c. indipendenti• M(Ei) = 0 (tipico della variabilità accidentale)• Var(Ei) = σ2

i (finita)

Sotto ulteriori condizioni sui momenti terzi, posto

Zn =Xn−µ√

σ21 + . . .+σ2

n

vale

limn→∞

P(Zn ≤ w) =∫ w

−∞

1√2π

exp(−1

2z2)

dz = Φ(w).

La somma di v.c. indipendenti converge a una variabile casuale Normale.27.27

Si pensi, ad esempio, a un fenomeno aleatorio le cui manifestazioni sono caratterizzate da

• livello deterministico µ

• svariate perturbazioni accidentali indipendenti che agiscono in maniera additiva27.28

5 Approssimazione della variabile casuale binomialecon la Normale

Teorema 7 (Approssimazione della variabile casuale binomiale con la Normale). Essen-do la variabile casuale Bin(n, p) somma di v.c. Bin(1, p) indipendenti, allora

P(X ≤ x) = ∑i≤x

(ni

)piqn−i ∼= Φ

(x+0.5−np√

npq

), per n→ ∞

dove

• q = 1− p• Φ(·) = funzione di ripartizione di Z ∼ N(0,1) Normale standardizzata.

399

La variabile casuale X ∼ Bin(n, p) è, quindi, approssimata da una Normale con mediaµ = np e varianza σ2 = np(1− p).

27.29

OsservazioneSi ha una buona approssimazione se valgono le seguenti condizioni:

np > 5n(1− p)> 5

ovvero p > 0p < 1n 1

OsservazioneLa presenza dello 0.5 nella formula, cosiddetta correzione per continuità, consente dimigliorare l’approssimazione quando n non è troppo elevato oppure p molto piccolo omolto grande (poco utilizzata nelle applicazioni pratiche).

27.30

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

10,

p =

0.5

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

20,

p =

0.5

0 10 20 30 40

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

40,

p =

0.5

0 20 40 60 80 100

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

100

, p

= 0

.5

27.31

400

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

10,

p =

0.2

5

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

20,

p =

0.2

5

0 10 20 30 40

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

40,

p =

0.2

5

0 20 40 60 80 100

0.0

0.2

0.4

0.6

0.8

1.0

x

n =

100

, p

= 0

.25

27.32

5.1 Esercizi

Esercizio 8 (T 212, 15.07.2004, 3). Si supponga di effettuare 5 estrazioni con reimmis-sione da un’urna che contiene palline bianche e rosse in proporzione p e 1− p.Indicata con X la variabile casuale: n di palline bianche estratte nelle 5 prove,

1. si descriva la natura della variabile casuale X , indicando valori e distribuzione diprobabilità;

2. sapendo che P(X ≤ 4) = 0.99968 si determini il valore di p e si calcolino media evarianza di X ;

3. con riferimento alla medesima urna si supponga di effettuare n= 100 estrazioni conreimmissione; si descriva la natura della variabile casuale Y : n di palline biancheestratte nelle 100 prove e si calcoli la probabilità di ottenere almeno 10 pallinebianche.

27.33

Esercizio 9 (T 207, 15.01.2004, 5). Due dadi vengono truccati in modo che non sipresentino mai la faccia 2 del primo e la 4 del secondo.

1. Calcolare la probabilità che su 5 lanci l’evento A = ’somma dei valori ≥ 9’ sipresenti almeno 2 volte.

2. Calcolare la probabilità che su 100 lanci l’evento A si presenti almeno 30 volte.27.34

401

Esercizio 10 (T 245, 04.09.2008, 4). Si faccia riferimento a una slot-machine dotata di 3finestrelle, all’interno delle quali si possono presentare, a ogni lancio, i numeri da 0 a 9,in maniera casuale e indipendente.

1. Calcolare la probabilità che si presentino 3 numeri uguali.2. Calcolare la probabilità che escano tutti pari.3. Eseguendo 101 lanci, calcolare la probabilità che almeno 20 presentino tutti numeri

pari. -27.35

6 Esercizi

Esercizio 11 (T 239, 10.01.2008, 6). Uno studente deve superare un esame con 10 do-mande a risposta multipla, di uguale difficoltà, per le quali gli eventi ’fornire rispostaesatta’ sono indipendenti e hanno probabilità pari a p.

1. Sapendo che la probabilità di rispondere correttamente a tutte le 10 domande è0.001, si ricavi il valore di p.

2. Se l’esame contenesse 100 domande, quale sarebbe la probabilità di risponderecorrettamente a non più di 51 domande? -

27.36

Esercizio 12 (T 240, 31.01.2008, 5). Un gioco a premi viene organizzato nel seguentemodo: il concorrente lancia 2 dadi e se il prodotto dei numeri presenti sulle due facce èsuperiore a 10 vince un premio.

1. Calcolare la probabilità che su 3 lanci un concorrente vinca 1 premio.2. Calcolare la probabilità che su 3 lanci vinca il premio solo al 3 tentativo.3. Calcolare la probabilità che su 99 lanci vinca almeno 42 volte. -

27.37

Esercizio 13 (T 241, 14.02.2008, 5). In una lotteria si vince il premio a (evento A) conprobabilità pari a 0.13 e il premio b (evento B) con probabilità pari a 0.15. Sapendo chela probabilità complessiva di vincere o uno o l’altro dei due premi è 0.20:

1. si rappresentino in un diagramma di Venn gli eventi sopra indicati;2. si calcoli la probabilità di vincere entrambi i premi;3. si dica giustificando la risposta se gli eventi A e B sono indipendenti. -

27.38

Esercizio 14 (T 242, 05.06.2008, 4). Siano A, B e C tre eventi caratterizzati da probabilitàP(A) = 0.2, P(B) = 0.5, P(C) = 0.8, P(A|B) = 0.2 e P(A|C) = 0.Si dica, giustificando la risposta se:

1. A e B sono indipendenti;2. A e C sono indipendenti;3. si rappresentino in un diagramma di Venn gli eventi A, B, C e si calcoli P(A∪B).

-27.39

Esercizio 15 (T 243, 19.06.2008, 3). Da un’urna, che contiene 10 palline nere e 6 rossee 14 blu, si estraggono 3 palline.

1. Si calcoli la probabilità che 2 delle palline estratte siano nere nell’ipotesi di estra-zione senza reimmissione.

2. Si calcoli la probabilità che 2 delle palline estratte siano nere nell’ipotesi di estra-zione con reimmissione.

3. Si calcoli la probabilità di ottenere 3 palline dello stesso colore nell’ipotesi diestrazione con reimmissione.

402

4. Effettuando 90 estrazioni con reimmissione si calcoli la probabilità di ottenerealmeno 32 palline nere. -

27.40

Esercizio 16 (T 244, 03.07.2008, 5). A un’uscita autostradale ci sono 3 caselli, il primocon pagamento con contanti, il secondo con pagamento con carta, il terzo con pagamentoTelepass. Le probabilità di chiudere le 3 procedure di pagamento in meno di 25 secondisono rispettivamente 0.2, 0.5 e 0.8. Sappiamo che il 51% degli automobilisti paga incontanti, il 20% con carta e il restante con Telepass.

1. Calcolare la probabilità di eseguire la procedura in meno di 25 secondi.2. Sapendo che un automobilista ha impiegato più di 25 secondi, calcolare la probabi-

lità che abbia utilizzato la carta. -27.41

Esercizio 17 (T 246, 18.09.2008, 5). Siano A e B due eventi disgiunti, tali che P(A) =0.15 e P(B) = 0.4. Indicando con C = A∪B, calcolare:

1. P(C);2. P(A|C).3. Dire perché A e C non sono indipendenti. -

27.42

Esercizio 18 (T 247, 09.01.2009, 3). Siano A, B e C tre eventi caratterizzati da: P(A) =0.5, P(B) = 0.22, P(C) = 0.5, P(A|B) = 1, P(A|C) = 0.

1. Si rappresentino in un diagramma di Venn gli eventi A, B, C e si indichi se (giusti-ficando la risposta) A, B e C costituiscono una partizione dello spazio campionarioΩ.

2. Si calcoli la probabilità di ottenere 2 successi in 10 prove indipendenti essendo 0.22la probabilità di successo nella singola prova.

3. Si calcoli la probabilità di ottenere almeno 21 successi in 100 prove indipendentiessendo 0.22 la probabilità di successo nella singola prova. -

27.43

Esercizio 19 (T 248, 29.01.2009, 5). Si considerino due urne, indicate con U1 e U2.L’urna U1 contiene 14 palline rosse e 6 palline blu; l’urna U2 contiene 48 palline rosse e12 palline blu. Si estraggono 3 palline da ciascuna urna.

1. Nell’ipotesi di estrazioni senza reimmissione si calcoli la probabilità che le 3 pallineestratte dall’urna U1 siano blu e le altre di colore qualsiasi.

2. Nell’ipotesi di estrazioni con reimmissione si calcoli la probabilità che 2 delle 6palline estratte siano blu. -

27.44

Esercizio 20 (T 249, 12.02.2009, 4). Due dadi vengono truccati in modo che non sipresentino mai le facce 1 e 2 del primo e la 4 del secondo.

1. Si calcoli la probabilità dell’evento A = ’somma dei valori ≥ 10’.2. Si calcoli la probabilità che su 11 lanci l’evento A si presenti almeno 2 volte.3. Si calcoli la probabilità che su 103 lanci l’evento A si presenti almeno 30 volte. -

27.45

Esercizio 21 (T 250, 04.06.2009, 5). Un gioco consiste nel lanciare una moneta e undado; il giocatore vince se ottiene testa (evento T ) e un punteggio del dado maggiore di 4(evento D).

1. Si calcoli P(D|T ).2. Si calcoli la probabilità di vincita.3. Si calcoli la probabilità che su 120 tentativi un giocatore vinca almeno 22 volte. -

27.46

403

Esercizio 22 (T 251, 18.06.2009, 4). Date due differenti urne, U1 e U2, contenenti pallinenumerate da 1 a 5, un esperimento casuale consiste nell’estrarre una pallina da ciascunaurna. Sapendo che nell’urna U1 vi è una pallina per ogni numero e che la composizionedell’urna U2 è la seguente: U2 = (1,1,2,3,3,3,4,5,5,5)

1. Si costruisca la distribuzione di probabilità delle variabili X = ’risultato estrazioneurna U1’ e Y = ’risultato estrazione urna U2’.

2. Si calcoli la probabilità che la somma dei punteggi delle 2 palline estratte sia pari a3.

3. Indicati con D1 e D2 gli eventi ’estrazione di un numero dispari’ rispettivamente daU1 e U2, si calcolino P(D1), P(D2|D1) e P(D1∩D2).

4. Considerando ora solo l’urna U2, si calcoli la probabilità che, estraendo 100 pallinecon reinserimento, almeno 21 siano col numero 3. -

27.47

Esercizio 23 (T 252, 02.07.2009, 3). Il titolare di un’azienda conduce un’indagine suisuoi 100 dipendenti. Indicati con F l’evento ’il soggetto è fumatore’ e con S l’evento ’ilsoggetto consuma abitualmente snack’, si ha la seguente tabella a doppia entrata:

F FS 26 40S 25 9

1. Si calcoli la probabilità che, estraendo a caso un dipendente, questo: A) sia unfumatore; B) non fumi e non consumi abitualmente snack; C) fumi sapendo chenon consuma abitualmente snack.

2. Calcolare infine la probabilità che, considerati i 10 dipendenti più anziani, ci siano5 fumatori e 5 no. -

27.48

Esercizio 24 (T 253, 03.09.2009, 3). Un test è costituito da 56 domande le cui 3 possibilirisposte sono codificate con A, B e C. Se la risposta è corretta il punteggio assegnato e +1mentre se la risposta è errata il punteggio è −0.25; se invece la risposta non viene data ilpunteggio è 0. Per superare il test bisogna raggiungere il punteggio minimo di 10.

1. Dire, motivando la risposta, se risulta più conveniente tentare tutte le risposte a casoo non rispondere alle domande.

2. Supponendo ora di aver deciso di rispondere a caso a tutte le 56 domande:

• si calcoli la probabilità di rispondere correttamente ad almeno 20 domande.• si calcoli la probabilità di rispondere correttamente ad almeno 2 domande tra

le prime 6. -27.49

Esercizio 25 (T 254, 17.09.2009, 4). Esaminando i risultati raccolti attraverso un’analisicondotta sui lavoratori di una impresa milanese emerge che abitualmente il 36% degliintervistati utilizza l’auto, il 24% utilizza il treno, il 10% la metropolitana e il restanteautobus o tram. Calcolare le seguenti probabilità:

1. scegliendo a caso un intervistato, che questo usi l’auto;2. scegliendo a caso quattro diversi intervistati, che due utilizzino il treno;3. scegliendo a caso tre diversi intervistati, che almeno uno si rechi al lavoro con

autobus o tram. -27.50

Esercizio 26 (T 255, 14.01.2010, 4). È stata studiata la distribuzione teorica del tempo,in minuti, necessario per la visita di una mostra.Si assume che i tempi dei visitatori seguono una distribuzione Normale, X , con media 21e varianza 2.Si calcoli, nell’ipotesi che i visitatori si comportino in maniera indipendente, la probabilitàche:

404

1. la durata della visita del generico visitatore sia superiore a 20 minuti;2. su 3 visitatori la durata della visita di almeno 2 sia superiore a 20 minuti. -

27.51

Esercizio 27 (T 256, 28.01.2010, 4). Il titolare di un ristorante ha condotto un’indaginesu 50 clienti osservando che 29 di essi amano i dolci mentre 11 sono vegetariani. Sapendoche tra i vegetariani, 8 amano i dolci:

1. si rappresenti l’insieme degli intervistati attraverso un diagramma di Venn.2. Si calcoli la probabilità che un cliente non sia vegetariano.3. Si calcoli la probabilità che un cliente sia vegetariano oppure non ami i dolci.4. Si calcoli la probabilità che un cliente sia vegetariano, sapendo che lo stesso non

ama i dolci.5. Supponendo di estrarre a caso 3 diversi clienti, si calcoli la probabilità che solo uno

di essi sia vegetariano. -27.52

Esercizio 28 (T 257, 11.02.2010, 6). Una classe è composta da 11 femmine e 16 maschi,dei quali il 50% ha i capelli neri.

1. Calcolare la probabilità che, interrogando a caso 3 differenti alunni, questi sianomaschi con i capelli neri.

2. Calcolare la probabilità che, nel caso sia stato estratto un maschio, questo abbia icapelli neri.

3. Calcolare la probabilità che, estraendo ogni giorno uno studente a caso dall’e-lenco completo degli iscritti alla classe, solo al 5 giorno venga interrogata unastudentessa. -

27.53

Esercizio 29 (T 258-1, 03.06.2010, 5). È stata studiata la distribuzione teorica del tempo,in minuti, necessario per la visita di una mostra.Si assume che i tempi dei visitatori seguano la seguente variabile casuale W .

wi−1 a wi P(wi−1 <W ≤ wi)5 a 10 0.43

10 a 15 0.3115 a 20 0.1620 a 25 0.0925 a 30 0.01

1. Si calcoli il valore atteso di W ;

Si calcoli, nell’ipotesi che i visitatori si comportino in maniera indipendente, la probabilitàche:

1. la durata della visita del generico visitatore sia superiore a 20 minuti;2. su 3 visitatori, la durata della visita di 2 sia superiore a 20 minuti e di uno sia

inferiore a 15 minuti. -27.54

Esercizio 30 (T 258-2, 01.07.2010, 3). In un gioco a premi i concorrenti devono effet-tuare delle estrazioni, senza re-immissione, da un’urna contenente 13 gettoni ROSSI e17 BIANCHI. Se la prima estrazione è ROSSA il concorrente ha diritto a una ulterioreestrazione; se invece la prima è BIANCA esso ha diritto a 2 ulteriori estrazioni. Si vincese, al termine della procedura, sono stati estratti 2 gettoni ROSSI.

1. Si calcoli la probabilità di vincere.2. Nell’ipotesi che il giocatore G1 estragga il primo gettone ROSSO e il giocatore G2

BIANCO, si determini chi dei due ha più probabilità di vincere.

405

3. Considerando ora l’estrazione con re-immissione di n = 90 gettoni, si calcoli laprobabilità di ottenere non più di 34 gettoni ROSSI. -

27.55

Esercizio 31 (T 258-3, 15.07.2010, 4). Dall’elenco degli 80 visitatori (30 esperti e 50occasionali) si estraggano 5 nominativi senza reimmissione.Si calcoli la probabilità che:

1. tra i 5 nominativi estratti ve ne siano solo 2 esperti;2. tra i 5 nominativi estratti ve ne sia almeno 1 esperto;3. supponendo di estrarre 100 nominativi con reimmissione, vi siano almeno 36 esper-

ti. -27.56

Esercizio 32 (T 259, 02.09.2010, 4). Una societa che gestisce campi da golf effettuaun’indagine sui suoi 300 dipendenti, di cui 170 sono maschi.È emerso che 84 donne non giocano a golf, e che il 70% degli uomini gioca a golf. Sicalcoli:

1. la probabilità che scegliendo a caso un dipendente questo sia giocatore di golf;2. la probabilità che sia maschio e giocatore di golf;3. la probabilità che estraendone in blocco 10, la metà di questi siano femmine gioca-

trici di golf. -27.57

Esercizio 33 (T 260, 16.09.2010, 4). Sapendo che P(A) = 0.6, P(A−B) = 0.33, P(A∩C) = 0.2, P(B∩C) = 0:

1. calcolare P(A∩B), P(C|A) e P(A−C);2. dire se B e C possono ritenersi stocasticamente indipendenti;3. calcolare la probabilità di ottenere meno di 20 successi in 51 lanci indipendenti,

sapendo che la probabilità di successo è p = 0.333. -27.58

Esercizio 34 (T 261, 13.01.2011, 4). L’ufficio controllo qualità di una data azienda rilevache la probabilità che un pezzo prodotto su una determinata linea sia difettoso è pari a0.1875. Si indichi con X la variabile casuale ’numero di pezzi difettosi rilevati in 10estrazioni indipendenti’.

1. Si determini la probabilità che su 10 pezzi estratti a caso se ne presentino al massi-mo 2 difettosi.

2. Supponendo che i pezzi estratti siano 120, si calcoli la probabilità di trovare menodi 25 pezzi difettosi. -

27.59

Esercizio 35 (T 262, 03.02.2011, 5). Sapendo che i tre eventi A, B, C costituiscono unapartizione dello spazio probabilistico Ω, che P(A) = 0.25 e che P(B) è il doppio di P(C),si calcoli:

1. P(A∩B)2. P(B−C)3. P(A∪Ω)4. Si ipotizzi che P(A) sia la probabilità di vincere un premio a un gioco: ripetendo il

gioco 105 volte qual è la probabilità di vincere al massimo 30 volte? -27.60

Esercizio 36 (T 263, 17.02.2011, 5). L’urna U1 contiene 10 palline bianche e 40 pallinerosse. L’urna U2 contiene 14 palline bianche, 20 rosse e 15 nere.

1. Si calcoli la probabilità che estraendo senza reimmissione 5 palline dall’urna U1 cene siano almeno 4 rosse.

406

2. Si estragga una pallina dall’urna U1 e la si metta nell’urna U2. Si calcoli la proba-bilità che estraendo con reimmissione 5 palline dall’urna U2 si ottengano 2 pallinebianche. -

27.61

Esercizio 37 (T 264-1, 09.06.2011, 6). Si considerino gli eventi A e B. Sapendo cheP(B|A) = 0.8 e che P(A∩B) = 0.2:

1. si calcoli P(A) e si indichi l’intervallo dei valori che puo assumere P(B).2. La probabilità di rispondere correttamente a un certo test è pari a 0.82. Con-

siderando le ripetizioni del test eventi indipendenti, si calcoli la probabilità chereplicandolo 6 volte lo si superi almeno 5 volte. -

27.62

Esercizio 38 (T 264-2, 23.06.2011, 5). Si consideri l’esperimento di lancio di due moneteregolari.

1. Si costruisca lo spazio degli eventi elementari.2. Si determini la probabilità che in almeno 2 su 7 prove si ottenga la stessa faccia in

entrambe le monete.3. Supponendo ora che le prove siano 50, determinare la probabilità che in almeno 30

si ottenga la stessa faccia in entrambe le monete. -27.63

Esercizio 39 (T 264-3, 07.07.2011, 5). Un’urna contiene 14 palline bianche e 36 pallinerosse.

1. Si calcoli la probabilità che estraendo senza reimmissione 7 palline dall’urna ce nesiano almeno 5 rosse.

2. Si calcoli la probabilità che estraendo con reimmissione 500 palline dall’urna siottengano almeno 127 palline bianche. -

27.64

Esercizio 40 (T 265, 08.09.2011, 5). Un gioco consiste nel lanciare 1 dado equilibrato e,subito dopo, una moneta equilibrata, tante volte quante il risultato ottenuto nel dado.

1. Si calcoli la probabilità dell’evento A = numero teste = 4.2. Si calcoli la probabilità che, eseguendo il gioco 100 volte, l’evento A si presenti

almeno 6 volte. -27.65

Esercizio 41 (T 265-1, 22.09.2011, 5). Un urna contiene 20 palline bianche e 20 pallinerosse e 10 nere.

1. Si calcoli la probabilità che estraendo senza reimmissione dall’urna 4 palline se neottengano almeno 3 rosse.

2. Si calcoli la probabilità che estraendo con reimmissione dall’urna 4 palline se neottengano 1 bianca, 2 rosse e 1 nera.

3. Si calcoli la probabilità che, estraendo con reimmissione 100 palline se ne ottenga-no almeno 40 bianche. -

27.66

Esercizio 42 (T 266, 12.01.2012, 5). Un urna contiene 2 palline bianche, 1 pallina rossae 2 nere.

1. Si calcoli la probabilità che estraendo dall’urna con reimmissione 90 palline se neottengano almeno 39 bianche.

2. Si calcoli la probabilità che estraendo senza reimmissione dall’urna 4 palline, diqueste una sola sia nera. -

27.67

407

Esercizio 43 (T 267, 26.01.2012, 6). Due dadi vengono truccati, in modo tale che in unocompaiano solo i numeri pari e nell’altro solo dispari.

1. Si calcoli la probabilità che, in un generico lancio, la somma dei risultati sia ≥ 8(evento A).

2. Si calcoli la probabilità condizionata che, essendo uscito 5 in uno dei due dadi,nell’altro si presenti 4.

3. Si calcoli la probabilità che su 90 lanci l’evento A (somma ≥ 8) si presenti almeno24 volte. -

27.68

Esercizio 44 (T 268, 09.02.2012, 5). Gli eventi A, B, C e D costituiscono una partizionedello spazio campionario, inoltre: P(A) = 0.4, P(B) è 4 volte P(D) e P(Ω∩C) = 0.2.

1. Si calcolino P(D), P(D|A) e P(B−C)2. Si stabilisca se A e D sono tra loro indipendenti.3. Si consideri un’urna contenente N = 35 palline, di cui alcune bianche e le altre

nere. Si calcoli la probabilità che su 4 estrazioni senza ripetizione si ottenga alme-no 1 pallina nera, sapendo che la probabilità di estrarre una pallina nera al primotentativo è pari a P(C). -

27.69

Esercizio 45 (T 269-1, 07.06.2012, 5). Si consideri l’esperimento di estrazione con reim-missione di 10 palline da un’urna contenente 10 palline rosse, 23 palline bianche e 17palline nere.

1. Si definisca la natura della variabile casuale X = ’numero di palline rosse estratte’.2. Si calcoli la probabilità di ottenere almeno 8 palline bianche nelle 10 estrazioni.3. Si consideri l’esperimento di estrazione con reimmissione di 100 palline dalla me-

desima urna; si calcoli la probabilità di ottenere almeno 23 palline rosse. -27.70

Esercizio 46 (T 269-2, 28.06.2012, 5). In un dado perfettamente bilanciato le sei faccesono colorate nel seguente modo: 2 blu e 4 rosse.

1. Il dado viene lanciato due volte: un giocatore perde 3 euro se i due lanci danno luo-go a un colore diverso e vince 5 euro se danno luogo allo stesso colore. Si forniscala distribuzione della variabile casuale X che descrive la vincita del giocatore e sicalcoli la vincita media attesa.

2. Si supponga di lanciare 70 volte il dado sopra descritto; calcolare la probabilità diottenere almeno 47 volte il colore rosso. -

27.71

Esercizio 47 (T 269-3, 12.07.2012, 5). Si consideri il seguente gioco: si estraggonosenza reimmissione 4 palline da un’urna contenente 18 palline bianche e 22 palline nere;pagando una posta di 1e si vincono 4e se il numero di palline bianche estratte è superiorea quello delle palline nere.

1. Si calcoli la probabilità di ottenere 4 palline bianche nelle 4 estrazioni.2. Si costruisca la variabile casuale X = ’guadagno del giocatore’.3. Si stabilisca se il gioco in oggetto è equo. -

27.72

Esercizio 48 (T 270, 06.09.2012, 4). Un gioco consiste nel lanciare 4 volte una monetaregolare scommettendo, a ogni lancio, 1e sull’evento Testa.

1. Si stabilisca se il gioco in oggetto è equo.2. dopo i primi 4 lanci ci si ritrovi esattamente con ancora 100 euro;3. dopo i primi 4 lanci il proprio capitale sia superiore ai 100 euro iniziali;4. Calcolare la probabilità che in 50 lanci si siano ottenuti almeno 26 eventi Testa. -

408

27.73

Esercizio 49 (T 270-1, 20.09.2012, 5). Si supponga di lanciare un dado regolare. Siconsideri il seguente gioco: si scommette, a ogni lancio, 1e e si vincono 2e se esce ilnumero 2 e 4e se esce il numero 4.

1. Si stabilisca se il gioco in oggetto è equo.

Calcolare la probabilità che:

1. In 3 lanci esca sempre il numero 4;2. In 90 lanci si vinca almeno 30 volte. -

27.74

Esercizio 50 (T 271, 10.01.2013, 5). Si consideri l’esperimento di estrazione di 4 pallineda un’urna contenente 21 palline rosse e 29 palline blu.

1. Si calcoli la probabilità di ottenere almeno 3 palline blu nell’ipotesi che le 4 estra-zioni siano effettuate senza reimmissione.

2. Si calcoli la probabilità di ottenere almeno 36 palline blu nell’ipotesi che sianoeffettuate 60 estrazioni con reimmissione. -

27.75

Esercizio 51 (T 272, 24.01.2013, 5). Si consideri l’esperimento di lancio di 10 moneteequilibrate e 6 dadi equilibrati.

1. Si calcoli la probabilità di ottenere 5 teste e 5 facce con numero pari.2. Ipotizzando di lanciare 100 monete e 100 dadi, si calcoli la probabilità di ottenere

almeno 50 teste e almeno 39 numeri pari. -27.76

Esercizio 52 (T 273, 07.02.2013, 5). Siano A,B,C e D quattro eventi che costituisconouna partizione dello spazio campionario, tali che P(A) = P(B) = 0.2 e P(D) = 2 ·P(C).

1. Si calcolino P(A|B), P(B∪D) e P(A∪B).2. Si dica se A e C possono ritenersi indipendenti.3. Si calcoli la probabilità di ottenere meno di 6 successi in 80 prove indipendenti con

probabilità di successo p = P(B). -27.77

Esercizio 53 (T 274-1, 06.06.2013, 5). L’urna U1 contiene 3 palline nere e 1 pallinarossa. L’urna U2 contiene 4 palline nere e 5 palline rosse.

1. Si calcoli la probabilità che estraendo con reimmissione 5 palline dall’urna U1 cene siano almeno 4 nere.

2. Si estragga una pallina dall’urna U1 e la si metta nell’urna U2. Si calcoli la pro-babilità che estraendo senza reimmissione 3 palline dall’urna U2 si ottengano 2palline nere. -

27.78

Esercizio 54 (T 274, 27.06.2013, 4). Un macchinario presenta un tasso di difettosità del6%.

1. Scelti a caso 4 pezzi (con reimmissione) dal flusso produttivo si calcoli la probabi-lità che nessuno sia difettoso.

2. Nell’ipotesi in cui siano effettuate 60 estrazioni si calcoli la probabilità che vi siaalmeno un pezzo difettoso. -

27.79

Esercizio 55 (T 274-2, 11.07.2013, 5). Per il seguente gioco è prevista una posta di 2e:si lanciano due dadi e se la somma dei numeri ottenuti è almeno pari a 9 si vincono 6e.

1. Si stabilisca se il gioco è equo.

409

2. Nell’ipotesi di ripetere il gioco 5 volte si calcoli la probabilità di vincere almeno 2volte. -

27.80

Esercizio 56 (T 275, 05.09.2013, 5). Si consideri l’esperimento di estrazione di 3 pallineda un’urna contenente 16 palline rosse, 19 gialle e 5 blu.

1. Si calcoli la probabilità di estrarre zero palline rosse nell’ipotesi che le estrazionivengano fatte senza reimmissione.

2. Si consideri, ora, l’esperimento di 50 estrazioni con reinserimento. Si calcoli laprobabilità di ottenere almeno 31 palline di colore blu. -

27.81

Esercizio 57 (T 275-1, 16.09.2013, 5). Si consideri l’esperimento di estrazione di 9palline da un’urna contenente 16 palline rosse, 19 gialle e 5 blu.

1. Si calcoli la probabilità di estrarre 2 palline rosse, 1 gialla e 6 blu nell’ipotesi chele estrazioni vengano fatte senza reimmissione.

2. Si calcoli la probabilità di estrarre 3 palline rosse, 4 gialle e 2 blu nell’ipotesi chele estrazioni vengano fatte con reimmissione.

3. Si calcoli la probabilità di ottenere almeno 12 palline di colore blu in 100 estrazionicon reimmissione. -

27.82

Esercizio 58 (T 276, 16.01.2014, 5). Vengono lanciati 3 dadi regolari

1. Si calcoli la probabilità che, essendosi presentati 3 numeri uguali, questi siano inumeri da 1 a 4.

2. Si calcoli la probabilità che su 51 lanci in almeno 10 tutti e 3 i dadi presentino unnumero pari. -

27.83

Esercizio 59 (T 277, 30.01.2014, 5). Date due differenti urne, U1 e U2, contenenti palli-ne numerate, un esperimento casuale consiste nell’estrarre una pallina da ciascuna urna.Sapendo che nell’urna U1 vi sono 5 palline con numero pari (2,4,6,8,10) e che nell’urnaU2 vi sono 2 palline con il numero 1, 2 con numero 3 e 2 con il numero 5:

1. costruire la distribuzione di probabilità delle variabili casuali X = “risultato estra-zione urna U1” e Y = “risultato estrazione urna U2”;

2. calcolare P(X = 10∩Y = 1), ovvero la probabilità che sia estratto il numero10 da U1 e il numero 1 da U2;

3. calcolare la probabilità che, su 100 estrazioni con reinserimento dalla sola urna U2,almeno 21 presentino il numero 3. -

27.84

Esercizio 60 (T 278, 13.02.2014, 5). Un’urna è composta da gettoni rossi e neri in pro-porzione 0.15 e 0.85. Ogni gettone rosso reca impresso il numero 1, i neri il numero 2. Siconsideri l’esperimento casuale G3 = ’estrazione con reimmissione di 3 gettoni dall’urna’.

1. Si costruisca lo spazio probabilistico associato all’esperimento G3.2. Si costruisca la variabile casuale X = ’somma dei valori impressi sui gettoni estratti’

e si calcoli la probabilità che X assuma valori maggiori o uguali a 5.3. Si calcoli la probabilità di ottenere almeno due gettoni rossi nelle 3 estrazioni.4. Si calcoli la probabilità di ottenere non più di un gettone rosso in 26 estrazioni con

reimmissione. -27.85

410

Sezione ARichiami di matematica

A.1

Indice

1 La sommatoria 4111.1 Esempi e proprietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411

2 Matrici e sommatorie doppie 412

3 I logaritmi 414

4 La funzione esponenziale 415

5 Capitalizzazione composta di un investimento a tassi variabili nel tempo 416

6 La produttoria 417

7 Approssimazione in serie di Taylor di ex e di ln(1+ x) 418

8 Autoverifica nozioni di aritmetica e di algebra elementare 421

9 Autoverifica nozioni di aritmetica e di algebra elementare - Soluzioni 423 A.2

1 La sommatoria

Data una k-upla di valori x1,x2, . . . ,xk, ovvero xi, i = 1,2, . . . ,k è possibile esprimere’in forma compatta’ la somma degli elementi come segue:

k

∑i=1

xi = x1 + x2 + . . .+ xk (1)

A.3

1.1 Esempi e proprietà

• Si supponga che k = 3 e siano: x1 = 1,x2 = 2,x3 = 3

x1 + x2 + x3 = 1+2+3 = 6

• Se c è una costante arbitraria:

k

∑i=1

cxi = ck

∑i=1

xi

411

(proprietà distributiva del prodotto rispetto alla somma)

se, ad esempio, c = 2, con riferimento alla terna 1,2,3 vale:

2 ·1+2 ·2+2 ·3 = 2+4+6 = 1212 = 2 ·6 = 2 · (1+2+3) = 2+4+6 = 12

A.4

• Se w è un valore intero: 1≤ w≤ k, la sommatoria (1) può essere scomposta comesegue:

k

∑i=1

xi =w

∑i=1

xi +k

∑i=w+1

xi

inoltre:k

∑i=1

c = k · c = kc,k

∑i=1

y j = ky j

A.5

2 Matrici e sommatorie doppie

Si consideri la seguente matrice:

a11 a12 a13a21 a22 a23a31 a32 a33

i indice di rigaj indice di colonna

Si utilizzi la sommatoria per ottenere il totale degli elementi:

• sulla prima riga3

∑j=1

a1 j = a11 +a12 +a13

• sulla terza colonna3

∑i=1

ai3 = a13 +a23 +a33

• sulla diagonale principale

3

∑i=1

aii = a11 +a22 +a33

A.6Vengono riportati degli esempi di utilizzo del simbolo di sommatoria doppia per scriverein maniera compatta la somma dei simboli che figurano nei riquadri

a11 a12 a13a21 a22 a23a31 a32 a33

3

∑i=1

2

∑j=1

ai j =3

∑i=1

(ai1 +ai2) =

= (a11 +a12)+(a21 +a22)+(a31 +a32) =

= (a11 +a21 +a31)+(a12 +a22 +a32) =2

∑j=1

3

∑i=1

ai j

412

A.7

a11 a12 a13a21 a22 a23a31 a32 a33

3

∑i=1

i

∑j=1

ai j =3

∑i=1

(ai1 +ai2 + . . .+aii) =

= a11 +(a21 +a22)+(a31 +a32 +a33)

3

∑j=1

3

∑i= j

ai j =3

∑j=1

(a j j +a j j+1 + . . .+a j3) =

= (a11 +a21 +a31)+(a22 +a32)+(a33)

A.8

a11 a12 a13a21 a22 a23a31 a32 a33

3

∑i=1

3

∑j=i

ai j =3

∑i=1

(aii +ai i+1 + . . .+ai3) =

= (a11 +a12 +a13)+(a22 +a23)+a33

3

∑j=1

j

∑i=1

ai j =3

∑j=1

(a1 j +a2 j + . . .+a j j) =

= a11 +(a12 +a22)+(a13 +a23 +a33)

A.9

413

3 I logaritmi

loga x = c, dove x > 0, a > 0, a 6= 1a: base del logaritmox: argomento della funzione logac: esponente da assegnare alla base a per ottenere l’argomento x:

ac = x

x

0 1 2 3 4 5

−10

−9

−8

−7

−6

−5

−4

−3

−2

−1

01

23

x

0 1 2 3 4 5

−3

−2

−1

01

23

45

67

89

10

a > 1 a < 1

A.10

Valori della base solitamente utilizzati:

a = 10, a = e = 2.71828

Notazioni: log10 x = Logx, loge x = lnxNel seguito si utilizzeranno i logaritmi in base e

Proprietà dei Logaritmi

• lnxy = lnx+ lny• ln x

y = lnx− lny• lnxy = y lnx• elnx = exp(lnx) = x• lne = 1• lnex = x

A.11

414

4 La funzione esponenziale

ax, x ∈ℜ, a > 0a: base della funzione esponenzialex: argomento della funzione esponenziale

x

−5 −4 −3 −2 −1 0 1 2 3 4 5

02

46

810

1214

1618

2022

2426

2830

x

−5 −4 −3 −2 −1 0 1 2 3 4 5

02

46

810

1214

1618

2022

2426

2830

a > 1 a < 1

A.12

Valore della base solitamente utilizzato:

a = e = 2.71828

ex = exp(x)

Proprietà della funzione esponenziale

• ex · ey = ex+y

• ex

ey = ex−y

• (eb)c = ebc= ebc

• attenzione: e(bc) 6= ebc

• e0 = 1• lnex = x• lne = 1• elnx = x

A.13

415

5 Capitalizzazione composta di un investimento a tassivariabili nel tempo

Se investo al tempo 0 una somma pari a C

Richiami di Matematica

TASSO COMPLESSIVO DI INVESTIMENTO Se investo al tempo 0 una somma pari a C C 5% 8% 2% 10% M 0 1 2 3 4 alla fine del primo anno il deposito ammonterà a: C (1 + 0.05) alla fine del secondo anno il deposito ammonterà a: C (1 + 0.05) (1 + 0.08) alla fine del terzo anno il deposito ammonterà a: C (1 + 0.05) (1 + 0.08) (1 + 0.02) e alla fine del quarto anno il deposito ammonterà a: C (1 + 0.05) (1 + 0.08) (1 + 0.02) (1 + 0.10) = M

j ij xj = 1 + ij 1 0.05 1.05 2 0.08 1.08 3 0.02 1.02 4 0.10 1.10

La relazione che intercorre tra C, capitale iniziale, ed M, montante finale, è la seguente:

M = C ∏j=1

4

(1 + ij) = C ∏j=1

4

xj = C ⋅ 1.27234.

alla fine del primo anno il deposito ammonterà a:

C · (1+0.05)

alla fine del secondo anno il deposito ammonterà a:

C · (1+0.05) · (1+0.08)

alla fine del terzo anno il deposito ammonterà a:

C · (1+0.05) · (1+0.08) · (1+0.02)

e alla fine del quarto anno il deposito ammonterà a:

C · (1+0.05) · (1+0.08) · (1+0.02) · (1+0.10) = M

A.14

j i j x j = 1+ i j1 0.05 1.052 0.08 1.083 0.02 1.024 0.10 1.10

La relazione che intercorre tra C, capitale iniziale, ed M, montante finale, è la seguente:

M =C4

∏j=1

(1+ i j) =C4

∏j=1

x j =C ·1.27234.

A.15

416

6 La produttoria

Data una k-upla di valori (x1,x2, . . . ,xk), ovvero (xi, i = 1,2, . . . ,k)

k

∏i=1

xi = x1 · x2 · . . . · xk

se c è una costante arbitraria:

k

∏i=1

c = c · c · . . . · ck volte

= ck quindik

∏i=1

y j = ykj

k

∏i=1

(cxi) = ckk

∏i=1

xi

A.16

Relazione con i logaritmi

ln

(k

∏i=1

xi

)= ln(x1 · x2 · . . . · xk) =

= lnx1 + lnx2 + . . .+ lnxk =k

∑i=1

lnxi

Esercizio 1. Dimostrare la seguente eguaglianza

ln

(k

∏i=1

x fii

)=

k

∑i=1

ln(xi) · fi

A.17

417

7 Approssimazione in serie di Taylor di ex e di ln(1+ x)

Sia f (x) una funzione, definita su un intervallo aperto (x0−r,x0+r) che ammette derivatefino all’ordine n. Si definisce polinomio di Taylor di grado n relativo alla funzione f e alpunto x0 il seguente polinomio:

Tn(x) =n

∑k=0

f (k)(x0)(x− x0)

k

k!

avendo indicato con f (k)(x) = dk f (x)dxk la derivata k-esima di f (x) e con k! il fattoriale di k.

La formula di Taylor consente di ottenere un’approssimazione della funzione f (x).Nelle tabelle seguenti si riportano gli errori corrispondenti alle approssimazioni del primoordine, T1(x), delle funzioni ex e ln(1+ x), con x0 = 0 e −0.15≤ x≤ 0.15. A.18

−5 −4 −3 −2 −1 0 1 2 3 4

−5

−4

−3

−2

−1

01

23

4

ex

1 + x

A.19

−5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8

−5

−4

−3

−2

−1

01

23

4

ln(x)

−1+x

−5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8

−5

−4

−3

−2

−1

01

23

4

ln(1+x)

x

A.20

418

x ex 1+ x (1+ x)− ex

−0.15000 0.86070 0.85000 −0.01070−0.14375 0.86610 0.85625 −0.00985−0.13750 0.87150 0.86250 −0.00900−0.13125 0.87700 0.86875 −0.00825−0.12500 0.88250 0.87500 −0.00750−0.11875 0.88800 0.88125 −0.00675−0.11250 0.89360 0.88750 −0.00610−0.10625 0.89920 0.89375 −0.00545−0.10000 0.90480 0.90000 −0.00480−0.09375 0.91050 0.90625 −0.00425−0.08750 0.91620 0.91250 −0.00370−0.08125 0.92200 0.91875 −0.00325−0.07500 0.92770 0.92500 −0.00270−0.06875 0.93360 0.93125 −0.00235−0.06250 0.93940 0.93750 −0.00190−0.05625 0.94530 0.94375 −0.00155−0.05000 0.95120 0.95000 −0.00120−0.04375 0.95720 0.95625 −0.00095−0.03750 0.96320 0.96250 −0.00070−0.03125 0.96920 0.96875 −0.00045−0.02500 0.97530 0.97500 −0.00030−0.01875 0.98140 0.98125 −0.00015−0.01250 0.98760 0.98750 −0.00010−0.00625 0.99380 0.99375 −0.00005

0.00000 1.00000 1.00000 0.000000.00625 1.00630 1.00625 −0.000050.01250 1.01260 1.01250 −0.000100.01875 1.01890 1.01875 −0.000150.02500 1.02530 1.02500 −0.000300.03125 1.03170 1.03125 −0.000450.03750 1.03820 1.03750 −0.000700.04375 1.04470 1.04375 −0.000950.05000 1.05130 1.05000 −0.001300.05625 1.05790 1.05625 −0.001650.06250 1.06450 1.06250 −0.002000.06875 1.07120 1.06875 −0.002450.07500 1.07790 1.07500 −0.002900.08125 1.08460 1.08125 −0.003350.08750 1.09140 1.08750 −0.003900.09375 1.09830 1.09375 −0.004550.10000 1.10520 1.10000 −0.005200.10625 1.11210 1.10625 −0.005850.11250 1.11910 1.11250 −0.006600.11875 1.12610 1.11875 −0.007350.12500 1.13310 1.12500 −0.008100.13125 1.14030 1.13125 −0.009050.13750 1.14740 1.13750 −0.009900.14375 1.15460 1.14375 −0.010850.15000 1.16180 1.15000 −0.01180

A.21

419

x 1+ x ln(1+ x) x− ln(1+ x)−0.15000 0.85000 −0.16250 0.01250−0.14375 0.85625 −0.15520 0.01145−0.13750 0.86250 −0.14790 0.01040−0.13125 0.86875 −0.14070 0.00945−0.12500 0.87500 −0.13350 0.00850−0.11875 0.88125 −0.12640 0.00765−0.11250 0.88750 −0.11930 0.00680−0.10625 0.89375 −0.11230 0.00605−0.10000 0.90000 −0.10540 0.00540−0.09375 0.90625 −0.09840 0.00465−0.08750 0.91250 −0.09160 0.00410−0.08125 0.91875 −0.08470 0.00345−0.07500 0.92500 −0.07800 0.00300−0.06875 0.93125 −0.07120 0.00245−0.06250 0.93750 −0.06450 0.00200−0.05625 0.94375 −0.05790 0.00165−0.05000 0.95000 −0.05130 0.00130−0.04375 0.95625 −0.04470 0.00095−0.03750 0.96250 −0.03820 0.00070−0.03125 0.96875 −0.03170 0.00045−0.02500 0.97500 −0.02530 0.00030−0.01875 0.98125 −0.01890 0.00015−0.01250 0.98750 −0.01260 0.00010−0.00625 0.99375 −0.00630 0.00005

0.00000 1.00000 0.00000 0.000000.00625 1.00625 0.00620 0.000050.01250 1.01250 0.01240 0.000100.01875 1.01875 0.01860 0.000150.02500 1.02500 0.02470 0.000300.03125 1.03125 0.03080 0.000450.03750 1.03750 0.03680 0.000700.04375 1.04375 0.04280 0.000950.05000 1.05000 0.04880 0.001200.05625 1.05625 0.05470 0.001550.06250 1.06250 0.06060 0.001900.06875 1.06875 0.06650 0.002250.07500 1.07500 0.07230 0.002700.08125 1.08125 0.07810 0.003150.08750 1.08750 0.08390 0.003600.09375 1.09375 0.08960 0.004150.10000 1.10000 0.09530 0.004700.10625 1.10625 0.10100 0.005250.11250 1.11250 0.10660 0.005900.11875 1.11875 0.11220 0.006550.12500 1.12500 0.11780 0.007200.13125 1.13125 0.12330 0.007950.13750 1.13750 0.12880 0.008700.14375 1.14375 0.13430 0.009450.15000 1.15000 0.13980 0.01020

A.22

420

8 Autoverifica nozioni di aritmetica e di algebra ele-mentare

1. Indicate il ’dominio’ di ciascuna delle seguenti variabili e stabilite se sono continueo discrete:

(a) somma S dei punti ottenuti nel lancio di due dadi,

(b) diametro D di una sfera,

(c) numero N di individui in una famiglia,

(d) altezza H di un coscritto alla leva,A.23

2. Arrotondate il numero 46.7385:

(a) alla decina più prossima,

(b) al terzo decimale,

(c) all’unità più prossima.A.24

3. Dite il numero di cifre significative e indicate l’intervallo dei possibili valori cheportano alle seguenti misurazioni:

(a) velocità di 119 km/h,

(b) altezza di 1.76 m.A.25

4. Esprimete ciascun numero senza usare le potenze di dieci:

(a) 2.8 ·106,

(b) 0.000185 ·105.A.26

5. Eseguite le operazioni indicate, arrotondando il risultato con tante cifre decimalitali da garantire almeno 4 cifre significative:

(a) 22.58 ·5.16,

(b) 5.78 ·2700 ·16.00,

(c) (416.00 ·0.00019)/√

73.84.A.27

6. Calcolate le seguenti espressioni, sapendo che U = −2, V = 1/2, Z = 1/6, conquattro cifre significative:

(a) 4U−6V −2Z,

(b)√

U2−2UV +Z2,

(c) (U−V )/√

U2 +V 2,

(d) 3(U−V )2 +Z.A.28

7. Localizzate su un sistema di coordinate cartesiane i punti di coordinate:

(a) A = (0,1),B = (1,3),C = (2,3),D = (3,1),

(b) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = |X |,(c) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = 10−2X ,

(d) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = 2+X2,A.29

8. Risolvete le seguenti equazioni (e sistemi):

421

(a) 16−5c = 36,

(b) 2(12+ y)/3 = 6− (9− y)/2,

(c) 3x2 +2x−1 = 0,

(d) 2a+b = 10; 7a−3b = 9.A.30

9. Usate i simboli di diseguaglianza per esprimere le seguenti proposizioni:

(a) il numero N di bambini è compreso fra 30 e 50, estremi compresi,

(b) la somma S dei punteggi D1 e D2 di due dadi è non minore di sette,

(c) X è maggiore o uguale a −4 e minore di 3,

(d) X è superiore a Y per più di due.A.31

10. Risolvete le seguenti diseguaglianze:

(a) 3x≥ 12,

(b) −3≤ (2x+1)/5 < 3,

(c) |x| ≤ 3.A.32

11. Calcolate le seguenti espressioni:

(a) y = 3 · x10, lny = . . .,

(b) y = 10/x, lny = . . ..A.33

422

9 Autoverifica nozioni di aritmetica e di algebra ele-mentare - Soluzioni

1. Indicate il ’dominio’ di ciascuna delle seguenti variabili e stabilite se sono continueo discrete:

(a) somma S dei punti ottenuti nel lancio di due dadi,2,3, . . . ,12 (discreta)

(b) diametro D di una sfera,(0,∞) (continua)

(c) numero N di individui in una famiglia,1,2, . . . ,nmax (discreta)

(d) altezza H di un coscritto alla leva,[amin,amax] (continua)

A.34

2. Arrotondate il numero 46.7385:

(a) alla decina più prossima,50

(b) al terzo decimale,46.739

(c) all’unità più prossima.47

A.35

3. Dite il numero di cifre significative e indicate l’intervallo dei possibili valori cheportano alle seguenti misurazioni:

(a) velocità di 119 km/h,3 [118.5,119.5)

(b) altezza di 1.76 m.3 [1.755,1.765)

A.36

4. Esprimete ciascun numero senza usare le potenze di dieci:

(a) 2.8 ·106,2 800 000

(b) 0.000185 ·105.18.5

A.37

5. Eseguite le operazioni indicate, arrotondando il risultato con tante cifre decimalitali da garantire almeno 4 cifre significative:

(a) 22.58 ·5.16,116.5128

(b) 5.78 ·2700 ·16.00,249696

(c) (416.00 ·0.00019)/√

73.84.0.009198

A.38

423

6. Calcolate le seguenti espressioni, sapendo che U = −2, V = 1/2, Z = 1/6, conquattro cifre significative:

(a) 4U−6V −2Z,−11.33

(b)√

U2−2UV +Z2,2.455

(c) (U−V )/√

U2 +V 2,−1.213

(d) 3(U−V )2 +Z.18.92

A.39

6. Calcolate le seguenti espressioni, sapendo che U = −2, V = 1/2, Z = 1/6, conalmeno quattro cifre significative:

(a) 4U−6V −2Z,−11.3333

(b)√

U2−2UV +Z2,2.4552

(c) (U−V )/√

U2 +V 2,−1.2127

(d) 3(U−V )2 +Z.18.9167

A.40

7. Localizzate su un sistema di coordinate cartesiane i punti di coordinate:

(a) A = (0,1),B = (1,3),C = (2,3),D = (3,1),

x

−1 0 1 2 3 4

01

23

45

A

B C

D

A.41

424

(b) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = |X |,

x

−3 −2 −1 0 1 2 3 4

01

23

A.42

(c) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = 10−2X ,

x

−3 −2 −1 0 1 2 3 4

−2

−1

01

23

45

67

89

1011

1213

1415

A.43

(d) P = (X ,Y ) con X =−2,−1,0,1,2,3 e Y = 2+X2,

x

−3 −2 −1 0 1 2 3 4

−1

01

23

45

67

89

1011

12

A.44

425

8. Risolvete le seguenti equazioni (e sistemi):

(a) 16−5c = 36,c =−4

(b) 2(12+ y)/3 = 6− (9− y)/2,y =−39

(c) 3x2 +2x−1 = 0,x = −1,1/3

(d) 2a+b = 10; 7a−3b = 9.a = 3,b = 4

A.45

9. Usate i simboli di diseguaglianza per esprimere le seguenti proposizioni:

(a) il numero N di bambini è compreso fra 30 e 50, estremi compresi,30≤ N ≤ 50 (intero)

(b) la somma S dei punteggi D1 e D2 di due dadi è non minore di sette,S≥ 7 oppure D1 +D2 ≥ 7

(c) X è maggiore o uguale a −4 e minore di 3,−4≤ X < 3

(d) X è superiore a Y per più di due.X > Y +2

A.46

10. Risolvete le seguenti diseguaglianze:

(a) 3x≥ 12,x≥ 4

(b) −3≤ (2x+1)/5 < 3,−8≤ x < 7

(c) |x| ≤ 3.−3≤ x≤ 3

A.47

11. Calcolate le seguenti espressioni:

(a) y = 3 · x10, lny = . . .,lny = ln3+10lnx

(b) y = 10/x, lny = . . ..lny = ln10− lnx

A.48

426

Indice analitico

adattamento 258, 266, 268, 271, 274, 290,291algebra degli eventi S (Ω) .349, 349, 353,354, 373, 374, 374, 375, 375, 376analisi del rapporto di correlazione . . . 236applicazioni del risultato di scomposizionedella varianza . . . . . . . . . . . . . . . . . . . . . . 149approccio deduttivo . . . . . . . . . . . . . . . . . . . 2approccio induttivo . . . . . . . . . . . . . . . . . . . 2approccio pragmatico . . . . . . . . . . . . . . . . 23approssimazione della variabile casualebinomiale con la Normale . . . . . . . . . . . 399asimmetria negativa . . . . . . . . . . . . . . . . 162asimmetria positiva . . . . . . . . . . . . . . . . . 162assiomi del calcolo delle probabilità . . 349autoverifica nozioni di aritmetica e dialgebra elementare . . . . . . . . . . . . . . . . . 421

bontà di adattamento . . . . . . . . . . . . . . . 258box & whiskers plot . . . . . . . . . . . . . 75, 167

calcolo del rapporto di correlazione inpresenza di coppie di dati . . . . . . . . . . . 311campo di variazione . . . . . . . . . . . . . . . . 126capitalizzazione composta di un inve-stimento a tassi variabili nel tempo416caratteri qualitativi . . . . . . . . . . . . . . . . . . 16caratteri qualitativi ordinati . . . . . . . . . . . 16caratteri qualitativi sconnessi . . . . . . . . . 16caratteri quantitativi . . . . . . . . . . . . . . . . . 19caratteri quantitativi continui . . . . . . . . . 19caratteri quantitativi discreti . . . . . . . . . . 19caratteri stocasticamente indipendenti 201classi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35classificazione congiunta di due caratteri53coefficiente binomiale . . . . . . . . . . . . . . 366coefficiente multinomiale . . . . . . . . . . . 368coefficiente di correlazione lineare . . . 274coefficiente di scostamento . . . . . . . . . . 134coefficiente di variazione . . . . . . . . . . . . 133combinazioni . . . . . . . . . . . . . . . . . . . . . . 366combinazioni multiple e coefficiente mul-tinomiale . . . . . . . . . . . . . . . . . . . . . . . . . . 368condizione di ammissibilità per le mutabili(variabili) statistiche doppie . . . . . . . . . 203condizione di Cauchy per una media . . 59condizione di monotonicità per una media59, 61

confronto tra η2 e ρ2 . . . . . . . . . . . . . . . 276confronto tra grafici box & whiskers plot167connessione . . . . . . . . . . . . . . . . . . . . . . . 207connessione, indici χ2, χ2

N e χN . . . . . 209connessione, indice di Goodman-Kruskal228contingenze assolute . . . . . . . . . . . . . . . . 208contingenze relative . . . . . . . . . . . . . . . . 208contingenze relative, interpretazione . 214correlazione, lineare . . . . . . . . . . . . . . . . 274correlazione, rapporto di . . 150, 234, 236,264, 301, 311covarianza . . . . . . . . . . . . . . . . . . . . . . . . . 246covarianza tra trasformazioni lineari . .254criterio dei minimi quadrati . . . . . . . . . 258criterio di scelta della media per minimiz-zazione del danno . . . . . . . . . . . . . . . . . . 100criterio di scelta della media secondoChisini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96curtosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

danno (perdita media) assoluto . . . . . . 100danno (perdita media) quadratico . . . . 102densità di frequenza . . . . . . . . . . . . . . . . . 38differenza semplice media . . . . . . . . . . .126differenza quadratica media . . . . . . . . . 127dipendenza funzionale . . . . . . . . . . . . . . 203dipendenza lineare . . . . . . . . . . . . . . . . . 272diseguaglianza di Tchebychev . . . . . . . 154dispersione rispetto a un centro . . . . . . 127distanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19distribuzione doppia. . . . . . . . . . . . .53, 198distribuzione leptocurtica . . . . . . . . . . . 169distribuzione platicurtica . . . . . . . . . . . . 169distribuzioni asimmetriche . . . . . . . . . . 161distribuzioni condizionate . . . . . . . 55, 198distribuzioni marginali . . . . . . . . . . 54, 198distribuzioni simmetriche . . . . . . . . . . . 157

effect size . . . . . . . . . . . . . . . . . . . . . 211, 341esperimento aleatorio . . . . . . . . . . . . . . . 344eterogeneità, indici di . . . . . . . . . . . . . . . 110eventi casuali . . . . . . . . . . . . . . . . . . . . . . 344eventi condizionati . . . . . . . . . . . . . . . . . 359eventi incompatibili . . . . . . . . . . . . 347, 350eventi indipendenti . . . . . . . . . . . . . . . . . 362eventi, relazioni tra . . . . . . . . . . . . . . . . . 346evento impossibile . . . . . . . . . . . . . . . . . 345

B.1

427

fenomeni aleatori . . . . . . . . . . . . . . . . 2, 344fenomeni aleatori ripetibili (ripetitivitàattuale) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3fenomeni aleatori ripetibili (ripetitivitàvirtuale) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2formula di Bayes . . . . . . . . . . . . . . . . . . . 370frequenze assolute . . . . . 26, 28, 30, 33, 37frequenze cumulate . . . . . . . . . . . 30, 33, 37frequenze relative . . . . . . 26, 28, 30, 33, 37funzione di perdita in valore assoluto . 100funzione di perdita quadratica . . . . . . . 102funzione di probabilità349, 349, 353, 354,373, 374, 374, 375, 375funzione di regressione . . . . 260, 300, 310funzione di ripartizione . . 31, 34, 40, 387,392funzione di ripartizione retrocumulata . 66funzioni delle componenti di una variabilestatistica doppia . . . . . . . . . . . . . . . . . . . . 243

gioco equo . . . . . . . . . . . . . . . . . . . . . . . . 355grafi di probabilità . . . . . . . . . . . . . . . . . .372grafico a bastoncini . . . . . . . . . . . 27, 31, 34grafico bubble plot . . . . . . . . . . . . . . . . . 300grafico box & whiskers plot . . . . . . 75, 167grafico a dispersione . . . . . . . . . . . . . . . . 257grafico di Pareto . . . . . . . . . . . . . . . . . 27, 44grafico word cloud . . . . . . . . . . . . . . . 28, 45

indicazioni operative sull’utilizzo dellemisure di posizione e di variabilità . . . 138indice dei prezzi di Fisher . . . . . . . . . . . 185indice dei prezzi di Laspeyres . . . . . . . 185indice dei prezzi di Paasche . . . . . . . . . 185indice di adattamento . 266, 268, 271, 274,290, 291indici di asimmetria . . . . . . . . . . . . . . . . 164indice di connessione χ2 . . . . . . . . . . . . 209indice di connessione diGoodman-Kruskal . . . . . . . . . . . . . . . . . .228indice di eterogeneità di Frosini . . . . . .116indice di eterogeneità di Gini . . . . . . . . 112indici di connessione χ2

N e χN . . . . . . . 209indici di Curtosi . . . . . . . . . . . . . . . . . . . . 169indici di dispersione. . . . . . . .127, 128 129indice di miglioramento . . . . . . . . 292, 341indici di penetrazione relativi . . . . . . . . 176indici di posizione . . . . . . . . . . . . . . . . . . . 58indici di variabilità globale . . . . . . . . . . 125indici inter-popolazione . . . . . . . . . . . . . 177indici inter-temporali . . . . . . . . . . . . . . . 178indici normalizzati . . . . . . . . . . . . . . . . . 113

indici relativi . . . . . . . . . . . . . . . . . . . . . . 133indipendenza in media . . . . . . . . . 236, 238indipendenza lineare . . . . . . . . . . . 272, 273indipendenza stocastica tra variabili stati-stiche . . . . . . . . . . . . . . . . . . . . . . . . 201, 238,273indipendenza stocastica tra eventi . . . . 362inferenza statistica . . . . 6, 7, 319, 326, 370insiemi disgiunti . . . . . . . . . . . . . . . . . . . 347internalità delle medie . . . . . . . . . . . . . . . 59interpretazione dei coefficienti di regres-sione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295interpretazione della covarianza . . . . . .246intersezione di insiemi . . . . . . . . . . . . . . 348istogramma . . . . . . . . . . . . . . . . . . . . . . . . . 39

legge delle probabilità totali . . . . . . . . . 368

matrice dei dati . . . . . . . . . . . . . . . . . . . . . 14media aritmetica . . . . . . . . . . . . . . . . . . . . 83media aritmetica, interpretazione fisica 92media aritmetica, operatore lineare . . . . 93media aritmetica (media in senso stretto),dimostrazione . . . . . . . . . . . . . . . . . . . . . . . 90media aritmetica di una trasformazionelineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93media armonica . . . . . . . . . . . . . . . . . . . . . 84media campionaria . . . . . . . . . . . . . . . . . 320media di una combinazione lineare . . . 252media di una funzione di una variabilestatistica doppia . . . . . . . . . . . . . . . . . . . . 244media di una variabile casuale . . . . . . . 398media geometrica . . . . . . . . . . . . . . . . . . . 87media quadratica . . . . . . . . . . . . . . . . . . . . 85mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73medie condizionate . . . . . . . . . . . . 232, 234medie potenziate . . . . . . . . . . . . . . . . . . . . 83misura relativa . . . . . . . . . . . . . . . . . . . . . . 20misure di importanza delle variabili espli-cative nei modelli di regressione . . . . .341moda . . . . . . . . . . . . . . . . . . . . . . . . . . . 60, 60modalità di un carattere . . . . . . . . . . . . . . 15modelli di regressione . . . . . . . . . . . . . . 257modelli di regressione, coefficienti stan-dardizzati . . . . . . . . . . . . . . . . . . . . . . . . . .327modelli di regressione, estensione modellolineare regressione multipla . . . . . . . . . 321modelli di regressione, interpretazione deicoefficienti . . . . . . . . . . . . . . . . . . . . . . . . 295modelli di regressione, modelli incompleti291

B.2

428

modelli di regressione, modelli linearizza-bili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289modelli di regressione, previsione . . . . 293modelli di regressione, valutazione tramodelli alternativi . . . . . . . . . . . . . . . . . . 290modelli di regressione con variabili indi-catrici (dummy) . . . . . . . . . . . . . . . . . . . . 329modello costante . . . . . . . . . . . . . . . . . . . 268modello retta . . . . . . . . . . . . . . . . . . . . . . 269modello retta, scomposizione della varian-za totale . . . . . . . . . . . . . . . . . . . . . . . . . . . 271modello retta, indice di adattamento . . 271modello retta vincolata . . . . . . . . . . . . . .288momenti . . . . . . . . . . . . . . . . . . . . . . . . . . . .94monotonicità delle medie . . . . . . . . . 59, 61monotonicità delle medie potenziate . . . 86mosaic plot . . . . . . . . . . . . . . . . . . . . . . . . 217mutabile statistica . . . . . . . . . . . . . . . . . . . 26mutabilità . . . . . . . . . . . . . . . . . . . . . . . . . 110

numeri indici . . . . . . . . . . . . . . . . . . . . . . 178numeri indici a base fissa. . . . . . . . . . . .178numeri indici a base mobile . . . . . . . . . 178numeri indici, cambiamento di base . . 180numeri indici dei prezzi . . . . . . . . . . . . . 184numeri indici di borsa . . . . . . . . . . . . . . 186

odds e odds ratio . . . . . . . . . . . . . . 220, 357operatore media aritmetica . . . . . . . . . . . 93

p-value . . . . . . . . . . . . . . . . . . . . . . . . . . . .327partizione . . . . . . . . . . . . . . . . . . . . . . . . . 175percentili . . . . . . . . . . . . . . . . . . . . . . . . . . 62perdita di informazione . . . . . . 26, 38, 100permutazioni . . . . . . . . . . . . . . . . . . . . . . 364polinomi di regressione . . . . . . . . . . . . . 265probabilità, assiomi . . . . . . . . . . . . . . . . .349probabilità composta . . . . . . . . . . . . . . . 363probabilità condizionata . . . . . . . . . . . . 359probabilità dell’evento unione . . . . . . . 350probabilità, elicitazione classica . . . . . 352probabilità, elicitazione frequentista . . 353probabilità, elicitazione soggettiva . . . 354problema della scelta della media . . . . . 95problemi simmetrici e asimmetrici . . . 197proprietà associativa della media aritmeti-ca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104proprietà media, mediana, media geome-trica (riassunto) . . . . . . . . . . . . . . . . . . . . 107proprietà di minimo della media aritmetica130proprietà di minimo della mediana . . . 130

quadro riassuntivo indipendenza stocasti-ca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202quantili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

rapporti di composizione . . . . . . . . . . . . 175rapporti di contingenza . . . . . . . . . . . . . 208rapporti di contingenza, interpretazione214rapporti di densità . . . . . . . . . . . . . . . . . . 176rapporti di durata . . . . . . . . . . . . . . . . . . . 187rapporti di offerta turistica . . . . . . . . . . 188rapporti di propensione turistica . . . . . 188rapporti di ripetizione . . . . . . . . . . . . . . . 187rapporti relativi ai flussi turistici . . . . . 188rappresentazione grafica di una seriestorica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49rappresentazione grafica di un caratterequalitativo . . . . . . . . . . . . . . . . . . . . . . . . . . 26rappresentazione grafica di un caratterequantitativo non raggruppato in classi . 33rappresentazione grafica di un caratterequantitativo raggruppato in classi . . . . . 35regressione dei minimi quadrati . . . . . . 258regressione dei minimi quadrati, originedel termine . . . . . . . . . . . . . . . . . . . . . . . . 262relazione tra indipendenza stocastica eindipendenza in media . . . . . . . . . . . . . . 238relazione tra indipendenza stocastica, indi-pendenza in media e indipendenza lineare273residuo quadratico medio . . . . . . . . . . . 258residuo quadratico medio di un modellopolinomiale . . . . . . . . . . . . . . . . . . . . . . . . 266retta di regressione . . . . . . . . . . . . . . . . . 269

scala per intervalli . . . . . . . . . . . . . . . . . . . 21scala per rapporti . . . . . . . . . . . . . . . . . . . . 22scale per caratteri qualitativi . . . . . . 16, 23scale per caratteri quantitativi . . 16, 21, 23scostamento medio assoluto dalla mediana128scarto quadratico medio . . . . . . . . . . . . . 129schema della scommessa . . . . . . . . . . . . 354scomposizione della varianza . . . 145, 264seriazione statistica . . . . . . . . . . . . . . . . . . 37serie statistica . . . . . . . . . . . . . . . . . . . . . . . 33serie storica . . . . . . . . . . . . . . . . . . . . . . . . . 49sommatoria . . . . . . . . . . . . . . . . . . . . . . . . 411spazi campionari simmetrici . . . . . . . . . 352spazio campionario . . . . . . . . . . . . . . . . . 345spazio probabilistico . 345, 352, 353, 360,361, 373

B.3

429

statistica descrittiva e statistica inferenzia-le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319sviluppo in serie di Taylor . 289, 295, 296,340, 418

tabella a doppia entrata . . . . . . . . . . . . . . 53tavola variabile casuale Normale standar-dizzata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393teorema fondamentale sulle medie poten-ziate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86teoremi del calcolo delle probabilità . . 350

unione di insiemi . . . . . . . . . . . . . . . . . . . 347unità sperimentale o statistica . . . . . . . . . 15

variabile casuale .373, 374, 374, 375, 377,378, 382, 391variabile casuale binomiale . . . . . . . . . . 378variabile casuale di Bernoulli . . . . . . . . 377variabile casuale di Poisson . . . . . . . . . 389variabile casuale esponenziale negativa390variabile casuale Gamma. . . . . . . . . . . .390variabile casuale ipergeometrica . . . . . 382variabile casuale Normale . . . . . . . . . . . 391variabile casuale Normale, schema inter-pretativo. . . . . . . . . . . . . . . . . . . . . . . . . . .399variabile casuale uniforme (continua) .389variabile casuale uniforme discreta . . . 386variabile scarto dalla media aritmetica . 93variabile statistica . . . . . . . . . . . . . . . . . . . 47variabile statistica degenere . . . . . . . . . . 87variabile statistica standardizzata. . . . .144variabili indicatrici (dummy) . . . . . . . . 296variabilità accidentale . . . . . . . . . . . . . . . . . 2varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . 131varianza di una combinazione lineare .253varianza di una trasformazione lineare132varianza di una variabile casuale . . . . . 398varianza di un miscuglio . . . . . . . . . . . . 145varianza between . . . . . . . . . . . . . . 146, 264varianza campionaria . . . . . . . . . . . . . . . 320varianza residua della funzione di regres-sione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262,146varianza spiegata . . . . . . . . . . . . . . 264, 146varianza within . . . . . . . . . . . . . . . . . . . . 146varianze condizionate . . . . . . . . . . . . . . . 232variazione assoluta . . . . . . . . . . . . . . . . . . 20variazione relativa . . . . . . . . . . . . . . . . . . . 20variazione relativa media . . . . . . . . . . . . 181

word cloud . . . . . . . . . . . . . . . . . . . . . . 28, 45 B.4

430

Riferimenti bibliografici

[1] Bertoli Barsotti L. 1998 Probabilità: aspetti storici ed assiomatizzazione, Dirittoallo Studio Universitario, Università Cattolica del Sacro Cuore, Milano.

[2] Bonanomi A., Cantaluppi G. 2012 Measurement scales, in R. Kenett S. Salini,Modern Analysis of Customer Surveys: with applications using R, John Wiley,Chicester.

[3] Borra S., Di Ciaccio A. 2008 Statistica. Metodologie per le scienze economiche esociali, Seconda edizione. Mc-Graw-Hill, Milano.

[4] Cantaluppi G., Bianchi B., Piraina D., La Placa F. 2011 A Structural Equation Mo-del Proposal for evaluating Visitor Satisfaction at an Exhibition, Innovation andSociety. Statistical methods for service evaluation, 30 May - 1 June 2011, Florence- Book of Abstracts, Facoltà di Economia, Università degli Studi di Firenze p. 52.

[5] Cicchitelli G. 2012 Statistica: principi e metodi, Pearson Education, Milano.[6] Cohen J. 1989 Statistical Power Analysis for the Behavioral Sciences, Lawrence

Erlbaum Associates.[7] Frosini B.V. 1990 Lezioni di Statistica. Parte prima, Vita e Pensiero, Milano.[8] Frosini B.V. 2009 Metodi statistici: teoria e applicazioni economiche e sociali,

Carocci, Roma.[9] Greenacre M. 2007 Correspondence analysis in practice, Chapman & Hall, Bocan

Raton, Fla.[10] Grömping U. 2006 ’Relative Importance for Linear Regression in R: The Package

relaimpo’, Journal of Statistical Software, 17(1), 1-27[11] Guseo R. 2006 Statistica, Terza edizione, CEDAM, Padova.[12] James G., Witten D., Hastie T., Tibshirani R. 2015 An Introduction to Statistical

Learning, Springer, New York.[13] Landenna G. 1994 Fondamenti di statistica descrittiva, Il Mulino, Bologna.[14] Landenna G. 1997 Introduzione alla probabilità e all’inferenza statistica, Il Mulino,

Bologna.[15] Landenna G., Marasini D., Ferrari P. 1997 Probabilità e variabili casuali, Il Mulino,

Bologna.[16] Magagnoli U. 1993 Elementi di statistica descrittiva, CLUEB, Bologna.[17] Magagnoli U. 2010 Lezioni di statistica e calcolo delle probabilità, Università degli

Studi di Ferrara.[18] Montgomery D. C. 2000 Controllo statistico della qualità. Mc-Graw-Hill, Milano.[19] Montinaro M., Nicolini G. 2007 Elementi di statistica descrittiva, UTET, Torino.[20] Pasetti P. 2002 Statistica del Turismo, Carocci, Roma.[21] Piccolo D. 2010 Statistica, Il Mulino, Bologna.[22] Predetti A. 2002 I Numeri Indici - teoria e pratica. Giuffré editore, Milano.[23] R Core Team 2018 R: A language and environment for statistical computing. R

Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org

[24] Santamaria L. 2006 Statistica descrittiva: applicazioni di carattere economico eaziendale, Vita e Pensiero, Milano.

[25] Verbeek M. 2008 A Guide to Modern Econometrics, John Wiley, New York.[26] Zanella A. 1992 Lezioni di Statistica. Parte seconda. Strutture dei dati in due o più

dimensioni. La connessione, Vita e Pensiero, Milano.[27] Zanella A. 2003 Elementi di statistica descrittiva. Una presentazione sintetica,

CUSL, Milano.[28] Zani S. 1997 Analisi dei dati statistici. Voll. I,II. Giuffré editore, Milano.[29] Zenga M. 1998 Introduzione alla statistica descrittiva, Vita e Pensiero, Milano.[30] Zenga M. 2009 Lezioni di statistica descrittiva, Giappichelli, Torino.

431

https://www.jstatsoft.org/index.php/jss/article/view/v017i01/v17i01.pdf

https://www.jstatsoft.org/index.php/jss/article/view/v017i01/v17i01.pdf

http://www-bcf.usc.edu/~gareth/ISL/ISLR Seventh Printing.pdf

http://www-bcf.usc.edu/~gareth/ISL/ISLR Seventh Printing.pdf

http://www.unife.it/scienze/lm.matematica/insegnamenti/statistica-1/materiale-didattico/LEZIONI DI STATISTICA - Parte I.pdf

https://www.R-project.org

https://www.R-project.org

Questo volume è stato redatto con MiKTeX (versione 2.9), R (versione 3.5.1) e Sweave.Per la realizzazione sono, inoltre, stati utilizzati i package e le utility di seguito elencati.

1. Chen H. 2018 VennDiagram: Generate High-Resolution Venn and Euler Plots.R package version 1.6.20. https://CRAN.R-project.org/package=VennDiagram

2. Csardi G., Nepusz T. 2006 The igraph software package for complex networkresearch, InterJournal, Complex Systems p. 1695. http://igraph.org

3. Dahl D.B. 2016 xtable: Export Tables to LaTeX or HTML. R package version1.8-2. https://CRAN.R-project.org/package=xtable

4. Faraway J. 2016 faraway: Functions and Datasets for Books by Julian Faraway.R package version 1.0.7. https://CRAN.R-project.org/package=faraway

5. Hlavac M. 2018 stargazer: Well-Formatted Regression and Summary StatisticsTables. R package version 5.2.2. http://CRAN.R-project.org/package=stargazer

6. Leisch F. 2002 Sweave: Dynamic Generation of Statistical Reports Using LiterateData Analysis. In W. Härdle, B. Rönz (eds.), Compstat 2002 - Proceedings inComputational Statistics, pp. 575-580. Physica Verlag, Heidelberg.

7. R Core Team 2017 foreign: Read Data Stored by ’Minitab’, ’S’, ’SAS’, ’SPSS’,’Stata’, ’Systat’, ’Weka’, ’dBase’, . . .. R package version 0.8-70. https://CRAN.R-project.org/package=foreign

8. Verzani J. 2018 UsingR: Data Sets, Etc. for the Text "Using R for IntroductoryStatistics", Second Edition. R package version 2.0-6. https://CRAN.R-project.org/package=UsingR

9. Xie Y. 2013 animation: An R Package for Creating Animations and Demon-strating Statistical Methods. Journal of Statistical Software, 53(1), 1-27 http://www.jstatsoft.org/v53/i01/.

10. Xie Y., Mueller C., Yu L., Zhu W. 2017 animation: A Gallery of Animations inStatistics and Utilities to Create Animations. R package version 2.5.

432

https://CRAN.R-project.org/package=VennDiagram

https://CRAN.R-project.org/package=VennDiagram

http://igraph.org

https://CRAN.R-project.org/package=xtable

https://CRAN.R-project.org/package=faraway

https://CRAN.R-project.org/package=faraway

http://CRAN.R-project.org/package=stargazer

http://CRAN.R-project.org/package=stargazer

https://CRAN.R-project.org/package=foreign

https://CRAN.R-project.org/package=foreign

https://CRAN.R-project.org/package=UsingR

https://CRAN.R-project.org/package=UsingR

http://www.jstatsoft.org/v53/i01/

http://www.jstatsoft.org/v53/i01/

EDUCatt - Ente per il Diritto allo Studio Universitario dell’Università CattolicaLargo Gemelli 1, 20123 Milano - tel. 02.7234.22.35 - fax 02.80.53.215

e-mail: [email protected] (produzione); [email protected] (distribuzione)web: www.educatt.it/libri

notes of descriptive statistics and...

Documents