esercitazione 1 - docenti-deps.unisi.itesercitazione 1 6 esercizio 5 data la sequenza di intensità...
TRANSCRIPT
-
Esercitazione 1
1
Esercizio 1 Considerata la seguente distribuzione relativa allo sport principale praticato da 500 ragazzi e ragazze
Sport Frequenza assoluta Basket 62 Calcio 182 Danza 28 Nuoto 75 Pallavolo 95 Tennis 58 500
si determini la distribuzione espressa mediante le frequenze relative, si costruisca il corrispondente grafico a nastri e si determini, se possibile: a) la moda, b) la mediana, c) la media Soluzione
Sport Frequenza assoluta Basket 0.124 Calcio 0.364 Danza 0.056 Nuoto 0.150 Pallavolo 0.190 Tennis 0.116 1.000
a) La moda è la modalità “calcio”, come si nota anche dal grafico, mentre gli altri indici non possono essere calcolati per la natura della variabile
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4
Danza
Tennis
Basket
Nuoto
Pallavolo
Calcio
frequenza relativa
spo
rt
-
Esercitazione 1
2
Esercizio 2 Considerata la seguente sequenza di modalità relative a una variabile qualitativa ordinabile
A B B C D A A B A A B B C B C D si determini: a) la distribuzione di frequenza espressa mediante frequenze assolute e relative e le corrispondenti frequenze cumulate (sia assolute sia relative), b) si disegni il grafico a barre utilizzando le frequenze assolute, c) si individui la moda
Soluzione a)
X Freq. ass. Freq. rel. Freq. ass. cum. Freq. rel. cum.
A 5 0.3125 5 0.3125
B 6 0.3750 11 0.6875
C 3 0.1875 14 0.8750
D 2 0.1250 16 1.0000
16 1.0000
b)
c) La moda corrisponde a B
-
Esercitazione 1
3
Esercizio 3 Considerata la sequenza dei valori della variabile “numero di smartphone” rilevata su 4 famiglie
3 4 1 4 si determini: a) la moda, b) la mediana, c) la media, d) la varianza Soluzione a) La moda è 4 b) Una volta ordinata la serie dall’intensità più piccola alla più grande
1 3 4 4 si determina il posto della mediana che risulta pari a ⌈4 × 0.5⌉ = 2 per cui x0.5=3 c)
�̅� =3 + 4 + 1 + 4
4= 3
d) Il momento ordinario del secondo ordine è pari a
𝑚2 =9 + 16 + 1 + 16
4= 10.5
per cui la varianza risulta 𝑠2 = 10.5 − 32 = 1.5
-
Esercitazione 1
4
Esercizio 4 Data la seguente sequenza di intensità relative a una variabile quantitativa discreta
-2 -1 0 0 2 5 0 -1
a) si determini la distribuzione di frequenza e si disegni il grafico ad aste corrispondente utilizzando le frequenze relative
Si calcoli inoltre: b) la media, c) l’ampiezza del campo di variazione, d) il primo quartile, e) la varianza.
Soluzione a) La distribuzione di frequenza risulta
X Frequenza assoluta Frequenza relativa
-2 1 0.125
-1 2 0.250
0 3 0.375
2 1 0.125
5 1 0.125
8 1.000
mentre il grafico corrispondente assume la forma riportata nella figura successiva
-
Esercitazione 1
5
b) La media è pari a
�̅� =−2 − 1 × 2 + 2 + 5
8= 0.375
c) L’ampiezza del campo di variazione è dato da 5-(-2) =7 d) Il primo quartile occupa il posto ⌈8 × 0.25⌉ = 2 per cui corrisponde all’intensità -1 e) Il momento ordinario del secondo ordine è pari a
𝑚2 =4 + 1 × 2 + 4 + 25
8= 4.375
per cui la varianza risulta
𝑠2 = 4.375 − 0.3752 =4.234375
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
-3 -2 -1 0 1 2 3 4 5 6
freq
uen
za r
elat
iva
X
-
Esercitazione 1
6
Esercizio 5 Data la sequenza di intensità relative a una variabile quantitativa continua
1.6 0.4 1.4 1.1 -0.1 0.2 0.6 0.9 -1.6 -0.5 1.3 0.0 -0.2 0.9 0.3 0.1 -0.8 1.9 1.4 -0.5
a) si determini la distribuzione di frequenza nelle classi
(-2 − 0], (0 − 1], (1 − 2] calcolando sia le frequenze assolute sia le frequenze relative b) si disegni l’istogramma. Sulla distribuzione in classi si calcoli: c) la classe modale, d) la media, e) la deviazione standard, f) l’indice 𝑎3 di asimmetria Soluzione a) La distribuzione in classi è riportata nella tabella successiva
X Frequenza assoluta Frequenza relativa
-2 − 0 7 0.35
0 − 1 7 0.35
1 − 2 6 0.30
20 1.00
b) Per disegnare l’istogramma occorre calcolare la densità di frequenza associata a ciascuna classe. I suoi valori sono riportati nella tabella successiva
X Densità
-2 − 0 0.175
0 − 1 0.350
1 − 2 0.300
-
Esercitazione 1
7
c) La classe modale è la seconda: (0, 1], in quanto è questa la classe a cui è associata la densità di frequenza massima
d) La media è data da
�̅� = −1 × 0.35 + 0.5 × 0.35 + 1.5 × 0.3 = 0.275
e) Il secondo momento ordinario corrisponde a
𝑚2 = 1 × 0.35 + 0.25 × 0.35 + 2.25 × 0.3 = 1.1125
La varianza è pari quindi a 1.1125-0.2752 = 1.036875 La deviazione standard, approssimata a 6 cifre decimali, risulta
𝑠 =1.018271
f) Per calcolare l’indice di asimmetria conviene calcolare gli scarti elevati al cubo e poi farne la media. La tabella successiva riporta gli elementi utili ai fini del calcolo
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
-3 -2 -1 0 1 2 3
den
sità
X
-
Esercitazione 1
8
Valori centrali Scarti Scarti al cubo Frequenza relativa
-1 -1.275 -2.072672 0.35
0 0.225 0.011391 0.35
1 1.225 1.838266 0.30
1.00
Dai dati riportati nella tabella precedente si ottiene �̅�3 = −2.072672 × 0.35 + 0.011391 × 0.35 + 1.838266 × 0.3 =
= −0.169969
Per cui l’indice di asimmetria è pari a
𝑎3 =−0.169969
1.0182713≈ −0.16098
La distribuzione presenta quindi una lieve asimmetria negativa, come si nota anche dalla forma dell’istogramma
-
Esercitazione 1
9
Esercizio 6 Considerate 50 unità statistiche su cui la variabile di interesse X presenta la distribuzione riportata nella tabella seguente
Determinazioni Frequenza relativa 0 0.2 1 0.5 2 0.3
si determini: a) la moda, b) i tre quartili, c) la media, d) la deviazione standard Soluzione a) la moda è 1 c) la media è pari a �̅� = 0×0.2 + 1×0.5 + 2×0.3 = 1.1 d) il momento ordinario di ordine 2 risulta m2 = 1×0.5 + 22×0.3 = 1.7 per cui la varianza è pari a 𝑠𝑥
2 = 1.7 – 1.12 = 0.49 e 𝑠𝑥 = 0.7 b) Per determinare i quartili è necessario calcolare le frequenze assolute cumulate. Dai dati della tabella si ottiene
Determinazioni Frequenza assoluta Frequenza assoluta cumulata 0 0.2×50=10 10 1 0.5×50=25 35 2 0.3×50=15 50
x0.25 occupa il posto ⌈50 × 0.25⌉ = ⌈12.5⌉=13 per cui x0.25=1 x0.5 occupa il posto ⌈50 × 0.5⌉ = ⌈25⌉=25 per cui x0.5=1 x0.75 occupa il posto ⌈50 × 0.75⌉ = ⌈37.5⌉=38 per cui x0.75=2
-
Esercitazione 1
10
Esercizio 7 Date le seguenti informazioni relative a una variabile continua X
Classi Frequenza
-3 − -1 15
-1 − 1 15 1 – 5 20
50 Se ne disegni l’istogramma e si calcoli: a) la classe modale, b) la media, c) il momento ordinario di ordine 2, d) la varianza, e) il coefficiente di variazione Soluzione Per il calcolo della moda e per disegnare l’istogramma occorre calcolare la densità associata a ciascuna classe, ottenendo i valori riportati nell’ultima colonna della tabella successiva
Classi Frequenza relativa
densità
-3 − -1 0.3 0.15
-1 − 1 0.3 0.15 1 – 5 0.4 0.10
1.0 Dalla tabella risulta che a) Esistono due classi modali: (-3, -1] e (-1, 1] L’istogramma assume la forma riportata nella figura successiva
-
Esercitazione 1
11
b) La media risulta
�̅� =−2 × 15 + 0 × 15 + 3 × 20
50= 0.6
c) Il momento ordinario di ordine 2 è pari a
𝑚2 =4 × 15 + 0 × 15 + 9 × 20
50= 4.8
d) La varianza è data quindi da
𝑠2 = 4.8 − 0.62 = 4.44 e) Il CV non può essere calcolato perché la variabile assume valori negativi
0
0,05
0,1
0,15
0,2
-4 -3 -2 -1 0 1 2 3 4 5 6
densità
X
-
Esercitazione 1
12
Esercizio 8 Considerata la seguente sequenza di valori,
-1 -2 -2 3 4 0 0 1
si determini: a) la moda, b) i tre quartili, c) il rango interquartile, d) la media, e) la varianza Soluzione La sequenza ordinata è
-2 -2 -1 0 0 1 3 4
a) esistono due mode che corrispondono ai valori -2 e 0 b) x0.25 occupa il posto ⌈8 × 0.25⌉ = ⌈2⌉=2 per cui x0.25=-2
x0.5 occupa il posto ⌈8 × 0.5⌉ = ⌈4⌉=4 per cui x0.5=0 x0.75 occupa il posto ⌈8 × 0.75⌉ = ⌈6⌉=6 per cui x0.75=1
c) Il rango interquartile è Wx = 1-(-2) = 3 d) La media è data da
�̅� =−2 × 2 − 1 + 1 + 3 + 4
8=
3
8= 0.375
e) Il secondo momento dall’origine è pari a
𝑚2 =4 × 2 + 1 × 2 + 9 + 16
8=
35
8= 4.375
per cui la varianza è uguale a
𝑠2 =35
8−
9
64= 4.234375
-
Esercitazione 1
13
Esercizio 9 Data la seguente distribuzione in classi relativa a una variabile continua X
Classi Frequenza assoluta cumulata
-5 − -3 4
-3 − -1 6 -1 – 3 10
si rappresenti graficamente tale distribuzione e si determini: a) la classe modale, b) la media, c) il secondo momento centrale. Soluzione Occorre innanzitutto calcolare le frequenze assolute e le densità, che assumono i valori contenuti nella seconda e terza colonna della tabella successiva
Classi Frequenza assoluta Frequenza relativa densità
-5 − -3 4 0.4 0.2
-3 − -1 2 0.2 0.1 -1 – 3 4 0.4 0.1
10 1.0 L’istogramma assume la forma riportata nella figura successiva
0
0,05
0,1
0,15
0,2
0,25
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
densità
X
-
Esercitazione 1
14
a) La classe modale corrisponde all’intervallo (-5, -3] b) La media è pari a
�̅� = −4 × 0.4 − 2 × 0.2 + 1 × 0.4 = −1.6 c) Il secondo momento dall’origine è uguale a
𝑚2 = 16 × 0.4 + 4 × 0.2 + 1 × 0.4 = 7.6 Per cui il secondo momento centrale (ossia la varianza) risulta
�̅�2 = 𝑠2 = 7.6 − (−1.6)2 = 5.04
-
Esercitazione 1
15
Esercizio 10 I dipendenti di un’azienda commerciale risultano distribuiti come riportato nelle prime due colonne della tabella successiva. La terza colonna riporta invece lo stipendio medio pro-capite lordo annuo
Frequenza assoluta Stipendio medio annuo (in euro)
Dirigente 1 53000 Capo Ufficio 3 32500 Impiegato 14 28200 Operaio 27 23300 Manovale 30 15800
Per la variabile stipendio medio annuo si vuole calcolare: a) la moda, b) i tre quartili, c) la media Soluzione a) La moda della variabile stipendio medio annuo è 15800, in quanto è questo il valore a cui è associata la frequenza massima b) Per determinare i tre quartili occorre ordinare i valori della variabile e calcolare le frequenze cumulate corrispondenti
Stipendio medio annuo (in euro)
Frequenza assoluta Frequenza assoluta cumulata
15800 30 30 23300 27 57 28200 14 71 32500 3 74 53000 1 75
I posti dei tre quartili risultano rispettivamente uguali a 19, 38 e 57, per cui risulta x0.25=15800, x0.5=23300, x0.75=23300 c) La media, infine, risulta
�̅� =1
75× (15800 × 30 + 23300 × 27 + ⋯ ) = 21978. 6̅
-
Esercitazione 1
16
Esercizio 11 Data la seguente sequenza di osservazioni relativa a una variabile quantitativa
discreta X
-1 0 1 2 -3 -2 4 3 1 5
si determini: 1) la moda, 2) la mediana, 3) la media, 4) l’ampiezza del campo di variazione, 5) la differenza interquartile, 6) la varianza, 7) il coefficiente di variazione. Si disegni inoltre il boxplot
Soluzione La sequenza ordinata risulta
-3 -2 -1 0 1 1 2 3 4 5
1) La moda corrisponde all’intensità 1
2) La mediana occupa il 5°posto, per cui x0.5=1
3) �̅�=1
4) L’ampiezza del campo di variazione è 5-(-3)=8
5) Il terzo quartile occupa l’8°posto, per cui x0.75=3 Il primo quartile occupa il 3°posto, per cui x0.25=-1 La differenza interquartile è quindi pari a x0.75-x0.25= Wx =4
6) Il momento ordinario del secondo ordine risulta 𝑚2𝑥 = 7, per cui la
varianza è 𝑠𝑥2 =6
7) Il CV non può essere calcolato perché la variabile assume valori negativi
Il rettangolo che compone il boxplot ha la base inferiore in corrispondenza di
x0.25=-1 e la base superiore in corrispondenza di x0.75=3
-
Esercitazione 1
17
Il VAI corrisponde alla più piccola osservazione ≥ x0.25−Wx = −1−1.5×4 = −7
Quindi il VAI è pari a -3
Il VAS corrisponde alla più grande osservazione ≤ x0.75 + Wx = +1.5×4 = 9
Quindi il VAS è pari a 5
Il boxplot assume quindi la forma seguente, in cui il simbolo corrispondente al
rombo indica la media aritmetica (che coincide con la mediana)
-
Esercitazione 1
18
Esercizio 12 Data la sequenza di osservazioni dell’esercizio precedente si consideri la
variabile Y=4 - 2X e se ne determini: 1) la moda, 2) la mediana, 3) la media, 4)
l’ampiezza del campo di variazione, 5) il rango interquartile, 6) la varianza.
Sapendo inoltre che per la variabile X risulta 𝑎3𝑥 = 0 e 𝑎4𝑥 = 1.96̅ si determini
7) l’indice di asimmetria 𝑎3𝑦 , 8) l’indice di curtosi 𝑎4𝑦 per la variabile Y.
Soluzione La sequenza ordinata della variabile Y risulta
-6 -4 -2 0 2 2 4 6 8 10
1) La moda è 2
2) La mediana occupa il 5° posto, per cui y0.5=2 3) la media è �̅� = 4 - 2�̅� = 2
4) L’ampiezza del campo di variazione corrisponde alla differenza 10-(-6)=16
5) Il terzo quartile occupa l’8° posto, per cui y0.75=6;
mentre il primo quartile occupa il 3° posto, per cui y0.25=-2;
La differenza interquartile (o rango interquartile) è y0.75-y0.25=8
6) La varianza è 𝑠𝑦2 = (−2)2𝑠𝑥
2 =24
7) In base alla proprietà di una trasformazione lineare, tenendo presente che
Y=4 - 2X, per cui il segno di b è negativo, l’indice di asimmetria per la Y risulta
𝑎3𝑦 = −𝑎3𝑥 = 0
8) In base alla proprietà di una trasformazione lineare risulta 𝑎4𝑦 = 𝑎4𝑥 per
qualsiasi valore di 𝑎 e di b (con b≠0), per cui
𝑎4𝑦 = 𝑎4𝑥 = 1.96̅
-
Esercitazione 1
19
Esercizio 13
Date le seguenti distribuzioni delle età dei dipendenti di una cooperativa
classificati per sesso
Maschi Femmine
Età ni Età ni 19 2 18 1 20 6 25 2 21 3 26 2 22 1 28 2 23 1 29 1 25 1 30 2 28 1 31 3 30 1 32 1 35 1 33 2 37 1 16 18
disegnare i due boxplot corrispondenti
Soluzione Conviene calcolare le frequenze assolute cumulate
Maschi Femmine
Età ni Ni Età ni Ni 19 2 2 18 1 1 20 6 8 25 2 3 21 3 11 26 2 5 22 1 12 28 2 7 23 1 13 29 1 8 25 1 14 30 2 10 28 1 15 31 3 13 30 1 16 32 1 14 35 1 17 33 2 16 37 1 18 16 18
-
Esercitazione 1
20
Maschi:
I posti occupati dai 3 quartili sono, nell’ordine, il 5°, il 9° e il 14°
Per cui risulta x0.25= 20, x0.5= 21, x0.75= 25.
Per il calcolo dei valori adiacenti, risulta
x0.25 − Wx = 20 – 1.5×(25-20) = 12.5,
x0.75 + Wx = 25 + 1.5×(25-20) = 32.5,
VAI = 19 in quanto è la più piccola osservazione ≥ 12.5
VAS = 30 in quanto è la più grande osservazione ≤ 32.5
Femmine:
I posti occupati dai 3 quartili sono, nell’ordine, il 4°, l’8° e il 12°
Per cui risulta x0.25= 26, x0.5= 29, x0.75= 31.
Per il calcolo dei valori adiacenti, risulta
x0.25 − Wx = 26 – 1.5×(31-26) = 18.5,
x0.75 + Wx = 31 + 1.5×(31-26) = 38.5,
VAI = 25 in quanto è la più piccola osservazione ≥ 18.5
VAS = 33 in quanto è la più grande osservazione ≤ 38.5
I due boxplot assumono la forma indicata nel grafico successivo, dal quale si
nota che
- l’ordine di grandezza dell’età è minore per gli individui di sesso maschile
- la variabilità dell’età è più o meno la stessa per entrambi i sessi
- nei maschi l’età mostra un’asimmetria positiva e nelle femmine
un’asimmetria negativa.
-
Esercitazione 1
21
- Nei maschi sono presenti due valori anomali che corrispondono agli
individui di età più elevata, mentre nelle femmine c’è un solo valore
anomalo che corrisponde all’unità con la minore età