seminario psicometria i
TRANSCRIPT
Università degli Studi e Campus
Facoltà di Scienze PsicologicheCorso Psicometria I
Prof.ssa Simona Musacchio
Ing. Gianluca Pizzuti
Relatori
Introduzione
Cos' è la statistica?
Definizione Trilussa (nota di colore) La statistica fornisce gli strumenti per
analizzare i fenomeni collettivi (caratteristiche fisiche di un gruppo di soggetti).
Statistica descrittiva Popolazione globale/campione
Descrizione Sintesi numerica Analisi dei risultati
Statistica inferenziale Campione
Stima delle caratteristiche Sintesi numerica Analisi dei risultati
Campione statistico/Popolazione
Il campione statistico è un sottoinsieme dell'universo di riferimento, caratterizzato da attributi comuni alla popolazione.
La popolazione è l'insieme dei soggetti appartenenti alla categoria oggetto di studio.
Fasi dell'analisi statistica
1Definizione obiettivi Rilevazione
Elaborazione datiApplicazione degli
esiti dell'analisi
Analisi statistica
Interpretazione dati
Fasi dell'analisi statistica:definizione obiettivi
Individuazione obiettivi
Delimitazione della ricerca nel tempo e nello spazio
2
Fasi dell'analisi statistica:rilevazione
3
L'osservazione dei fenomeni mediante opportuni tecniche e strumenti
L'oggetto della rilevazione può essere l'intera popolazione o un campione di essa rappresentativo
Chi può fare la rilevazione?
Enti pubblici (Istat) ed Istituti privati
La rilevazione si effettua mediante formulari strutturati ai fini dell'analisi
Fasi dell'analisi statistica:elaborazione dati
4
Sintesi dei dati più significativi mediante l'utilizzo di opportuni indici
Fasi dell'analisi statistica:presentazione ed interpretazione dei dati
Rappresentazione dei dati mediante tabelle, grafici ed indici
Spiegazione dei risultati
5
Fasi dell'analisi statistica:applicazione degli esiti dell'analisi
La statistica non è fine a se stessa
6
Sta
tistic
aEconomia
..........
Output
Demografia
Medicina
Indagine statistica: definizione
1 Il carattere oggetto di studio
2 La scala di misurazione del carattere
3 L'universo delle unità statistiche (popolazione)
4 L'ampiezza della rilevazione (totale o parziale)
Unità statistica :definizione
Unità statistica : elemento base della popolazione sul quale viene rilevata la caratteristica oggetto di studio●Unità semplici (persona, abitazione)●Unità composta (famiglia, edificio)●Unità complesse, insieme di unità semplici
differenti,considerati nella loro globalità (rapporto coniugale, rapporto di lavoro)
Carattere :definizione
Carattere : elemento che descrive una popolazione od un campione
Modalità : valori assunti da un carattere su un'unità statistica
Tipologia carattere ●Qualitativo o Mutabile (rappresentato
mediante attributi)●Quantitativo (rappresentato mediante numeri)
Variabile :definizione
Variabile : rappresentata mediante numeri
Modalità : valori assunti da un carattere su un'unità statistica
Tipologia carattere ●Qualitativo o Mutabile (rappresentato
mediante attributi)●Quantitativo (rappresentato mediante numeri)
Variabili: tipologia
Variabili Qualitative●Modalità nominali (es. stato civile)●Modalità ordinali (es. livello di istruzione)
Variabili Quantitative●Valori numerici (es. numero di figli)
Variabili indipendenti (manipolata dallo sperimentatore)
Variabili dipendenti (misurate dallo sperimentatore)
Variabili di disturbo
Variabili: quantitative
Variabili Quantitative●Continue (numeri reali)●Discrete (numeri interi)
Esempio di variabili dipendenti ed indipendenti
30 adolescenti vengono convocati per un test di memoria, a 15 di loro, prima di iniziare la prova viene detto che si tratta di un compito particolarmente difficile, agli altri 15 non viene data alcune indicazione. Indicare la variabile indipendente e quella dipendente.
VARIABILE INDIPENDENTE? Informazione sulla difficoltà della prova VARIABILE DIPENDENTE? Punteggio test di memoria
LA MISURAZIONE: definizione Misurazione
●Assegnare valori numerici ad eventi/oggetti secondo le proprietà del sistema numerico (S.I.)
Scale di misurazione●Scala nominale (variabili o mutabili; i numeri hanno
valore di etichetta). Operazioni di misurazione
– Raggruppamento in classi– Conteggio delle frequenze delle classi
●Scala ordinale (ordinamento secondo una specifica caratteristica) Operazione di misurazione
– Confronti di ordine– Relazione di minore o maggiore
LA MISURAZIONE: le scale ad intervalli
Scale ad intervalli●Caratteristiche
Fondo scala pari a 0 Unità di misura convenzionali Misurano la differenza tra eventi/oggetti L’ampiezza dell’intervallo è costante Operazioni di misura: addizione e sottrazione, trasformazione
dei numeri (normalizzazione)
Esempi:●Scala Celsius, Kelvin, Q.I., Test di atteggiamento e di
personalità
LA MISURAZIONE: le scale a rapporti Scale a rapporti
●Caratteristiche Lo 0 equivale ad assenza di proprietà Non assumono valori negativi Operazioni di misura: addizione e sottrazione, trasformazione
dei numeri (normalizzazione), moltiplicazione e divisione
Esempi:●Distanza, statura, peso
Output delle misurazioni: DatiM
isur
a
Frequenza
DatiPunteggioVariabili quantitative
Variabili qualitative
Le Frequenze
Definizione:●è il numero delle volte secondo cui una modalità di una
variabile si presenta nella popolazione osservata
Frequenze classificazione:●Cumulate (somma progressiva delle frequenze della
distribuzione)●Relative (frequenza della modalità/numero totale delle
osservazioni)●Percentuali: freq.relat*100 (%)
Esempio
Maschi 28 Femmine 22
Il totale delle osservazioni N=50Le frequenze relative dei maschi sono F. rel=28/50=0,56Le frequenze percentuali dei maschi sono F%0 28/50x100= 56%
22FEMMINE
28MASCHI
2228 == fm FF
1
Le Classi
Definizione:●è un raggruppamento di dati in definiti intervalli●Ogni intervallo è delimitato da un estremo inferiore ed
estremo superiore●La differenza tra supinf= ampiezza di classe
Regole di costruzione delle classi:●Non meno di 5 e non più di 20●Intervalli della medesima ampiezza●Ampiezze preferite 3, 5, 10 o multipli●Intervalli mutuamente esclusivi (es. 02, 35, 68….)●Punto medio centrale =(sup+inf)/2 >costruzione
poligono di frequenza
Le Classi: rappresentazione grafica Definizione:
●Spesso per avere una visione d'insieme di una distribuzione di frequenza si usa rappresentarla su grafici.
●istogramma: in cui sull'ascissa sono riportate le modalità della distribuzione e sulle ordinate le rispettive frequenze assolute o relative.
Nel caso di distribuzione in classi: in ascissa vengono rappresentati i limiti degli intervalli e in ordinata le frequenze.
Le Classi: rappresentazione grafica-Istogramma
0
10
20
30
40
50
60
70
80
90
1°Trim.
2°Trim.
3°Trim.
4°Trim.
Est
Ovest
Nord
Le Classi: rappresentazione grafica-Poligono di frequenza Definizione:
●Poligono di frequenza: in cui sull'ascissa sono riportate le modalità ( il valore medio di ciascuna classe )e sull'ordinata le frequenze relative cumulate e i punti trovati si uniscono con una spezzata
●Il poligono di frequenza si utilizza quando il ricercatore è interessato a rappresentare nello stesso grafico più distribuzioni di frequenze relative a gruppi diversi.
Le Classi: rappresentazione grafica-Poligono di frequenza
Poligono di frequenza
0
20
40
60
80
100
1° Trim. 2° Trim. 3° Trim. 4° Trim.
fr
maschifemmine
Statistica descrittiva
Definizione:●I dati ottenuti durante uno studio empirico (dati grezzi)
possono essere sintetizzati in una forma analizzabile. L’ampio numero di osservazioni si può ridurre in numero più piccolo di indici statistici (statistiche descrittive).
●Le principali statistiche descrittive sono:
Misure della tendenza centrale: moda, mediana, media Misure della variabilità:range, differenza interquartile,
deviazione standard e varianza.
Statistica descrittiva-Moda
Definizione:
La moda è rappresentata dal valore più frequente della distribuzione osservata. Può essere espresso in ogni scala di misura (è l’unico indice di tendenza centrale per la scala nominale) Quando la moda è unica si parla di distribuzione unimodale, ma se ci sono due valori ugualmente frequenti la distribuzione è detta bimodale.
Statistica descrittiva-Moda
Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 15, 19. N = 13
●Il 15 si presenta più frequentemente, quindi è il valore modale La distribuzione è UNIMODALE
Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 13, 19. N = 13, 15
●Il 13 ed il 15 si presentano più frequentemente, quindi sono i valori modali La distribuzione è BIMODALE
Statistica descrittiva-Mediana Definizione: MEDIANA −E’ rappresentata dal valore che occupa la posizione centrale della
distribuzione (valore che divide in due parti uguali la distribuzione, al di sopra e al di sotto del quale si trovano il 50% dei casi)
la determinazione della mediana è diversa a seconda che sia n dispari o pari. Se n è dispari, la mediana e l'intensità individuata dal posto centrale:
C = (n+1) / 2
Ad esempio, la mediana dell'intensità 3, 15, 9, 2, 6,12, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 6, 9,12,15.
Siccome le intensità sono sette, numero dispari, il posto centrale è unico ed è pari a:
C = (7+1) / 2 = 4 (posizione della mediana)
La mediana è quindi, l'intensità individuata dal quarto posto, vale a dire che essa è uguale a 6.
Statistica descrittiva-Mediana Se n è pari, la mediana è data dalla semisomma delle intensità
corrispondenti ai due posti centrali:
C = n / 2 C = (n / 2) + 1
Ad esempio, la mediana delle intensità 7, 16, 2, 3, 9, 12, 15, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 7, 9, 12, 15, 16. (n=8)
Visto che si tratta di 8 numeri, numeri pari, i posti centrali sono due e sono:
C = 4 (7 ) e C = 5 (9) (posizioni della mediana)
Pertanto, la mediana è dalla semisomma delle intensità individuate dal quarto e dal quinto posto, vale a dire che essa è uguale a:
Me = (7 + 9) / 2 = 8
Statistica descrittiva-Media MEDIA (è il centro di gravità della distribuzione)
● La media aritmetica è data dalla somma delle misure osservate diviso il numero delle osservazioni fatte (N)
● Si indica con M per i campioni e con μ per le popolazioni● Può essere calcolata su scale di misura ad intervalli e a rapporti
(scale METRICHE)
La media aritmetica è uguale alla somma dei termini divisa per il loro numero.
Se si indicano gli n termini di una serie con x1, x2, x3….. xn, la media aritmetica sarà pari a:M = (x1 + x2 + x3 + ….. + xn ) / n
Se ad esempio avessimo i valori 1, 2, 3, 7, 10, 13, specificano la formula sopra enunciata, si ottiene:
M = (1+2+3+7+10+13) / 6 = 36/6 = 6 La formula può essere meglio come:M = Σ Xi/N
Oppure M = fi Xi/NΣ (in questo caso si moltiplica la frequenza di ogni classe per il valore
medio di ogni classe)
Statistica descrittiva-Media-Esempio
M = fi Xi/NΣ Valore=193/10
19310TOTALE
100520
57319
36218
VALORE*FREQ.FREQ.VOTI
1
Statistica descrittiva-Indici di posizione Definizione: Gli indici DI POSIZIONE indicano la posizione che un valore occupa all’interno di una distribuzione.
● QUARTILI● DECILI● PERCENTILI
● I percentili o quantili sono le intensità che dividono una distribuzione in due parti, lasciandola da una parte x% dei casi e dall’altra parte il rimanente (100 – x%).I quantili si dicono quartili se dividono la distribuzione in 4 parti uguali, tali che: il primo quartile lascia alla sinistra il 25% dei casi e alla sua destra il rimanente 75 % dei casi;il secondo quartile, che coincide con la mediana lascia alla sua sinistra il 50% dei casi ed alla destra il rimanente 50%; il terzo quartile lascia alla sua sinistra il 75% dei casi ed alla sua destra il rimanente 25%.
1° quartile 2° quartile 3° quartile__________|__________|___________|__________ Per calcolarli occorre:1. Ordinare in senso crescente la distribuzione 2. Calcolare le frequenze cumulate 3. Calcolare la posizione del quartile con le seguenti formule:1° quartile pos Q1= ((n+1)/4) *1° quartile pos Q2= ((n+1)/4) *2 3° quartile pos Q3= ((n+1)/4) *3
Statistica descrittiva-Indici di posizione-Quartili
Esempio●Pos Q1=n+1/4*1= 101+1/4*1=101+1/4*1=25.5●Corrisponde alla seconda posizione
101101469720577264512033121210101F.cum.Freq.
1
Statistica descrittiva-Indici di posizione-Decili, centili o percentili
Esempio:●Decili= nove punti che dividono la distrib. In 10 parti.
(pos D1= n+1/10*1;pos D3=n+1/10*3)●Percentili= 99 punti che dividono la distrib. In 100 parti
(pos.P1= n+1/100*1)
Statistica descrittiva-Indici di dispersione o variabilità
Definizione:
●Le medie facilitano la comprensione della frequenza dei fenomeni collettivi. Per una più esatta conoscenza di essi occorre però anche studiare la loro variabilità, cioè la capacità di assumere differenti valori quantitativi in un certo periodo di tempo, o in seguito all’influenza di un altro o altri fenomeni.
Statistica descrittiva-Indici di dispersione o variabilità-Campo variazione
Campo di variazione E’ una misura della variabilità dei dati. Esso si ottiene dalla differenza
tra il valore massimo e quello minimo delle intensità di un fenomeno.
CV = XmaxXmin
Ad esempio se le intensità di un dato fenomeno sono le seguenti:
29 24 20 28 22 22 23
Il campo di variazione sarà: 29 – 20 = 9
Statistica descrittiva-Indici di dispersione o variabilità-Differenza Interquartile
●Definizione
Differenza interquartile: è un indice più robusto ai valori anomali rispetto al campo di variazione.
IQR=Q3Q1
Statistica descrittiva-Indici di dispersione o variabilità-Varianza
●Definizione Scostamento semplice medio (SSM)
è la differenza tra un singolo punteggio e il punteggio medio Devianza è la somma degli scarti elevati al quadrato di ciascun
punteggio dalla media Varianza: è la media dei quadrati degli scostamenti dalla media
di tutti i soggetti e indica la distanza media di ciascun soggetto dalla media del campione.
Si indica con s2.
Scostamento quadratico medio o deviazione standard:
è la radice quadrata positiva della varianza
Statistica descrittiva-Indici di dispersione o variabilità-Varianza
●Esempio
28049937107427961178500774117634275293741
SCARTI QUADRATI
SCARTI DALLA MEDIA
MEDIADATI GREZZI
Statistica descrittiva-Indici di dispersione o variabilità-Deviazione Standard Calcolo
●Calcolo MEDIA= SX/N= 49/7=7
DEVIANZA= sommatoria degli scarti al quadrato= 28
VARIANZA= sommatoria degli scarti al quadrato/media=28/7=4
DEVIAZIONE STANDARD=la radice quadrata positiva della varianza= 2
Statistica descrittiva-Standardizzazione delle misure
●Definizione naif
Per poter confrontare in maniera adeguata i punteggi ottenuti da soggetti diversi in situazioni diverse, non possiamo accontentarci di guardare il punteggio grezzo, ma dobbiamo fare un confronto con dei punteggi, detti standardizzati, che possano essere un riferimento generale.
Statistica descrittiva-Standardizzazione delle misure
Per effettuare il confronto, si usano delle trasformazioniche rendono confrontabili tra loro distribuzioni diverse. 2 tipi di trasformazioni:
●punti Z (in questo caso dobbiamo avere come riferimento la media e la deviazione standard)
●percentili, decili, quartili (riferimento posizione nel gruppo)
Statistica descrittiva-Standardizzazione delle misure-Z
Formula Z transform
sXX
Z ii
−=
Statistica descrittiva-Standardizzazione delle misure-Z
Esempio
Un bambino di 5 anni ha un punteggio 20 in test di lettura.Tuttavia, possiamo domandarci: la posizione nel test del bambino di 5 anni è migliore rispetto al gruppo di 5 anni. Confrontiamo il punteggio del bambino con la media del suo gruppo (media=10;d.s.=5)Otteniamo che: il bambino è migliore rispetto alla media della classe.Standardizziamo il punteggio del bimbo (standardizzare una misura significa riferire la misura stessa a una scala standard con media e varianza note. La scala più comune è quella della standard o z che ha la media 0 e varianza 1.
Statistica descrittiva-Standardizzazione delle misure-Z
25
1020 =−=−=s
XXZ i
i
Esempio Tale trasformazione si ottiene trasformando
una serie di punteggi xi in punteggi zi con la seguente formula:
Il bimbo sta 2 deviazioni standard sopra la media.
Se la media del suo gruppo fosse stata di 25:
La prestazione del bimbo è inferiore alla media del gruppo.
15
2520 −=−=bZ
Statistica descrittiva-Standardizzazione delle misure-Percentili
Il percentile è il valore al di sotto del quale si trova una certa percentuale di casi di una distribuzione.
Esempio:il 94 percentile è il valore al di sotto del quale si trova il 94% dei casi di una distribuzione.
Ad esempio si considera la distrib. delle medie dei voti d’esame, il voto 29 corrisponde al 94° percentile della distribuzione
Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo
Il calcolo dei vari percentili è analogo a quello per il calcolo della mediana, dividendo la numerosità totale invece che per due, per il numero di classi che sono individuate (10 per i decili, 100 per i centili, ecc.).
Per i decili il primo decile sarà dato dal valore corrispondente alla posizione n/10, il secondo dalla posizione 2*n/10, il quinto da 5*n/10 (=nl2=Mediana),…….
il decimo da 10*n/10 (=n).
Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo
Si esprime il punteggio di un soggetto in relazione alla posizione occupata dal soggetto(So) nella distribuzione (cioè nel gruppo di cui fa parte). In particolare, si calcola la sua posizione come se il gruppo fosse formato da 100 soggetti(Ss).
Procedura (simile alla mediana):– si ordinano i Ss (da quello che ha preso il punteggio più
basso a quello che ha preso il punteggio più alto)– si vede che posizione occupa il So (per es., è il 30° in
un distribuzione di 50 Ss)– si vede che posizione il So occuperebbe se ci fossero
non 50 Ss ma 100 Ss.– è logico pensare che se il So è 30° su 50 Ss sarebbe
60° su 100 Ss.– si dice perciò che il So è al 60° percentile.
Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo
In altre parole, si fa una proporzione:30° : 50 = x : 100x = 30/50 × 100 = 60°
Il percentile indica perciò la percentuale di Ss che hanno avuto un punteggio minore del So (e, per differenza, la percentuale di Ss che hanno avuto un punteggio superiore).
Un So è nel 25° percentile: significa che sotto di lui c’è il 25% dei Ss e sopra di lui il 75%.
Un soggetto al 50% percentile sta a metà.
Statistica Inferenziale
La statistica inferenziale ha come obiettivo, invece, quello di fare affermazioni, con una possibilità di errore controllata, riguardo la natura teorica (la legge probabilistica) del fenomeno che si osserva.
La statistica inferenziale è fortemente legata alla teoria della probabilità.
Probabilità
• La probabilità che si verifichi un certo evento è uguale alla frequenza (relativa) con cui l’evento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.
• P(A) è la probabilità di verificarsi un evento A • Lim limite per n che tende all’infinito ∞ e indica un numero
molto grande• fA frequenza con cui si è verificato l’evento A in un numero di
prove n
nf
AP A
nlim)(
∞→=
Probabilità-Posteriori
Probabilità a posteriori: è data dal rapporto tra i risultati favorevoli e il totale delle prove effettuate, quando questo numero diventa infinitamente grande. Il concetto di probabilità a posteriori si riduce in definitiva a quello di frequenza relativa di un fenomeno, quando il numero di prove è finito (quella sopradetta).
Non è possibile definire la probabilità in base ad un’unica prova ma le prove devono essere molte e ripetute.Es: lanciando un dado 10 volte avremo la seguente sequenza (4752928145) la probabilità di ottenere la faccia 5; basata sulla frequenza relativa in 10 lanci, è di 2/10=0.20
Probabilità-Teorica
Definizione: probabilità a priori o teorica: è il rapporto tra numero di casi favorevoli al verificarsi di un evento ed il totale degli eventi possibili, supposti equiprobabili.
Riprendendo il caso del lancio di un dado non truccato, la probabilità dell'evento esce 6 è uguale a 1/6.
Probabilità-Concetti generali
Evento: uno dei possibili risultati di una prova; se la prova consistesse nell’osservazione dell’esito del lancio del dado, l’evento sarebbe la faccia 5.
La prob.di A si definisce con P(A), faccia 5.
Tutte le altre facce esclusa la 5 hanno la prob.P(non A)
P(A) +P(non A)= 1
La somma delle probabilità di tutti gli eventi è uguale a 1 (probabilità dell’evento certo)
Probabilità-Concetti generali-Principio della somma
• La probabilità di verificarsi di due eventi mutualmente escludentisi è uguale alla somma delle probabilità di verificarsi dei singoli eventi:
P(A U B) = P (A) + P (B)
• La probabilità che lanciando un dado si ottenga l’evento numero dispari (faccia 1,3,5) sarà
uguale: P1+P3+P5= 1/6+1/6+1/6=3/6= ½
Probabilità-Concetti generali-Principio del prodotto Definizione:
Quando due eventi si verificano simultaneamente o in successione :P (A e B) = P (A) * P (B)
la probabilità di avere 2 con due dadi è data dalla prob.di avere 1 con dado e 1 con l’altro.P (s=2) = P (1) * P (1)= 1/6*1/6 = 1/36La combinazione 1+ 1 è solo una dei 36 eventi possibili che corrispondono ai 36 diversi modi possibili in cui si possono combinare le 6 facce del primo dado con le 6 facce del secondo.
Probabilità-Concetti generali-Probabilità condizionata Definizione:
Abbiamo trattato di eventi indip., quando invece si tratta di eventi non indipen. Ossia quegli eventi che il verificarsi dell’uno modifica la prob. del verificarsi dell’altro.
Ad esempio nel lotto l’aver estratto un numero (tra i 90 possibili) modifica la prob. di estrazione del numero successivo (1/89)
P (A B) = P (A) * P (B/A)= P(B) P(A/B)
Probabilità-Concetti generali-Probabilità condizionata
P (∅) = 0;
P (Ā) = 1 P(A), dove Ā è not A
P (A U B)= P(A) +P(B) P(A B)∩
Probabilità-Concetti generali-Probabilità condizionata
Tra due eventi A e B può sussistere una relazione per la quale, sapendo che una prova ha generato un risultato che appartiene a B, si è indotti a modificare la valutazione del verificarsi di A. La probabilità dell'evento B, dato che si è verificato l'evento A, è il rapporto fra la probabilità del contemporaneo verificarsi di A e B e la probabilità di A, se questa è diversa da zero.
0)(;)(
)()(
0)(;)(
)()(
>∩=
>∩=
APAP
ABPABP
BPBP
BAPBAP
Probabilità-Distribuzione normale
La Curva normale è la curva continua rappresentativa delle distribuzioni che più frequentemente si incontrano in statistica
E’ simmetrica e unimodale. Media, moda e mediana coincidono. I valori si addensano attorno alla media (il 94,5dei valori sono posizionati entro i due scarti quadrati medi sopra e sotto la media.) Per descriverla bastano la media e la d.s.
Un solo valore appare con la frequenza massima, quella centrale, e sono tanto meno frequenti quanto più si allontanano dal valore centrale.
Probabilità-Distribuzione normale
Probabilità-Distribuzione normale
Si applica a variab. Continue ossia che la funzione viene definita su tutto l’asse dei numeri reali da ∞ a +∞ (sulle ascisse si trovano tutti i valori di x e sulle ordinate le frequenze di ciascun valore)
La somma di tutte le prob. È uguale a 1 Espressa dall’integrale:
+∞
ƒ ƒ(x)dx=1∞
Che esprime l’area racchiusa dalla distrib. a campana
Probabilità-Distribuzione normale
1/2 .( )2/ 2Χ μ σ
F(x)=1/ √2 e σ π
F(x)=frequenza di un dato valore di x X=qualsiasi valore nella distribuzione =media della distribuzioneμ
=deviazione standard della distrib.σ
=3,1416π
e=2,7183(base dei logaritmi neperiani)σ 2 µ sono media e varianza della popolazione
Probabilità-Distribuzione normale-Esempio L’area sottesa nel punto x esprime qual’è la probababilità che
si presenti un valore inferiore o superiore a x. Per esempio consideriamo una distribuzioni di voti all’esame, ci sono 20 possibilità che uno studente abbia una media superiore al 27,5
Probabilità-Distribuzione normale-Esempio Vogliamo sapere qual è la prob. , in una distrib. di Q.I. µ = 100 σ = 10, di
ottenere un punteggio compreso tra 90 e 100:
X2=100
ƒ ƒ(x)dx=?x1=90
Trasformiamo i punti grezzi in punti z: Z1= xµ /σ = 90100/10= 1 Z2= 100100/10=0
L’integrale diventa: 0
ƒ f(z)dz=? 1
L’area che ci interessa è l’area tra 0 e –1. Sulla tavola B troviamo l’area tra 0 e 1. Riga = I cifra decimale colonna= II cifra decimaleZ1=1 riga=1.0 col.=0 = .3413 la risposta che cercavamo
Probabilità-Distribuzione binomiale
Ad ogni evento si associa una prob. che assume una distribuzione che si definisce in base all’evento. X= evento e f(x) la sua distribuzione . In caso x assume 2 valori (testa e croce), eventi indip.Se eseguiamo n prove avremo una distrib. teorica definita binomiale.
Equazione: f(x)= n C x p x q nx
p= prob. che si verifichi l’evento Q= prob che non si verifichi l’evento n C x = numero dei modi in cui si possono combinare x
successi (nx) insuccessi in n prove
Probabilità-Distribuzione binomiale
n C x
Si definisce comb. di n oggetti a r a r , tutte le possibili repliche che si costituiscono con n oggetti senza tener conto dell’ordine degli oggetti stessi.
La combinazione formula: n C x = {n
r}= n!/ r! (nr) !=
Il punto ! Si legge fattoriale e indica tutta la serie di numeri naturali.
Per es n=4 n!= 4= 4*3*2*1=24 4C 2 = {4
2}= 4!/ 2!(42)!= 4*3*2*1/ (2*1) (2*1)=6
Probabilità-Distribuzione binomiale
La distribuzione Binomiale si applica in caso di variab. Discrete e dicotomiche.
È simmetrica se la prob, di verificarsi l’evento è p=0.50
p≠ 0.50 non è asimmetrica
Per la variabili continue si utilizza la distribuzione normale.
Verifica delle ipotesi
La popolazione: l’insieme degli elementi a cui si rivolge il ricercatore per la sua indagine.
Campione: un sottoinsieme della popolazione che ha tutte le caratteristiche della popolazione da cui proviene (campione rappresentativo)
Quando si lavora con dati del campione si ricorre alla stima dei parametri (che non sono altro che media, varianza, etc.) perché non si conosce la distribuzione della popolazione da cui i soggetti provengono. Per ottenere queste informazioni si utilizzano i parametri del campione.
Verifica delle ipotesi-Campionamento
Il campionamento casuale corrisponde ad un'estrazione da una popolazione di un determinato numero di individui/oggetti. Il campionamento casuale può essere:
● Con reinserimento: se ogni elemento estratto viene reinserito all’interno della popolazione nella quale può essere di nuovo estratto (in questo caso la popolazione rimane la stessa) ;
● Senza reinserimento: la popolazione cambia ad ogni estrazione e con essa la probabilità che ciascun elemento ha di essere estratto.
Verifica delle ipotesi-Parametri indicatori
Il Parametro di una popolazione è la caratteristica oggetto d’esame nella popolazione.
Indicatore o statistica sintetizza la caratteristica oggetto d’esame nel campione estratto casualmente dalla popolazione che ci interessa .
Es Una volta determinata l’ampiezza n del campione, restano definite n variabili casuali X1, ognuna delle quali rappresenta l’iesima estrazione, che, a sua volta, è suscettibile di assumere il valore x1.
Una volta effettuato il campionamento si avranno a disposizione n valori per le n variabili casuali e la media di quel determinato campione sarà data dalla media dei valori assunti dalla variabile casuale.(indicatore più diffuso)
Questa media non è altro che uno dei possibili valori che può assumere la variabile casuale, detta media del campione o media campionaria.
Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media Distribuzione campionaria della media: esempio di distribuzione
campionaria NOTA (che quindi ha media, varianza e deviazione standard note)
Si chiama ERRORE STANDARD la deviazione standard delle distribuzioni campionarie.
Proprietà dei parametri della distribuzione campionaria delle medie
La media delle medie del campione coincide con la media della popolazione dalla quale i campioni sono estratti.Anche se la media della distribuzione campionaria è uguale alla media della popolazione non è detto che la forma sia identica; ciò riguarda l’ampiezza del campione: aumentando l’ampiezza dei campioni aumenta la media di ciascuno di essi diventando una stima più precisa della popolazione
Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media
Esiste una relazione tra la variabilità della distribuzione campionaria delle medie, la variabilità della popolazione ( σ 2) e l’ampiezza del campione (n). Tale relazione si esprime con: Var. (x) = σ2 /n ovvero σ 2 x = σ2 /n
All’aumentare di n la variabilità (o varianza) della distribuzione campionaria delle medie diminuisce fino a tendere a zero (per la legge dei grandi numeri)
Verifica delle ipotesi-Esempio
Compito del ricercatore è quello di controllare se l’ipotesi formulata è da considerare verificata o meno. Significa prendere una decisione.
Dopo aver estratto un campione,dopo aver sintetizzato i dati con un adeguato indicatore,si può considerare verificata l’ipotesi? O il valore ottenuto sul campione è suff. vicino al valore atteso in funzione dell’ipotesi?
Il problema diventa un problema di distanza tra il valore ottenuto e il valore atteso:tale distanza può essere dovuta:
Al caso l’ipotesi nulla è vera Non al caso l’ipotesi nulla è falsa
Verifica delle ipotesi-Esempio
In quest’ultimo caso si può formulare un ipotesi alternativa quando si può dubitare dell’ipotesi nulla
Es: un ricercatore vuole sapere se topi affamati vanno sempre nel braccio sinistro di un labirinto a 2 vie, anche in assenza di cibo.
Ipot. Nulla: i topi sceglieranno in egual misura il braccio sinistro e quello destra (H0: p=.50)
Ip. Alter.:i topi scelgono il braccio sinistro in un numero maggiore rispetto a quello destro che ci si potrebbe aspettare dal caso (H1>.50)
Verifica delle ipotesi-Esempio
Supponiamo di aver estratto un campione di 10 topi: ci attendiamo che i topi scelgono il braccio sinistro:
0 =np= 10*.05= 5μ
Nel caso in cui l’ipot. Nulla sia vera. Effettuato l’esperimento i topi scelgono 6 volte il braccio
sinistro. Sulle tavole della distribuzione binomiale Leggiamo la prob. di un risultato di 6 con n=10 p=.50
otteniamo .20508 ossia una prob. del 20% di ottenere risultato 6. Per convenzione si sceglie con probabilità critica ( ) quella αpari al 5% (.05)
Verifica delle ipotesi-Esempio
Tutti i risultati che hanno prob. Di verificarsi minori di tale livello sono considerati significativi ossia si accetta l’ipot. Alternativa.
Il risultato 6 che corrisponde a una prob. 20% è superiore al 5%. Accettiamo l’ipot. Nulla.
Verifica delle ipotesi-Esempio-Regione Critica
I livelli di probabilità adottati sono 0,05 0,01 e 0,001, generalmente indicati e detti livelli di significatività. Essi αdeterminano la regione di rifiuto per l'ipotesi nulla.
Verifica delle ipotesi-Errori
Si individuano due tipi di errori● rifiutare H0 quando è vera, errore di primo tipo
● accettare H0 quando è falsa, errore di secondo tipo
I livelli di di probabilità critica = .050,.01, .001 significa αrischiare di sbagliare rifiutando l’ipot. Nulla 5 volte su 100, 1 volta su 100, 1 volta su 1000. Nell’ultimo caso l’errore è minimo anche se esiste la possibilità di accettare l’ipot.nulla quando è vera l’ipot. Alternativa (errore di 2 tipo).
Verifica delle ipotesi-Errori-Livelli di probabilità
si Chiamiamo la prob.di accettare l’ipotesi nulla quando è βvera H1; ● 1 si accetta H1 quando è vera (decisione corretta)β● 1 si accetta Ho quando è vera (decisione corretta)α
si accetta Ho quando è falsaα
La quantità 1 si chiama β potenza del test ed esprime quindi la capacità di un test statistico riconoscere la falsità di H0 quando questa è effettivamente falsa.
TRYSTORMING…Just do it !!!
Termine seminario
Studiare
Esercitarsi
Rilassarsi