seminario psicometria i

Università degli Studi e Campus

Facoltà di Scienze PsicologicheCorso Psicometria I

Prof.ssa Simona Musacchio

Ing. Gianluca Pizzuti

Relatori

Introduzione

Cos' è la statistica?

Definizione Trilussa (nota di colore) La statistica fornisce gli strumenti per

analizzare i fenomeni collettivi (caratteristiche fisiche di un gruppo di soggetti).

Statistica descrittiva Popolazione globale/campione

Descrizione Sintesi numerica Analisi dei risultati

Statistica inferenziale Campione

Stima delle caratteristiche Sintesi numerica Analisi dei risultati

Campione statistico/Popolazione

Il campione statistico è un sottoinsieme dell'universo di riferimento, caratterizzato da attributi comuni alla popolazione.

La popolazione è l'insieme dei soggetti appartenenti alla categoria oggetto di studio.

Fasi dell'analisi statistica

1Definizione obiettivi Rilevazione

Elaborazione datiApplicazione degli

esiti dell'analisi

Analisi statistica

Interpretazione dati

Fasi dell'analisi statistica:definizione obiettivi

Individuazione obiettivi

Delimitazione della ricerca nel tempo e nello spazio

2

Fasi dell'analisi statistica:rilevazione

3

L'osservazione dei fenomeni mediante opportuni tecniche e strumenti

L'oggetto della rilevazione può essere l'intera popolazione o un campione di essa rappresentativo

Chi può fare la rilevazione?

Enti pubblici (Istat) ed Istituti privati

La rilevazione si effettua mediante formulari strutturati ai fini dell'analisi

Fasi dell'analisi statistica:elaborazione dati

4

Sintesi dei dati più significativi mediante l'utilizzo di opportuni indici

Fasi dell'analisi statistica:presentazione ed interpretazione dei dati

Rappresentazione dei dati mediante tabelle, grafici ed indici

Spiegazione dei risultati

5

Fasi dell'analisi statistica:applicazione degli esiti dell'analisi

La statistica non è fine a se stessa

6

Sta

tistic

aEconomia

..........

Output

Demografia

Medicina

Indagine statistica: definizione

1 Il carattere oggetto di studio

2 La scala di misurazione del carattere

3 L'universo delle unità statistiche (popolazione)

4 L'ampiezza della rilevazione (totale o parziale)

Unità statistica :definizione

Unità statistica : elemento base della popolazione sul quale viene rilevata la caratteristica oggetto di studio●Unità semplici (persona, abitazione)●Unità composta (famiglia, edificio)●Unità complesse, insieme di unità semplici

differenti,considerati nella loro globalità (rapporto coniugale, rapporto di lavoro)

Carattere :definizione

Carattere : elemento che descrive una popolazione od un campione

Modalità : valori assunti da un carattere su un'unità statistica

Tipologia carattere ●Qualitativo o Mutabile (rappresentato

mediante attributi)●Quantitativo (rappresentato mediante numeri)

Variabile :definizione

Variabile : rappresentata mediante numeri

Modalità : valori assunti da un carattere su un'unità statistica

Tipologia carattere ●Qualitativo o Mutabile (rappresentato

mediante attributi)●Quantitativo (rappresentato mediante numeri)

Variabili: tipologia

Variabili Qualitative●Modalità nominali (es. stato civile)●Modalità ordinali (es. livello di istruzione)

Variabili Quantitative●Valori numerici (es. numero di figli)

Variabili indipendenti (manipolata dallo sperimentatore)

Variabili dipendenti (misurate dallo sperimentatore)

Variabili di disturbo

Variabili: quantitative

Variabili Quantitative●Continue (numeri reali)●Discrete (numeri interi)

Esempio di variabili dipendenti ed indipendenti

30 adolescenti vengono convocati per un test di memoria, a 15 di loro, prima di iniziare la prova viene detto che si tratta di un compito particolarmente difficile, agli altri 15 non viene data alcune indicazione. Indicare la variabile indipendente e quella dipendente.

VARIABILE INDIPENDENTE? Informazione sulla difficoltà della prova VARIABILE DIPENDENTE? Punteggio test di memoria

LA MISURAZIONE: definizione Misurazione

●Assegnare valori numerici ad eventi/oggetti secondo le proprietà del sistema numerico (S.I.)

Scale di misurazione●Scala nominale (variabili o mutabili; i numeri hanno

valore di etichetta). Operazioni di misurazione

– Raggruppamento in classi– Conteggio delle frequenze delle classi

●Scala ordinale (ordinamento secondo una specifica caratteristica) Operazione di misurazione

– Confronti di ordine– Relazione di minore o maggiore

LA MISURAZIONE: le scale ad intervalli

Scale ad intervalli●Caratteristiche

Fondo scala pari a 0 Unità di misura convenzionali Misurano la differenza tra eventi/oggetti L’ampiezza dell’intervallo è costante Operazioni di misura: addizione e sottrazione, trasformazione

dei numeri (normalizzazione)

Esempi:●Scala Celsius, Kelvin, Q.I., Test di atteggiamento e di

personalità

LA MISURAZIONE: le scale a rapporti Scale a rapporti

●Caratteristiche Lo 0 equivale ad assenza di proprietà Non assumono valori negativi Operazioni di misura: addizione e sottrazione, trasformazione

dei numeri (normalizzazione), moltiplicazione e divisione

Esempi:●Distanza, statura, peso

Output delle misurazioni: DatiM

isur

a

Frequenza

DatiPunteggioVariabili quantitative

Variabili qualitative

Le Frequenze

Definizione:●è il numero delle volte secondo cui una modalità di una

variabile si presenta nella popolazione osservata

Frequenze classificazione:●Cumulate (somma progressiva delle frequenze della

distribuzione)●Relative (frequenza della modalità/numero totale delle

osservazioni)●Percentuali: freq.relat*100 (%)

Esempio

Maschi 28 Femmine 22

Il totale delle osservazioni N=50Le frequenze relative dei maschi sono F. rel=28/50=0,56Le frequenze percentuali dei maschi sono F%0 28/50x100= 56%

22FEMMINE

28MASCHI

2228 == fm FF

1

Le Classi

Definizione:●è un raggruppamento di dati in definiti intervalli●Ogni intervallo è delimitato da un estremo inferiore ed

estremo superiore●La differenza tra supinf= ampiezza di classe

Regole di costruzione delle classi:●Non meno di 5 e non più di 20●Intervalli della medesima ampiezza●Ampiezze preferite 3, 5, 10 o multipli●Intervalli mutuamente esclusivi (es. 02, 35, 68….)●Punto medio centrale =(sup+inf)/2 >costruzione

poligono di frequenza

Le Classi: rappresentazione grafica Definizione:

●Spesso per avere una visione d'insieme di una distribuzione di frequenza si usa rappresentarla su grafici.

●istogramma: in cui sull'ascissa sono riportate le modalità della distribuzione e sulle ordinate le rispettive frequenze assolute o relative.

Nel caso di distribuzione in classi: in ascissa vengono rappresentati i limiti degli intervalli e in ordinata le frequenze.

Le Classi: rappresentazione grafica-Istogramma

0

10

20

30

40

50

60

70

80

90

1°Trim.

2°Trim.

3°Trim.

4°Trim.

Est

Ovest

Nord

Le Classi: rappresentazione grafica-Poligono di frequenza Definizione:

●Poligono di frequenza: in cui sull'ascissa sono riportate le modalità ( il valore medio di ciascuna classe )e sull'ordinata le frequenze relative cumulate e i punti trovati si uniscono con una spezzata

●Il poligono di frequenza si utilizza quando il ricercatore è interessato a rappresentare nello stesso grafico più distribuzioni di frequenze relative a gruppi diversi.

Le Classi: rappresentazione grafica-Poligono di frequenza

Poligono di frequenza

0

20

40

60

80

100

1° Trim. 2° Trim. 3° Trim. 4° Trim.

fr

maschifemmine

Statistica descrittiva

Definizione:●I dati ottenuti durante uno studio empirico (dati grezzi)

possono essere sintetizzati in una forma analizzabile. L’ampio numero di osservazioni si può ridurre in numero più piccolo di indici statistici (statistiche descrittive).

●Le principali statistiche descrittive sono:

Misure della tendenza centrale: moda, mediana, media Misure della variabilità:range, differenza interquartile,

deviazione standard e varianza.

Statistica descrittiva-Moda

Definizione:

La moda è rappresentata dal valore più frequente della distribuzione osservata. Può essere espresso in ogni scala di misura (è l’unico indice di tendenza centrale per la scala nominale) Quando la moda è unica si parla di distribuzione unimodale, ma se ci sono due valori ugualmente frequenti la distribuzione è detta bimodale.

Statistica descrittiva-Moda

Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 15, 19. N = 13

●Il 15 si presenta più frequentemente, quindi è il valore modale La distribuzione è UNIMODALE

Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 13, 19. N = 13, 15

●Il 13 ed il 15 si presentano più frequentemente, quindi sono i valori modali La distribuzione è BIMODALE

Statistica descrittiva-Mediana Definizione: MEDIANA −E’ rappresentata dal valore che occupa la posizione centrale della

distribuzione (valore che divide in due parti uguali la distribuzione, al di sopra e al di sotto del quale si trovano il 50% dei casi)

la determinazione della mediana è diversa a seconda che sia n dispari o pari. Se n è dispari, la mediana e l'intensità individuata dal posto centrale:

C = (n+1) / 2

Ad esempio, la mediana dell'intensità 3, 15, 9, 2, 6,12, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 6, 9,12,15.

Siccome le intensità sono sette, numero dispari, il posto centrale è unico ed è pari a:

C = (7+1) / 2 = 4 (posizione della mediana)

La mediana è quindi, l'intensità individuata dal quarto posto, vale a dire che essa è uguale a 6.

Statistica descrittiva-Mediana Se n è pari, la mediana è data dalla semisomma delle intensità

corrispondenti ai due posti centrali:

C = n / 2 C = (n / 2) + 1

Ad esempio, la mediana delle intensità 7, 16, 2, 3, 9, 12, 15, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 7, 9, 12, 15, 16. (n=8)

Visto che si tratta di 8 numeri, numeri pari, i posti centrali sono due e sono:

C = 4 (7 ) e C = 5 (9) (posizioni della mediana)

Pertanto, la mediana è dalla semisomma delle intensità individuate dal quarto e dal quinto posto, vale a dire che essa è uguale a:

Me = (7 + 9) / 2 = 8

Statistica descrittiva-Media MEDIA (è il centro di gravità della distribuzione)

● La media aritmetica è data dalla somma delle misure osservate diviso il numero delle osservazioni fatte (N)

● Si indica con M per i campioni e con μ per le popolazioni● Può essere calcolata su scale di misura ad intervalli e a rapporti

(scale METRICHE)

La media aritmetica è uguale alla somma dei termini divisa per il loro numero.

Se si indicano gli n termini di una serie con x1, x2, x3….. xn, la media aritmetica sarà pari a:M = (x1 + x2 + x3 + ….. + xn ) / n

Se ad esempio avessimo i valori 1, 2, 3, 7, 10, 13, specificano la formula sopra enunciata, si ottiene:

M = (1+2+3+7+10+13) / 6 = 36/6 = 6 La formula può essere meglio come:M = Σ Xi/N

Oppure M = fi Xi/NΣ (in questo caso si moltiplica la frequenza di ogni classe per il valore

medio di ogni classe)

Statistica descrittiva-Media-Esempio

M = fi Xi/NΣ Valore=193/10

19310TOTALE

100520

57319

36218

VALORE*FREQ.FREQ.VOTI

1

Statistica descrittiva-Indici di posizione Definizione: Gli indici DI POSIZIONE indicano la posizione che un valore occupa all’interno di una distribuzione.

● QUARTILI● DECILI● PERCENTILI

● I percentili o quantili sono le intensità che dividono una distribuzione in due parti, lasciandola da una parte x% dei casi e dall’altra parte il rimanente (100 – x%).I quantili si dicono quartili se dividono la distribuzione in 4 parti uguali, tali che: il primo quartile lascia alla sinistra il 25% dei casi e alla sua destra il rimanente 75 % dei casi;il secondo quartile, che coincide con la mediana lascia alla sua sinistra il 50% dei casi ed alla destra il rimanente 50%; il terzo quartile lascia alla sua sinistra il 75% dei casi ed alla sua destra il rimanente 25%.

1° quartile 2° quartile 3° quartile__________|__________|___________|__________ Per calcolarli occorre:1. Ordinare in senso crescente la distribuzione 2. Calcolare le frequenze cumulate 3. Calcolare la posizione del quartile con le seguenti formule:1° quartile pos Q1= ((n+1)/4) *1° quartile pos Q2= ((n+1)/4) *2 3° quartile pos Q3= ((n+1)/4) *3

Statistica descrittiva-Indici di posizione-Quartili

Esempio●Pos Q1=n+1/4*1= 101+1/4*1=101+1/4*1=25.5●Corrisponde alla seconda posizione

101101469720577264512033121210101F.cum.Freq.

1

Statistica descrittiva-Indici di posizione-Decili, centili o percentili

Esempio:●Decili= nove punti che dividono la distrib. In 10 parti.

(pos D1= n+1/10*1;pos D3=n+1/10*3)●Percentili= 99 punti che dividono la distrib. In 100 parti

(pos.P1= n+1/100*1)

Statistica descrittiva-Indici di dispersione o variabilità

Definizione:

●Le medie facilitano la comprensione della frequenza dei fenomeni collettivi. Per una più esatta conoscenza di essi occorre però anche studiare la loro variabilità, cioè la capacità di assumere differenti valori quantitativi in un certo periodo di tempo, o in seguito all’influenza di un altro o altri fenomeni.

Statistica descrittiva-Indici di dispersione o variabilità-Campo variazione

Campo di variazione E’ una misura della variabilità dei dati. Esso si ottiene dalla differenza

tra il valore massimo e quello minimo delle intensità di un fenomeno.

CV = XmaxXmin

Ad esempio se le intensità di un dato fenomeno sono le seguenti:

29 24 20 28 22 22 23

Il campo di variazione sarà: 29 – 20 = 9

Statistica descrittiva-Indici di dispersione o variabilità-Differenza Interquartile

●Definizione

Differenza interquartile: è un indice più robusto ai valori anomali rispetto al campo di variazione.

IQR=Q3Q1

Statistica descrittiva-Indici di dispersione o variabilità-Varianza

●Definizione Scostamento semplice medio (SSM)

è la differenza tra un singolo punteggio e il punteggio medio Devianza è la somma degli scarti elevati al quadrato di ciascun

punteggio dalla media Varianza: è la media dei quadrati degli scostamenti dalla media

di tutti i soggetti e indica la distanza media di ciascun soggetto dalla media del campione.

Si indica con s2.

Scostamento quadratico medio o deviazione standard:

è la radice quadrata positiva della varianza

Statistica descrittiva-Indici di dispersione o variabilità-Varianza

●Esempio

28049937107427961178500774117634275293741

SCARTI QUADRATI

SCARTI DALLA MEDIA

MEDIADATI GREZZI

Statistica descrittiva-Indici di dispersione o variabilità-Deviazione Standard Calcolo

●Calcolo MEDIA= SX/N= 49/7=7

DEVIANZA= sommatoria degli scarti al quadrato= 28

VARIANZA= sommatoria degli scarti al quadrato/media=28/7=4

DEVIAZIONE STANDARD=la radice quadrata positiva della varianza= 2

Statistica descrittiva-Standardizzazione delle misure

●Definizione naif

Per poter confrontare in maniera adeguata i punteggi ottenuti da soggetti diversi in situazioni diverse, non possiamo accontentarci di guardare il punteggio grezzo, ma dobbiamo fare un confronto con dei punteggi, detti standardizzati, che possano essere un riferimento generale.

Statistica descrittiva-Standardizzazione delle misure

Per effettuare il confronto, si usano delle trasformazioniche rendono confrontabili tra loro distribuzioni diverse. 2 tipi di trasformazioni:

●punti Z (in questo caso dobbiamo avere come riferimento la media e la deviazione standard)

●percentili, decili, quartili (riferimento posizione nel gruppo)

Statistica descrittiva-Standardizzazione delle misure-Z

Formula Z transform

sXX

Z ii

−=


Esempio

Un bambino di 5 anni ha un punteggio 20 in test di lettura.Tuttavia, possiamo domandarci: la posizione nel test del bambino di 5 anni è migliore rispetto al gruppo di 5 anni. Confrontiamo il punteggio del bambino con la media del suo gruppo (media=10;d.s.=5)Otteniamo che: il bambino è migliore rispetto alla media della classe.Standardizziamo il punteggio del bimbo (standardizzare una misura significa riferire la misura stessa a una scala standard con media e varianza note. La scala più comune è quella della standard o z che ha la media 0 e varianza 1.


25

1020 =−=−=s

XXZ i

i

Esempio Tale trasformazione si ottiene trasformando

una serie di punteggi xi in punteggi zi con la seguente formula:

Il bimbo sta 2 deviazioni standard sopra la media.

Se la media del suo gruppo fosse stata di 25:

La prestazione del bimbo è inferiore alla media del gruppo.

15

2520 −=−=bZ

Statistica descrittiva-Standardizzazione delle misure-Percentili

Il percentile è il valore al di sotto del quale si trova una certa percentuale di casi di una distribuzione.

Esempio:il 94 percentile è il valore al di sotto del quale si trova il 94% dei casi di una distribuzione.

Ad esempio si considera la distrib. delle medie dei voti d’esame, il voto 29 corrisponde al 94° percentile della distribuzione

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo

Il calcolo dei vari percentili è analogo a quello per il calcolo della mediana, dividendo la numerosità totale invece che per due, per il numero di classi che sono individuate (10 per i decili, 100 per i centili, ecc.).

Per i decili il primo decile sarà dato dal valore corrispondente alla posizione n/10, il secondo dalla posizione 2*n/10, il quinto da 5*n/10 (=nl2=Mediana),…….

il decimo da 10*n/10 (=n).


Si esprime il punteggio di un soggetto in relazione alla posizione occupata dal soggetto(So) nella distribuzione (cioè nel gruppo di cui fa parte). In particolare, si calcola la sua posizione come se il gruppo fosse formato da 100 soggetti(Ss).

Procedura (simile alla mediana):– si ordinano i Ss (da quello che ha preso il punteggio più

basso a quello che ha preso il punteggio più alto)– si vede che posizione occupa il So (per es., è il 30° in

un distribuzione di 50 Ss)– si vede che posizione il So occuperebbe se ci fossero

non 50 Ss ma 100 Ss.– è logico pensare che se il So è 30° su 50 Ss sarebbe

60° su 100 Ss.– si dice perciò che il So è al 60° percentile.


In altre parole, si fa una proporzione:30° : 50 = x : 100x = 30/50 × 100 = 60°

Il percentile indica perciò la percentuale di Ss che hanno avuto un punteggio minore del So (e, per differenza, la percentuale di Ss che hanno avuto un punteggio superiore).

Un So è nel 25° percentile: significa che sotto di lui c’è il 25% dei Ss e sopra di lui il 75%.

Un soggetto al 50% percentile sta a metà.

Statistica Inferenziale

La statistica inferenziale ha come obiettivo, invece, quello di fare affermazioni, con una possibilità di errore controllata, riguardo la natura teorica (la legge probabilistica) del fenomeno che si osserva.

La statistica inferenziale è fortemente legata alla teoria della probabilità.

Probabilità

• La probabilità che si verifichi un certo evento è uguale alla frequenza (relativa) con cui l’evento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.

• P(A) è la probabilità di verificarsi un evento A • Lim limite per n che tende all’infinito ∞ e indica un numero

molto grande• fA frequenza con cui si è verificato l’evento A in un numero di

prove n

nf

AP A

nlim)(

∞→=

Probabilità-Posteriori

Probabilità a posteriori: è data dal rapporto tra i risultati favorevoli e il totale delle prove effettuate, quando questo numero diventa infinitamente grande. Il concetto di probabilità a posteriori si riduce in definitiva a quello di frequenza relativa di un fenomeno, quando il numero di prove è finito (quella sopradetta).

Non è possibile definire la probabilità in base ad un’unica prova ma le prove devono essere molte e ripetute.Es: lanciando un dado 10 volte avremo la seguente sequenza (4752928145) la probabilità di ottenere la faccia 5; basata sulla frequenza relativa in 10 lanci, è di 2/10=0.20

Probabilità-Teorica

Definizione: probabilità a priori o teorica: è il rapporto tra numero di casi favorevoli al verificarsi di un evento ed il totale degli eventi possibili, supposti equiprobabili.

Riprendendo il caso del lancio di un dado non truccato, la probabilità dell'evento esce 6 è uguale a 1/6.

Probabilità-Concetti generali

Evento: uno dei possibili risultati di una prova; se la prova consistesse nell’osservazione dell’esito del lancio del dado, l’evento sarebbe la faccia 5.

La prob.di A si definisce con P(A), faccia 5.

Tutte le altre facce esclusa la 5 hanno la prob.P(non A)

P(A) +P(non A)= 1

La somma delle probabilità di tutti gli eventi è uguale a 1 (probabilità dell’evento certo)

Probabilità-Concetti generali-Principio della somma

• La probabilità di verificarsi di due eventi mutualmente escludentisi è uguale alla somma delle probabilità di verificarsi dei singoli eventi:

P(A U B) = P (A) + P (B)

• La probabilità che lanciando un dado si ottenga l’evento numero dispari (faccia 1,3,5) sarà

uguale: P1+P3+P5= 1/6+1/6+1/6=3/6= ½

Probabilità-Concetti generali-Principio del prodotto Definizione:

Quando due eventi si verificano simultaneamente o in successione :P (A e B) = P (A) * P (B)

la probabilità di avere 2 con due dadi è data dalla prob.di avere 1 con dado e 1 con l’altro.P (s=2) = P (1) * P (1)= 1/6*1/6 = 1/36La combinazione 1+ 1 è solo una dei 36 eventi possibili che corrispondono ai 36 diversi modi possibili in cui si possono combinare le 6 facce del primo dado con le 6 facce del secondo.

Probabilità-Concetti generali-Probabilità condizionata Definizione:

Abbiamo trattato di eventi indip., quando invece si tratta di eventi non indipen. Ossia quegli eventi che il verificarsi dell’uno modifica la prob. del verificarsi dell’altro.

Ad esempio nel lotto l’aver estratto un numero (tra i 90 possibili) modifica la prob. di estrazione del numero successivo (1/89)

P (A B) = P (A) * P (B/A)= P(B) P(A/B)

Probabilità-Concetti generali-Probabilità condizionata

P (∅) = 0;

P (Ā) = 1 P(A), dove Ā è not A

P (A U B)= P(A) +P(B) P(A B)∩

Probabilità-Concetti generali-Probabilità condizionata

Tra due eventi A e B può sussistere una relazione per la quale, sapendo che una prova ha generato un risultato che appartiene a B, si è indotti a modificare la valutazione del verificarsi di A. La probabilità dell'evento B, dato che si è verificato l'evento A, è il rapporto fra la probabilità del contemporaneo verificarsi di A e B e la probabilità di A, se questa è diversa da zero.

0)(;)(

)()(

0)(;)(

)()(

>∩=

>∩=

APAP

ABPABP

BPBP

BAPBAP

Probabilità-Distribuzione normale

La Curva normale è la curva continua rappresentativa delle distribuzioni che più frequentemente si incontrano in statistica

E’ simmetrica e unimodale. Media, moda e mediana coincidono. I valori si addensano attorno alla media (il 94,5dei valori sono posizionati entro i due scarti quadrati medi sopra e sotto la media.) Per descriverla bastano la media e la d.s.

Un solo valore appare con la frequenza massima, quella centrale, e sono tanto meno frequenti quanto più si allontanano dal valore centrale.


Si applica a variab. Continue ossia che la funzione viene definita su tutto l’asse dei numeri reali da ∞ a +∞ (sulle ascisse si trovano tutti i valori di x e sulle ordinate le frequenze di ciascun valore)

La somma di tutte le prob. È uguale a 1 Espressa dall’integrale:

+∞

ƒ ƒ(x)dx=1∞

Che esprime l’area racchiusa dalla distrib. a campana


1/2 .( )2/ 2Χ μ σ

F(x)=1/ √2 e σ π

F(x)=frequenza di un dato valore di x X=qualsiasi valore nella distribuzione =media della distribuzioneμ

=deviazione standard della distrib.σ

=3,1416π

e=2,7183(base dei logaritmi neperiani)σ 2 µ sono media e varianza della popolazione

Probabilità-Distribuzione normale-Esempio L’area sottesa nel punto x esprime qual’è la probababilità che

si presenti un valore inferiore o superiore a x. Per esempio consideriamo una distribuzioni di voti all’esame, ci sono 20 possibilità che uno studente abbia una media superiore al 27,5

Probabilità-Distribuzione normale-Esempio Vogliamo sapere qual è la prob. , in una distrib. di Q.I. µ = 100 σ = 10, di

ottenere un punteggio compreso tra 90 e 100:

X2=100

ƒ ƒ(x)dx=?x1=90

Trasformiamo i punti grezzi in punti z: Z1= xµ /σ = 90100/10= 1 Z2= 100100/10=0

L’integrale diventa: 0

ƒ f(z)dz=? 1

L’area che ci interessa è l’area tra 0 e –1. Sulla tavola B troviamo l’area tra 0 e 1. Riga = I cifra decimale colonna= II cifra decimaleZ1=1 riga=1.0 col.=0 = .3413 la risposta che cercavamo

Probabilità-Distribuzione binomiale

Ad ogni evento si associa una prob. che assume una distribuzione che si definisce in base all’evento. X= evento e f(x) la sua distribuzione . In caso x assume 2 valori (testa e croce), eventi indip.Se eseguiamo n prove avremo una distrib. teorica definita binomiale.

Equazione: f(x)= n C x p x q nx

p= prob. che si verifichi l’evento Q= prob che non si verifichi l’evento n C x = numero dei modi in cui si possono combinare x

successi (nx) insuccessi in n prove


n C x

Si definisce comb. di n oggetti a r a r , tutte le possibili repliche che si costituiscono con n oggetti senza tener conto dell’ordine degli oggetti stessi.

La combinazione formula: n C x = {n

r}= n!/ r! (nr) !=

Il punto ! Si legge fattoriale e indica tutta la serie di numeri naturali.

Per es n=4 n!= 4= 4*3*2*1=24 4C 2 = {4

2}= 4!/ 2!(42)!= 4*3*2*1/ (2*1) (2*1)=6


La distribuzione Binomiale si applica in caso di variab. Discrete e dicotomiche.

È simmetrica se la prob, di verificarsi l’evento è p=0.50

p≠ 0.50 non è asimmetrica

Per la variabili continue si utilizza la distribuzione normale.

Verifica delle ipotesi

La popolazione: l’insieme degli elementi a cui si rivolge il ricercatore per la sua indagine.

Campione: un sottoinsieme della popolazione che ha tutte le caratteristiche della popolazione da cui proviene (campione rappresentativo)

Quando si lavora con dati del campione si ricorre alla stima dei parametri (che non sono altro che media, varianza, etc.) perché non si conosce la distribuzione della popolazione da cui i soggetti provengono. Per ottenere queste informazioni si utilizzano i parametri del campione.

Verifica delle ipotesi-Campionamento

Il campionamento casuale corrisponde ad un'estrazione da una popolazione di un determinato numero di individui/oggetti. Il campionamento casuale può essere:

● Con reinserimento: se ogni elemento estratto viene reinserito all’interno della popolazione nella quale può essere di nuovo estratto (in questo caso la popolazione rimane la stessa) ;

● Senza reinserimento: la popolazione cambia ad ogni estrazione e con essa la probabilità che ciascun elemento ha di essere estratto.

Verifica delle ipotesi-Parametri indicatori

Il Parametro di una popolazione è la caratteristica oggetto d’esame nella popolazione.

Indicatore o statistica sintetizza la caratteristica oggetto d’esame nel campione estratto casualmente dalla popolazione che ci interessa .

Es Una volta determinata l’ampiezza n del campione, restano definite n variabili casuali X1, ognuna delle quali rappresenta l’iesima estrazione, che, a sua volta, è suscettibile di assumere il valore x1.

Una volta effettuato il campionamento si avranno a disposizione n valori per le n variabili casuali e la media di quel determinato campione sarà data dalla media dei valori assunti dalla variabile casuale.(indicatore più diffuso)

Questa media non è altro che uno dei possibili valori che può assumere la variabile casuale, detta media del campione o media campionaria.

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media Distribuzione campionaria della media: esempio di distribuzione

campionaria NOTA (che quindi ha media, varianza e deviazione standard note)

Si chiama ERRORE STANDARD la deviazione standard delle distribuzioni campionarie.

Proprietà dei parametri della distribuzione campionaria delle medie

La media delle medie del campione coincide con la media della popolazione dalla quale i campioni sono estratti.Anche se la media della distribuzione campionaria è uguale alla media della popolazione non è detto che la forma sia identica; ciò riguarda l’ampiezza del campione: aumentando l’ampiezza dei campioni aumenta la media di ciascuno di essi diventando una stima più precisa della popolazione

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media

Esiste una relazione tra la variabilità della distribuzione campionaria delle medie, la variabilità della popolazione ( σ 2) e l’ampiezza del campione (n). Tale relazione si esprime con: Var. (x) = σ2 /n ovvero σ 2 x = σ2 /n

All’aumentare di n la variabilità (o varianza) della distribuzione campionaria delle medie diminuisce fino a tendere a zero (per la legge dei grandi numeri)

Verifica delle ipotesi-Esempio

Compito del ricercatore è quello di controllare se l’ipotesi formulata è da considerare verificata o meno. Significa prendere una decisione.

Dopo aver estratto un campione,dopo aver sintetizzato i dati con un adeguato indicatore,si può considerare verificata l’ipotesi? O il valore ottenuto sul campione è suff. vicino al valore atteso in funzione dell’ipotesi?

Il problema diventa un problema di distanza tra il valore ottenuto e il valore atteso:tale distanza può essere dovuta:

Al caso l’ipotesi nulla è vera Non al caso l’ipotesi nulla è falsa


In quest’ultimo caso si può formulare un ipotesi alternativa quando si può dubitare dell’ipotesi nulla

Es: un ricercatore vuole sapere se topi affamati vanno sempre nel braccio sinistro di un labirinto a 2 vie, anche in assenza di cibo.

Ipot. Nulla: i topi sceglieranno in egual misura il braccio sinistro e quello destra (H0: p=.50)

Ip. Alter.:i topi scelgono il braccio sinistro in un numero maggiore rispetto a quello destro che ci si potrebbe aspettare dal caso (H1>.50)


Supponiamo di aver estratto un campione di 10 topi: ci attendiamo che i topi scelgono il braccio sinistro:

0 =np= 10*.05= 5μ

Nel caso in cui l’ipot. Nulla sia vera. Effettuato l’esperimento i topi scelgono 6 volte il braccio

sinistro. Sulle tavole della distribuzione binomiale Leggiamo la prob. di un risultato di 6 con n=10 p=.50

otteniamo .20508 ossia una prob. del 20% di ottenere risultato 6. Per convenzione si sceglie con probabilità critica ( ) quella αpari al 5% (.05)


Tutti i risultati che hanno prob. Di verificarsi minori di tale livello sono considerati significativi ossia si accetta l’ipot. Alternativa.

Il risultato 6 che corrisponde a una prob. 20% è superiore al 5%. Accettiamo l’ipot. Nulla.

Verifica delle ipotesi-Esempio-Regione Critica

I livelli di probabilità adottati sono 0,05 0,01 e 0,001, generalmente indicati e detti livelli di significatività. Essi αdeterminano la regione di rifiuto per l'ipotesi nulla.

Verifica delle ipotesi-Errori

Si individuano due tipi di errori● rifiutare H0 quando è vera, errore di primo tipo

● accettare H0 quando è falsa, errore di secondo tipo

I livelli di di probabilità critica = .050,.01, .001 significa αrischiare di sbagliare rifiutando l’ipot. Nulla 5 volte su 100, 1 volta su 100, 1 volta su 1000. Nell’ultimo caso l’errore è minimo anche se esiste la possibilità di accettare l’ipot.nulla quando è vera l’ipot. Alternativa (errore di 2 tipo).

Verifica delle ipotesi-Errori-Livelli di probabilità

si Chiamiamo la prob.di accettare l’ipotesi nulla quando è βvera H1; ● 1 si accetta H1 quando è vera (decisione corretta)β● 1 si accetta Ho quando è vera (decisione corretta)α

si accetta Ho quando è falsaα

La quantità 1 si chiama β potenza del test ed esprime quindi la capacità di un test statistico riconoscere la falsità di H0 quando questa è effettivamente falsa.

TRYSTORMING…Just do it !!!

Termine seminario

Studiare

Esercitarsi

Rilassarsi

seminario psicometria i

Documents