riassunto maffenini

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopas

www.AppuntiBicocca.com Metodi quantitativi per il marketing

Prof. Maffenini Anno 2008/09 Economia

df h kl b df h kl

www.AppuntiBicocca.com ‐ Metodi quantitativi per il marketing

materiale gratuito disponibile sul sito http://www.appuntibicocca.com 2 of 31

INDICE

QUALITA’ DELLE INFORMAZIONI STATISTICHE RACCOLTE TRAMITE LE INDAGINI CAMPIONARIE ........ 4

QUALITA’ DELL’INFORMAZIONE STATISTICA ...................................................................................... 4

L’INFORMAZIONE STATISTICA può essere di 3 tipologie: ................................................................... 4

DEFINIZIONI DI QUALITA’ DELL’INFORMAZIONE STATISTICA: ............................................................ 5

ERRORE STATISTICO O TOTALE ........................................................................................................... 5

ERRORE STATISTICO CAMPIONARIO ................................................................................................... 6

ERRORE STATISTICO NON CAMPIONARIO .......................................................................................... 6

ERRORE STATISTICO VARIABILE .......................................................................................................... 6

ERRORE STATISTICO SISTEMATICO o DISTORSIONE ........................................................................... 7

LEZIONE DEL 03/03/08 ............................................................................................................................ 8

FASI DELL’INDAGINE(ISTAT): ............................................................................................................... 9

ERRORI DI LISTA ................................................................................................................................ 10

ERRORI DI NON RISPOSTA ................................................................................................................. 12

ERRRORI DI MISURA .......................................................................................................................... 12

CAUSE DEGLI ERRORI NON CAMPIONARI nelle varie fasi ..................................................................... 13

FASE 1: DEFINIZIONE OGGETTO ........................................................................................................ 13

FASE 2 ................................................................................................................................................ 13

FASE 3 ................................................................................................................................................ 14

FASE 4 ................................................................................................................................................ 16

LEZIONE 10/03/08 ................................................................................................................................. 16

LE CLASSICHE TECNICHE DI RILEVAZIONE O DI SOMMINISTRAZIONE SONO 3: ............................... 17

NON RISPOSTE : ................................................................................................................................ 17

MANCATE RISPOSTE PARZIALI: ......................................................................................................... 18

ERRORI DI MISURA O ERRORI DI RISPOSTA ...................................................................................... 19

ERRORI DOVUTI AL RISPONDENTE: .................................................................................................. 19

ERRORI CHE DIPENDONO IN MODO + EVIDENTE DALL’INTERVISTATORE ........................................ 20

FASE 5 ................................................................................................................................................ 20

PREVENZIONE E CONTROLLO ERRORE .............................................................................................. 21

ERRORE DI COPERTURA: .................................................................................................................. 21

SECONDO TIPO DI ERRORE DI LISTA: ................................................................................................ 23

Panel ..................................................................................................................................................... 24

CAMPIONI INDIPENDENTI ................................................................................................................. 24



CORREZIONE DEGLI ERRORI NON CAMPIONARI ............................................................................... 25

MANCATE RISPOSTE TOTALI ............................................................................................................. 26

LEZIONE DEL 14/04/08 .......................................................................................................................... 27

METODO DELLA PONDERAZIONE: .................................................................................................... 27

MANCATE RISPOSTE PARZIALI .......................................................................................................... 28

SECONDA PARTE I MEDIA E LA PUBBLICITA’ ......................................................................................... 30

Cenni sulla pubblicità. ....................................................................................................................... 30

RUOLO ECONOMICO DELLA PUBBLICITÀ .......................................................................................... 30

TEORIA DELL’INFORMAZIONE ........................................................................................................... 31



QUALITA’ DELLE INFORMAZIONI STATISTICHE RACCOLTE TRAMITE LE INDAGINI CAMPIONARIE

L’utilizzo del campione è ormai diffuso in tutti le tipologie di raccolta di informazioni statisti‐che. E’ importante controllare la qualità di tali informazioni e dei metodi utilizzati per racco‐glierle in quanto spesso le info stesse sono alla base di scelte strategiche ed economiche ri‐levanti.

QUALITA’ DELL’INFORMAZIONE STATISTICA Si tratta delle informazioni raccolte mediante indagini statistiche, ovvero tutte le operazioni che permettono di avere informazioni quantitative rispetto ad un determinato fenomeno che voglio conoscere.

E’ un processo produttivo perché produce un’informazione( come tv, giornale ecc produce la notizia partendo da un avvenimento) anche l’informazione statistica o il dato statistico è considerata come prodotto e per questo è venduta a pagamento (Nielsen) come gli altri beni, è un bene immateriale.

L’indagine è quella sollecitazione dell’individuo che permette di oggettivare un fenomeno e considerarlo un’informazione (risposta alla domanda).

Un fenomeno diventa informazione statistica nel momento in cui è possibile misurarlo og‐gettivamente, cioè quando assume una dimensione quantitativa, tramite un processo di ela‐borazione che porta alla PRODUZIONE dell’informazione stessa. (assimilabile al processo produttivo industriale).

Esempio: il REDDITO PERCEPITO da alcuni individui è un fenomeno che si verifica alla fine del mese per tutto l’anno. La rilevazione di tutti gli stipendi ed il calcolo della media aritmetica permette di ottenere il REDDITO MEDIO ANNUO oppure MENSILE che non sono direttamente rilevabili, ma frutto dell’elaborazione statistica e prendono il nome di informazione o dato statistico.

L’INFORMAZIONE STATISTICA può essere di 3 tipologie: 1. MICRO DATO o DATO ELEMENTARE

Dato rilevato sulla singola unità statistica individuo che compone la popolazione 2. MACRO DATO o STATISTICA

Risultato di una qualsiasi funzione di sintesi dei dati elementari (es. Media, Frequen‐za Relativa, Mediana….)

3. META DATO



Informazione qualitativa e quantitativa riguardante le diverse operazioni dell’indagine, necessari per capire se i risultati ottenuti sono attendibili o no. La misurazione della qualità dell’informazione statistica considera non solo la qualità dei micro dati e dei macro dati ma anche il grado di trasparenza nei processi di inda‐gine.

DEFINIZIONI DI QUALITA’ DELL’INFORMAZIONE STATISTICA:

Un dato statistico è qualitativamente buono se è vero, cioè se corrisponde alla realtà del fenomeno. semplice ma poco operativa

( concetto di qualità utilizzato nei processi di produzione manifatturiera) Il produttore offre due tipologie di garanzie qualitative:

GARANZIE DI PROGETTAZIONE Il produttore garantisce la conformità ai requisiti del bene prodotto

GARANZIE DI TOLLERANZA Il produttore fornisce dei limiti entro i quali alcuni requisiti possono variare e garantisce la conformità del prodotto all’interno di quel margine di tolleranza che è variabile a seconda della tipologia di prodotto.

(definizione istat) Proprietà di progettazione requisiti del bene prodotto L’informazione statistica deve avere una qualità tale da soddisfare le aspettative dell’utente, in particolare:

TEMPESTIVITA’ : un’informazione non tempestiva è di bassa qualità RILEVANZA TEORICA: le informazioni prodotte sono di buona qualità se risul‐tano adeguate alle necessità informative

RILEVANZA EFFETTIVA: la qualità è proporzionale alla parte di informazione che viene effettivamente utilizzata

TRASPARENZA: la qualità aumenta all’aumentare della possibilità dell’utente di accedere a tutte le informazioni relative agli strumenti utilizzati

TOLLERANZA: indica la precisione dei dati, la differenza tra il valore vero ed il valore osservato, che può essere causata dalla tecnica campionaria scelta PRECISONE CAMPIONARIA oppure da problemi verificatisi durante l’indagine PRECISIONE NON CAMPIONARIA

ERRORE STATISTICO O TOTALE si verifica nel momento in cui un dato non è preciso.

E’ il risultato della differenza tra il dato ottenuto con la rilevazione (DATO MISURATO = MI‐SURA) e il valore vero del fenomeno, cioè il valore effettivo, reale, privo di errori.



Tipologie di errore statistico :

Rispetto al MICRO DATO L’errore è relativo al valore rilevato sulla singola unità statistica

Rispetto alla STATISTICA – MACRO DATO Gli errori di rilevazione si ripercuotono anche sulla loro sintesi (statistiche) L’errore è causato dal fatto che la risposta allo stimolo è arrivata solo da parte della popolazione e non dalla totalità, quindi alcuni aspetti vengono sicuramente valutati in modo errato. La statistica risulta distorta in quanto non si verifica la compensazione degli errori a livello di micro dato (errori + ed errori ‐).

Sulla base delle precedenti tipologie di errore è possibile definire le seguenti categorie:

ERRORE STATISTICO CAMPIONARIO L’errore campionario dipende dal fatto che il valore vero viene stimato con un cam‐pione probabilistico lo stimatore (valore atteso medio) che è diverso dal valore medio reale E’ per questo motivo che la stima è intervallare non puntuale, e si considera un in‐tervallo di confidenza proprio ad evidenza dell’errore commesso. L’errore campionario può dipendere anche dal tipo di stimatore utilizzato che può ri‐sultare non corretto per stimare il fenomeno in considerazione. Es. la Mediana a volte corrisponde alla Media altre no, in questi casi non è adatta a stimare la media.

ERRORE STATISTICO NON CAMPIONARIO L’errore è imputabile al processo di indagine statistica, è causato dai problemi, dalle situazioni di difficoltà che provocano imprecisioni nell’indagine statistica Esempi: errori di trascrizione numeri – lista non completa – domande non compren‐sibili – domande troppo private….. N.B. E’ presente anche nelle indagini statistiche totali (es. censimento) non solo in quelle campionarie.

ERRORE STATISTICO VARIABILE L’errore si dice variabile se le differenze fra valore vero e valore osservato (errori) nelle unità oggetto dell’indagine sono distribuiti CASUALMENTE e con MEDIA NULLA all’interno della popolazione. Ad esempio nelle distribuzioni Normali cambia la variabilità ma non la precisione.



ERRORE STATISTICO SISTEMATICO o DISTORSIONE L’errore ha uno specifico segno. (sistematicamente + o sistematicamente ‐) Il valore atteso di questa stima non è uguale al valore vero, è sempre maggiore o sempre minore. Es. se tutti i soggetti dichiarano un valore di reddito inferiore rispetto a quello effet‐tivo anche la media risulterà distorta inferiormente perché deriva da dati sistemati‐camente inferiori ai reali. I precedenti possono essere combinati nei seguenti modi: ERRORE CAMPIONARIO + ERRORE SISTEMATICO

DISTORSIONE CAMPIONARIA O DELLO STIMATORE La distorsione dipende dal fatto di utilizzare un campione per cui può verificarsi un errore nella scelta della strategia di campionamento oppure dello stimatore. ERRORE CAMPIONARIO + ERRORE VARIABILE

ERRORE VARIABILE CAMPIONARIO Lo stimatore differisce dal valore vero per il caso, cioè per l’utilizzo di un campione (discorso dell’intervallo di confidenza) ERRORE NON CAMPIONARIO + ERRORE SISTEMATICO

ERRORE SISTEMATICO NON CAMPIONARIO o DISTORSIONE SISTEMA‐TICA Dipende dal comportamento dell’intervistato, ad esempio nel caso in cui risponde solo una parte della popolazione(errore non campionario) se la parte che non ri‐sponde presenta caratteristiche differenti rispetto alla parte che risponde (errore si‐stematico) alcuni fattori vengono sottostimati e provocano la distorsione. ERRORE NON CAMPIONARIO + ERRORE VARIABILE

ERRORE VARIABILE NON CAMPIONARIO Se risponde il 75 % degli intervistati (errore non campionario) la conseguenza è l’aumento della variabilità dello stimatore (errore variabile), infatti, al diminuire della popolazione considerata la variabilità dell’errore aumenta.



LEZIONE DEL 03/03/08

Da ora in poi ci interesseremo solamente dell’errore non campionario.

L’errore non campionario, a lungo trascurato, si è visto che è un errore importante, e molto significativo per la qualità dei dati statistici. (in alcuni casi molto difficile da correggere). In linea di massima l’errore campionario dipende dalla grandezza del campione( più il campio‐ne è grande più l’errore campionario è piccolo perché diminuisce la variabilità campionaria e le stime sono più precise).

Quando si fa un’indagine statistica bisogna arrivare ad un equilibrio tra la precisione dell’informazione( delle stime) e i costi. Più aumenta la numerosità campionaria più aumen‐tano i costi (ma più è precisa l’informazione). Questa preoccupazione è sempre stata pre‐sente in chi organizzava le indagini statistiche. Di fatto, in questi anni si è introdotta una ri‐flessone che dice che è molto più interessante controllare l’errore non campionario che quello campionario. Cioè se pensiamo che l’errore statistico è formato da tali errori, in que‐sti ultimi anni si è visto che è prevalente la componente dell’errore non campionario e quin‐di ci si è interessati molto di più a . tentare di correggere i non campionari.

Errore non campionario: sono gli errori che influenzano la qualità dei dati statistici e la cui origine è molteplice. Ogni passaggio dell’indagine statistica cela la possibilità che vengano compiuti degli errori non campionari( cioè tutti i fattori che producono delle conseguenze di errore sulla rilevazione dei dati. Esso fa sì che il dato raccolto ha un’errore. C’è differenza tra dato raccolto e dato vero ).

Tale errore può nascere dalla progettazione, dall’atteggiamento dell’intervistatore o dell’intervistato, nel momento della codifica ecc.. cioè sono tutti gli errori che si annidano in ogni passaggio dell’indagine.

A differenza dell’errore campionario che diminuisce all’aumentare del campione, l’errore non campionario può aumentare all’aumento della numerosità del campione, poiché le pro‐cedure si fanno più complesse possono aumentare gli errori non campionari. Una delle ca‐ratteristiche dell’errore statistico non campionario è che aumenta all’aumentare della nu‐merosità.

Abbiamo già visto che l’errore non campionario può provocare degli errori di distorsione e degli errori di variabilità.

Se prendiamo un campione ed in esso il 25% delle persone non rispondono, ciò aumenta la variabilità delle stime. Se poi questo 25% ha anche delle caratteristiche particolari, introdu‐ciamo delle distorsioni oltre alla variabilità(es.: tale 25% è tutto analfabeta ed è impossibili‐tato a rispondere a indagini postali sul reddito).



FASI DELL’INDAGINE(ISTAT):

1. Definizione dell’oggetto dell’indagine a. Quando prepariamo un’indagine, il ricercatore o istituto di ricerca vuole co‐

noscere le intenzioni di voto( esempio). Bisogna definire la popolazione degli interessati( es maggiorenni per votare), il campo di rilevazione ecc.. fase in cui si prepara quello che si vuole conoscere

2. Studio delle condizioni in cui si svolge l’indagine a. dopo la fase 1 devo capire in che condizioni si svolge l’indagine. Ci sono 2 fat‐

tori importante. Il primo è la qualità organizzativa di chi svolge l’indagine( ov‐vero vedere quali sono gli strumenti, qualità del personale ecc.. che devo uti‐lizzare per fare l’indagine). Il secondo fattore sono le liste da cui estrarre il campione( strumento essenziale).

3. Scelta, progettazione e preparazione di un sistema per la rilevazione delle informa‐zioni statistiche

a. Intendiamo il lavoro di preparazione del questionario e decidere il tipo di in‐tervista da utilizzare( diretta, telefonica, postale mmh….ecc..). questi sono i due momenti più importanti( questionario e modalità di rilevazione) e sono collegati.

4. Rilevazione delle informazioni statistiche a. L’intervistatore somministra il questionario secondo le scelte fatte della mo‐

dalità di intervista. 5. Codifica e registrazione

a. Codifica: le informazioni prese dall’intevistarore devono essere codificate perpoter essere “lette” dall’elaboratore. Registrazione: i dati vengono impu‐tati in un foglio elettronico( es. in excel). Fase delicata. Se utilizziamo il que‐stionario elettronico la codifica e registrazione sono già inserita nel questio‐nario stesso.

6. Revisione a. Fase importante per la qualità dati. Dopo aver raccolto le informazioni biso‐

gna fare controlli per vedere se le procedure sono state seguite bene, la codi‐fica è stata eseguita correttamente ecc.. Nel caso di errore si procede alla correzione. Verifico dunque la qualità delle informazioni e procedo alla corre‐zione delle stesse.

7. Elaborazione dei dati a. Es. su tabelle

8. Fase dell’amarezza



In ognuna di queste fasi si possono trovare degli errori. Tali fasi servono per capire in quali momenti accadono gli errori.

Domanda: gli errori non campionari, oltre poter portare distorsioni o aumento di variabilità delle stime, possono essere classificati? Esistono degli errori tipici? Si esistono. Le classifica‐zioni proposte sono molteplici. Il maffenini propone la più interessante che individua 3 tipi di errore non campionario e cioè:

1) ERRORI DI LISTA

2) ERRORI DI NON RISPOSTA

3) ERRORI DI MISURA

ERRORI DI LISTA

Grande parentesi cos’è una lista?

La lista è l’elenco ordinato( successione significativa delle informazioni) delle etichet‐te(intesa come modo di identificare l’unità, non quella sulla fronte del maffe) che contrasse‐gnano tutte le unità di una popolazione. Esempio: lista telefonica, iscritta alla unimib ecc.. dipende dalla popolazione. Es. lista degli aventi diritto al voto.

La lista nasce per scopi amministrativi( in genere), cioè avendo una popolazione( in senso generico) c’è il bisogno che la popolazione, formata da unità , sia identificata( per esempio quindi per motivi amministrativi).

Le etichette che devono identificare tutte le unità della popolazione contengono le informa‐zioni necessarie alla identificazione ed alla individuazione(oltre che al reperimento) delle u‐nità stesse. Se vogliamo individuare solo una persone è sufficiente dare ad ogni unità un numero. Es: se è una lista anagrafica le etichette conterranno nome, cognome, data di na‐scita ed indirizzo.

Le informazioni contenuta nell’etichetta dipendono dalla lista.

Quando possiamo dire che una lista sia buona( dal punto di vista della qualità, cioè che la qualità risponde alle esigenze per le quali la lista è fatta. NB: La qualità dipende dagli usi che si fanno della lista)?

La lista deve essere completa: cioè contiene tutti i nominativi delle unità della popo‐lazione a cui sono interessato;



Deve essere aggiornata: cioè deve avere le informazioni che siano il più vicino possi‐bile alla data in cui utilizzo la lista per determinati scopi amministrativi o anche stati‐stici;

Deve essere informativa: ciascun individuo deve essere distinguibile da un altro ed individuabile.

Dal punto di vista statistico ho bisogno delle liste per fare censimenti ed indagini statistiche.

Nel secondo caso ho bisogno di una lista da cui estrarre il campione. Se posso ricostruisco la lista partendo dalla popolazione obiettivo( cioè quella interessata ad un’indagine) contenen‐te tutte le unità presenti in tale popolazione. Spesso è un’operazione impraticabile però, es‐sendo troppo costosa ed inutile (esistendo già surrogati delle liste di cui necessito). Ci pos‐sono essere casi particolare in cui faccio liste ma non sono interessanti dal nostro punto di vista(o pdv come dice silvia).

Quindi devo vedere se esistono già liste che corrispondano alle mie esigenze. Esistono. Le liste più comuni di questo tipo sono:

Liste anagrafiche Problema: i privati non possono utilizzarle. Ancor prima del concetto di privacy, il privato non poteva usarle. Solo l’ISTAT o altri enti dello stato pos‐sono utilizzarli.

Bollettini telefonici Utilizzate soprattutto negli anni novanta(tutti avevano il telefono. Da un po’ di anni anche queste liste sono in crisi, essendo complesse da usare a causa dei cellulari e per la possibilità di non far comparire il proprio nome nel bol‐lettino telefonico).

Liste elettorali I privati possono usarle. Perché queste si e le prime no? Dal pdv legislativo la lista anagrafica è del comune, utilizzate per propri scopi amministrativi. Men‐tre le liste elettorali per definizione sono affisse all’albo affinché tutti possano verificare di essere nelle liste elettorali e se ci sono persone senza diritto i‐scritte. Sono per definizioni PUBBLICHE(come le liste dei redditi delle azien‐de). I comuni, dietro corrispettivo, possono fornire tali liste. Il problema lega‐to a tale fattispecie è che include solo i maggiorenni( oltre le minoranze di co‐loro che non possono usufruire della propria capacità giuridica per motivi pe‐nali). Le liste elettorali vengono usate per estrarre delle famiglie.

Nb: stiamo parlando della popolazione italiana in generale. Ovviamente se dovrò fare inda‐gini sui medici avrò altre liste.



Quando una lista è usata per estrarre un campione viene chiamata base di campionamento( o campionaria). Quali caratteristiche deve avere la lista nel momento in cui diventa una base campionaria?E’ adatta alla mia popolazione obiettivo? (popolazione obiettivo: popolazione rispetto alla quale voglio svolgere un’indagine).

La lista è completa rispetto alla popolazione obiettivo? La lista deve contenere tutte le unità della popolazione obiettivo. Questo dipende da che tipo di lista sto uti‐lizzando. La lista deve essere completa rispetto alla data nella quale faccio l’indagine( deve essere aggiornata). Evidentemente la lista deve contenere anche tutte le in‐formazioni che servono per fare l’indagine.

Più informazioni ci sono e meglio è perché se ho molte informazioni su altre caratteristiche, queste sono utili nel caso in cui debba sostituire la persona( non rispondente) o comunque possono essere utili per fare lavori di correzione dei dati. Più informazioni ho e più esse mi aiutano ad avere una buona qualità dei dati e poi servono anche per la correzione.

Evidentemente poiché una lista deve essere completa ed aggiornata, in realtà prendo la lista che trovo.( differenza tra il pratico ed il teorico) . es: le liste anagrafiche sono aggiornate o‐gni 10 anni( dog) ed i movimenti migratori non sono aggiornate. Le liste elettorali sono ag‐giornate ogni 6 mesi, ma non rappresentano tutta la popolazione. Le liste telefoniche non sono liste della popolazione ma di individui( non si conosce l’età ecc..). poiché non posso fa‐re liste ad hoc per un’indagine, devo utilizzare delle liste succedanee( anagrafe, istat, liste elettorali, telefoniche ecc..). esse però, essendo state pensate per funzioni amministrati‐vo/burocratiche non hanno le caratteristiche da me volute. Da qui nascono gli errori di lista.

Fine grande parentesi.

Errore di lista: tutti gli errori che dipendono dall’imperfezione della lista inclusi gli errori col‐legati all’individuazione e reperibilità dell’unità statistica che voglio utilizzare.

ERRORI DI NON RISPOSTA

Tutti gli errori che scaturiscono dal fatto che un’unità statistica non risponde per nul‐la ad un’indagine oppure dalle non risposte parziali. Errori causati sulla qualità del dato prodotte dalla non risposta totale o parziale.

ERRRORI DI MISURA

In questo contesto intendiamo tutti gli altri errori, ciop tutti gli altri tipi di errori che avvengono durante un’indagine campionari che non siano errori di lista e/o di non ri‐sposta.

È una categoria strettamente residuale? No perché hanno una caratteristica partico‐lare: danno un’informazione non corretta rispetto al valore vero. Mentre gli altri er‐



rori influiscono sulla qualità di un dato in modo indiretto, l’errore di misura lof a in modo diretto.

Quindi è una tipologia residuale con caratteristica particolare.

CAUSE DEGLI ERRORI NON CAMPIONARI nelle varie fasi

FASE 1: DEFINIZIONE OGGETTO

CAUSE ERRORI relativi alla qualità dell’indagine:

Non chiara definizione della popolazione di riferimento Fraintendimento dell’obiettivo dell’indagine

Se durante tale fase non si hanno le idee chiare, possono venire a crearsi errori sulla qualità delle informazioni. Se non si definisce la popolazione oggetto dell’indagine in modo chiaro, le informazioni che raccoglieremo non saranno adeguate rispetto a ciò che vogliamo ottenere. In alcuni casi il ricercatore può anche fraintendere l’obiettivo dell’indagine. Ad esempio le elezioni politiche, l’intenzione di voto in questo momen‐to. Aver chiaro l’oggetto e la popolazione di un’indagine è il primo requisito fonda‐mentale affinché la qualità dell’indagine sia conforma a quanto ci si aspetta. ( silvia ha sonno!!).

In questa situazione si possono anche fare errori che si possono ripercuotere anche su altre analisi future. Quando definisco la popolazione obiettivo devo avere già chia‐ro quali strumenti utilizzare.

Quindi la fase 1 è importante perché è determinante per quanto riguarda la qualità dell’indagine

FASE 2

Problema della lista: quali sono i possibili errori che sono causati da una lista?

1)La situazione perfetta è quella in cui esiste corrispondenza perfetta tra i nominativi della lista e le unità della popolazione obiettivo. In questo caso la lista è perfetta, non presenta alcun tipo di errore e non è sorgente di errori.

2) LISTA INCOMPLETA Mancano alcune unità della popolazione obiettivo. Si parla di unità includibili‐ mancanti. L’incompletezza può dipendere da imperfezioni della lista( es. nel caso di lista anagrafica spesso succede che le famiglie che si trasferiscano tra 2 comuni non ven‐gano cancellati; es. lista elettorale è incompleta se usata come lista per estrarre la popola‐



zione obiettivo generale perché mancano i minorenni e quindi è incompleta x l’uso che ne faccio). Quindi non necessariamente l’incompletezza riguarda le funzioni della lista, ma l’utilizzo che se ne fa. In questo caso si parla di errore di copertura, dove la lista non copre la popolazione obiettivo.

3) Sovra copertura di lista, che è più grande della popolazione obiettivo in quanto nella lista sono presenti nominativi inesistenti o estranei rispetto alla popolazione obiettivo.

‐ NOMINATIVI INESISTENTI: nella lista ci sono della unità che non appartengono più alla popolazione obiettivo.

‐ NOMINATIVI ESTRANEI: sono presenti nella lista dei nominativi che non inte‐ressano( quindi non c’è stato errore di aggiornamento ecc..)

Ci sono altri 2 tipi di problemi particolari.

4) più nominativi della lista corrispondono ad una sola unità della popolazione obiettivo. ( questo è un caso particolare di sovra copertura della lista).

5) lista con grappoli di unità nel caso di elenchi telefonici una volta ad un numero telefo‐nico corrispondevano più nominativi. Ad un nome della lista corrispondono più unitùà della popolazione obiettivo. Esiste poi una lista particolare con grappoli di unità che sono le liste dei comuni.

Questi sono gli errori classici della lista per quanto riguarda la sua completezza, cioè il rap‐porto tra unità della popolazione obiettivo e unità della lista stessa.

Esistono però anche errori collegati sia alla individuazione che reperibilità delle unità da in‐dagare. In questo caso la lista può causare altri tipi di errori. Ad esempio: le informazioni che la lista da non sono sufficienti per reperire un individuo sul territorio. Oppure sono informa‐zioni sbagliate. Comunque informazioni che non permettono di individuare o reperire unità sul territorio.

FASE 3

In questo contesto sono due i momenti importanti: costruzione del questionario e la scelta del tipo di intervista.

Questionario: è una delle fonti più importanti di errore non campionario. I problemi posso‐no essere relativi:

Alle domande che vengono fatte per la raccolta delle informazioni che voglio ave‐re(informazioni vere e proprie del soggetto che sto indagando);



Ai codici identificativi; Alle domande per il controllo della qualità dell’intervista.

Il primo problema che si può avere è quello della capacità di comunicare all’intervistato quello che voglio sapere. Se non lo so fare raccolgo informazioni inutili.

Altri errori sono dovuti alla memoria: cioè di ricordare male o non ricordare. Dal pdv delle soluzioni si può intervenire con alcuni metodi( vedremo infra). Gli errori possono derivare dal fatto di dimenticare o da collocare errata nel tempo.

Errori dovuti alle domande proxy: domande che pongo a un familiare della persona da inter‐vistare ma non presente in quel momento. Soprattutto nelle indagini familiari, quando una persona non è presente per 2 o 3 volte allora o si esclude la famiglia( maggior parte dei casi) oppure si interrogano padre o madre. Queste risposte possono ovviamente causare grossi errori. Ci sono domande delicate o imbarazzanti( a seconda della cultura del paese) in gene‐re riguardo a situazioni personali, ai redditi, salute, convinzioni politico/religiose c.d. dati sensibili . tali dati possono causare errori di non risposta o risposta falsa.

Ci sono altre situazioni che possono generare errori: come le domande aperte.

Abbiamo dunque visto errori relativi a domande fatte sulle persone che voglio indagare.

Nel caso dei codici identificativi in tali codici è indicato l’intervistatore, intervistato ecc.. in alcuni casi errori su tali codici possono causare gravi problemi.

Variabili controllo dell’intervista le informazioni sull’intervista riguardano l’ora di inizio e di fine dell’intervista, se l’intervistato è stato intervistato al primo contatto o meno, quando sono stati gli altri contatti in caso negativo, se l’intervistato è un sostituto di un ‘intervistato che non aveva risposto. Cioè bisogna inserire le informazioni di controllo.che possono esse‐re utili e che indicano come è andata l’intervista e per controllare la qualità dei dati.

Quando si fa un’indagine si decide ad un certo punto se farla diretta, telefonica o postale. Anche in questi casi sappiamo che i vari tipi di tecniche hanno determinate conseguenze( es. postale numero di non rispondenti è elevatissimo. Es. intervista diretta sui temi delicati ha come conseguenza un altissimo numero di non risposte. Nb anche le domande delicate non sono tutte uguali ma dipende). La scelta del metodo ha conseguenze sulla qualità.

Molti errori sono inevitabili. Se uso l’indagine postale perché ho pochi soldi so che avrò mol‐ti non ritorni e devo cercare dei modi per correggere tali errori.



FASE 4

In questa fase emergono i problemi legati alla scelta dei metodi. All’interno di tale fase il problema più grave è quello delle mancate risposte.

Si è visto che le indagini statistiche in modo diffuso sono cominciate negli anni cinquanta. La prima indagine campionaria è del 1939. Perciò è molto recente l’utilizzo e l’esplosione è par‐tita dagli Usa negli anni ’50. Il primo istituto italiano è degli anni ‘50 la DOXA,che è l’unico rimasta italiana. Le indagini, partite da questo periodo, si diffusero a macchia d’olio.

Il problema che accompagnò tale diffusione sono state le mancate risposte. “problema che angustia abbastanza i ricercatori”.

Cause delle non risposte:

urbanizzazione ovvero il passaggio della popolazione dalla campagna alla città. Chi abita in città è più asociale e scettico rispetto ai campagnoli( vd Rogeno). come con‐seguenza si ha avuto la non risposta o una minore risposta. Dal 5% di non risposte al 25‐30% di non risposte negli Usa dagli anni ‘50

poiché le indagini sono talmente invadenti le persone tendono a non rispondere per difendersi anche se poi i dati sono anonimi.

In Italia la situazione è particolare per 2 motivi:

1‐ quando si fa un’indagine ISTAT siamo obbligati a rispondere per legge. Que‐sto ha portato ad un’atteggiamento di dire “vabbè bisogna rispondere alle indagini e allora rispondiamo anche alla doxa e all’istat”. Quindi si risponde ma si dicono cose non vere.

LEZIONE 10/03/08

Il problema delle mancate risposte è uno dei problemi + gravi che si possono trovare nell’indagine statistica sia campionaria che non campionaria.

Soprattutto le mancate risposte totali dipendono da vari motivi alcuni chiari altri no comun‐que le non risposte sono in forte aumento negli ultimi anni. Questo fenomeno tocca in mo‐do meno evidente l’Italia perché le indagini istat sono obbligatorie anche se poi si risponde il falso provocando problemi + gravi meglio una non risposta che una risposta sbagliata perché è molto difficile correggerle.

La non risposta dipende anche dal tipo di tecnica utilizzata per fare l’indagine.



LE CLASSICHE TECNICHE DI RILEVAZIONE O DI SOMMINISTRAZIONE SONO 3:

intervista diretta è quella che causa meno non risposte Intervista telefonica si risponde di meno Intervista postale + alti tassi di non risposta per vari motivi (anche solo 10% risp) esistono tecniche di richiamo ma nei casi migliori si arriva al 50 % delle risposte dopo lettere e richiami ecc però è spesso utilizzata perché è poco costosa e non servono strumenti specifici.

Via internet Indagini delicate strettamente personali, politica, reddito ecc per le quali è meglio non fare la diretta ma la postale

NON RISPOSTE :

Totali il questionario non è stato compilato in alcuna parte Parziali all’interno del questionario ci sono parti a cui non è stata data risposta

NON RISPOSTE TOTALI: Unità di rilevazione per le quali è stato impossibile raccogliere le in‐formazioni.

Situazioni che le provocano:

1. Non includibilità dell’unità: alcune unità non sono includibili nel campione perché non fanno parte della popolazione obiettivo e quindi non possono essere intervistate se estratte (sovra copertura di lista coincidenza imperfetta, ho + unità che non mi interessano). E’ un po’ particolare perché è decisa dall’intervistatore comunque vie‐ne considerata come non risposta.‐‐> normalmente si riesce a risolvere prima il pro‐blema e ripulire la lista. Es. Se ho la lista dei residenti in provincia di Milano e voglio solo i maggiorenni, eli‐mino tutti i minorenni.

2. Non contatto delle unità della popolazione obiettivo: non contatto in senso molto generale si applica a tutte le situazioni in cui è impossibile l’individuazione e la re‐peribilità sul campo delle unità da intervistare. Ho estratto l’unità ma le info che ho non mi permettono di individuarla oppure a reperirla. Questo dipende da: ‐ informazioni non accurate o errate (errore di lista) ‐ unità includibili mancanti fanno parte della pop obiettivo ma non sono nella lista e quindi non ho nessuna info su di loro e non potrò intervistarle.



Si parla di non contatto anche quando sono state individuate e reperite ma non è stato possibile incontrarle. Es. tizio non è a casa vacanza, orario sbagliato…

3. Rifiuto di partecipare all’intervista (non risposta classica) : persona individuata, re‐perita, contattata ma decide di non partecipare all’intervista. Il rifiuto può dipendere da:

INCAPACITÀ DELL’INTERVISTATORE è interessante distinguere i casi in cui con un intervi‐statore + persuasivo il rifiuto sarebbe rientrato.

TIPO DI INDAGINE l’effetto non cambia però serve per decidere strategie per risolvere problema. Ad esempio si cambiano le domande, si cambia la tecnica… Dal punto di vista teorico dell’analisi delle dinamiche si può distinguere tra:

RIFIUTI PERMANENTI: non si riesce a convincere la persona in nessun modo. RIFIUTI TEMPORANEI: es. se uno viene contattato 3 volte e risponde solo l’ultima volta

4. Incapacità di partecipare all l’intervista: es. malattia, analfabeti se faccio indagine postale non possono risp. Non conoscenza lingua scritta (immigrati). Alcune incapaci‐tà si possono risolvere (es. lingua) altre non sempre, dipende ad esempio dai tempi di somministrazione questionario ecc.

MANCATE RISPOSTE PARZIALI:

1. In senso stretto: la persona partecipa all’indagine ma quando si analizza il questiona‐rio ci sono delle domande a cui non ha risposto per vari motivi.

2. Valori non ammissibili: c’è un evidente errore nella risposta per cui non è possibile accettare la risposta es. data di nascita 1830, altezza 3 mt. Incongruenze logiche: contraddizione tra le risposte. Es nella risposta ad una do‐manda dice che fuma e ad un’altra no. Valori non ammissibili possono essere dovuti ad inconguenze logiche.

Incongruenze logiche formali a volte si inseriscono nel questionario do‐mande filtro cioè ad un certo punto si entra o no in una parte del questiona‐rio, può succedere che uno che non doveva rispondere perché ad esempio ha risposto no alla domanda filtro è entrato lo stesso in quella parte del que‐stionario. Bisogna vedere se l’errore era nella risposta alla domanda filtro oppure se effettivamente non doveva rispondere e non devo considerarle.

La differenza tra mancata risposta totale e parziale può non essere cosi evidente. Es. se clas‐sifico un questionario come mancata risposta parziale ma le mancate risposte sono molte



oppure mancano proprio quelle + importanti x l’intervista allora si può decidere di eliminarle tutte e considerarlo come una non risposta totale.

ERRORI DI MISURA O ERRORI DI RISPOSTA

Sia gli errori di misura,di non risposta che quelli di lista si verificano nel momento dell’intervista ( siamo sempre nella 4 fase).

Ogni momento dell’indagine ha la possibilità di creare errori di misura però a lato pratico emergono in modo particolare in determinati momenti.

Def L’errore di misura o di risposta è connesso ad imperfezione degli strumenti di rileva‐zione o all’imprecisione delle informazioni possedute dagli intervistati o ad errori di rispo‐sta in senso stretto.

Dipendono da:

1. Questionario utilizzato (strumento di rilevazione) 2. Tipo di indagine scelta ( se diretta, telefonica, postale o via internet – ognuna può

provocare un certo errore) 3. Rispondente imprecisione dell’informazione posseduta + errore di risposta (rsp er‐

rata) 4. Intervistatori e Supervisori rientrano nella categoria dello strumento di rilevazione e

del suo utilizzo

La conseguenza di queste fonti di errore è che l’informazione che ottengo differisce dal valo‐re vero, anche se le cause sono diverse tra loro.

Gli errori in realtà si catalizzano nel momento dell’intervista.

ERRORI DOVUTI AL RISPONDENTE:

1. Non comprensione della domanda perché il soggetto è incapace a compren‐derla oppure perché la domanda è posta male

2. Scarsa motivazione a rispondere (fretta) poca motivazione o trascuratezza nel‐la risposta scritta (sottocategoria)

3. Insufficiente capacità ad elaborare e comunicare la risposta (cambia a seconda del tipo di indagine, è consigliabile fare risposte chiuse multiple choice rispetto a domande aperte in cui bisogna scrivere liberamente)



4. Mancanza di informazioni del rispondente (può essere mancanza di informa‐zioni generali, ho sbagliato l’unità oppure manca una domanda filtro, es. faccio una domanda su Sanremo e ad un certo punto capisco che il soggetto non l’ha vi‐sto ).

5. Comunicazione della risposta è condizionata dall’immagine che si vuole dare di sé il questionario non sempre viene visto bene

6. Presenza di persone terze es. intervista a diciottenne deve essere fatta senza genitori

7. Difficoltà di ricordare

Molte di queste situazioni potrebbero portare ad errori di non risposta tout cours che è la situazione migliore perché è possibile correggerlo. Soprattutto non conoscenza e non ricor‐do dovrebbero portare a non risposta. Molte volte invece si risponde comunque e questo è problematico per l’indagine. L’intervistatore deve chiarire che si preferisce la non risposta alla risposta falsa.

Un altro caso di non risposta detto anche NON ACCURATEZZA INVOLONTARIA è proprio il fatto che il soggetto non conosce la risposta. Es. acquisto di un prodotto in una famiglia, in‐tervisto il figlio e lui non sa qual è il motivo per cui è stato acquistato bisogna capire se il soggetto conosce o meno l’argomento, in alcuni casi il margine è basso, bisogna fare in mo‐do che diventi una non risposta e non un errore.

ERRORI CHE DIPENDONO IN MODO + EVIDENTE DALL’INTERVISTATORE 1. Domande lette in modo diverso da come sono state scritte può avere

grosse conseguenze sul tipo di risposta. 2. Cambiamento ordine delle domande 3. Errori di trascrizione delle risposte 4. Incapacità a reagire a situazioni impreviste

FASE 5

Durante la fase di codifica e registrazione possono esserci diversi tipi di errori come errori di trascrizione errori derivanti dalla difficoltà della codifica errori di registrazione veri e propri



PREVENZIONE E CONTROLLO ERRORE

Errori di lista:

a. UNITÀ INCLUDIBILI MANCANTI producono l’errore di copertura cioè si han‐no delle liste incomplete rispetto alla pop. obiettivo, che non è coper‐ta totalmente dalla lista. Non è facile individuare le unità includibili mancanti, quindi possiamo sapere che una lista è incompleta però non so cosa manca, quindi ho delle difficoltà a prevenire l’errore, pro‐prio perché non ho la lista completa.d’accordo???? Es. lista telefonica quando non tutti avevano il telefono io sapevo che il 20 % non aveva il telefono ma non sapevo chi erano questi soggetti.

La difficoltà di correggere e prevenire questi errori è molto elevata, a volte è IMPOS‐SIBILE.

ERRORE DI COPERTURA:

Popolazione obiettivo di numerosità N vogliamo stimare per il carattere Y il valore medio di questa popolazione. Per farlo bisogna estrapolare un campione e da questo calcolare il valo‐re medio. Ho bisogno quindi di utilizzare una lista che però non è aggiornata e quindi causa errori di copertura. Ora vediamo un modello matematico che serve per descrivere questo errore di copertura. La pop N si divide in 2 sottopopolazioni o strati, uno lo chiamo Np e rappresenta la pop o‐biettivo presente nella lista che ho e le chiamo unità presenti nella lista. Lo strato Nm indica le unità mancanti, cioè unità della pop obiettivo che mancano dalla lista. Lo strato Np ha un valore medio Yp medio che rappresenta la media delle risposte alle do‐mande, indipendentemente da cosa viene chiesto. Ym medio è il valore medio delle unità mancanti. Indico Wp il rapporto tra Np e N cioè la percentuale della popolazione presente nella lista. Indico Wm la percentuale della popolazione mancante dalla lista. Wp+Wm=100 sono complementari tra loro, perché Np+Nm=N Wm = tasso di mancata copertura della lista. A questo punto posso scrivere y medio come la media ponderata delle 2 medie. Ymedio= (Wp x Ypmedio) + ( Wm x Ym medio)



A questo punto posso definire l’errore di copertura ovvero la differenza tra Ypmedio e Yme‐dio, per ora ammettiamo che esista. La differenza tra i due valori è causata dalla copertura. L’errore di copertura è misurato da : Ypmedio – Ymedio= Wm( Yp medio – Ym medio) Che cosa vuol dire tutto questo???? Se abbiamo 2 popolazioni (presente e mancante) che sono differenti tra di loro succederà che Ymedio sarà diverso da Yp la differenza esiste se le 2 pop sono diverse Esempio: liste telefoniche con 20 % di non copertura la pop obiettivo è 80% presente nel‐la lista, 20% mancante. Le 2 popolazioni differiscono per 2 elementi: età e reddito. Quindi il reddito medio di tutta la pop obiettivo è differente dal reddito medio della popola‐zione presente nella lista esiste un errore di copertura. Esiste errore di copertura se W è diverso da zero (cioè se la lista non copre) oppure se man‐canti e presenti sono uguali .

Quando c’è una mancata copertura bisogna capire se i mancanti hanno le stesse caratteri‐stiche dei presenti o no. Si può sapere da informazioni che avevamo in precedenza o da ca‐ratteristiche della lista stessa (ad. Esempio se ho indicazioni sull’età ecc).

Popolazione selezionata o non casuale Yp diverso da Ymedio la pop mancante non è pre‐sente nella lista per un motivo preciso, quindi ha delle caratteristiche diverse da quella pre‐sente proprio a causa di questo motivo. Es. livello di reddito x i telefoni (chi non ha il telefo‐no è + povero).

Popolazione non selezionata o casuale Yp = Ymedio il fatto di non essere presente nella lista non dipende da un fattore specifico cioè è casuale. Tipo se estraggo a caso l’80% della pop. Anche il restante 20% sarà casuale, hanno le stesse caratteristiche e hanno lo stesso valore atteso cioè lo stesso Ymedio.

Il punto è capire se la popolazione mancante è casuale o no. Normalmente no. Es. telefono.

Per essere utilizzata per la stima la popolazione deve essere non selezionata anche con rife‐rimento allo specifico carattere che voglio osservare es. l’intenzione di voto.

Hp: decisioni di voto non dipende dal reddito : posso estrarre un campione dalla lista per stimare le intenzioni di voto anche se manca il 20 % della popolazione. Se invece quel 20% è influenzato dal livello di reddito non va bene.

Se la lista è selezionata il parametro che calcolo è sicuramente DISTORTO. Lo tengo,poi ve‐dremo se è correggibile. La distorsione dipende dal tasso di non risposta e dalla differenza tra Ym mancante e presente.



SECONDO TIPO DI ERRORE DI LISTA:

5. UNITÀ NON INCLUDIBILI INCLUSE che provocano errore di non risposta totale se non riesco a prevenirlo e correggerlo.

Succede con nominativi estranei o non esistenti Se la lista è informativa è possibile pulire la lista togliendo le unità che non corrispondono alla popolazione obiettivo. Es. se ho l’età posso prendere solo quelli che mi interessano ed escludere gli altri. Se non ho questa caratteristica me ne accorgo quando contatto la persona e quindi è possibile ridimensionare il campione successivamente, anche se questo provoca qualche problema. Succede che il campione diminuisce, quindi la stima del campione avrà una varianza più elevata, aumentando il campione si risolve il problema (tipo 1200 invece di 1000).

a. UNITA’ DUPLICATE: presenti + volte nella lista. Es. ditta che ha + di un telefono. Normalmente è possibile chiarificare la situazione e pulire la lista.

b. Caso particolare LISTA ELETTORALE UTILIZZATA PER ESTRAZIONE DI FAMIGLIE per l’indagine ma qui mancano tutti i minorenni quindi si prende tutta la famiglia dell’unità che estraggo però se ci sono + maggiorenni nella stessa famiglia l’unità famiglia è duplicata. Pulirla è difficile allora la famiglia viene estratta solo se si estrae il + giovane o il + vecchio (che è sempre1 quindi probabilità uguale).

Altro elemento molto importante per la prevenzione degli errori è il

CONTROLLO DI QUALITA’ DEL QUESTIONARIO non solo il questionario deve essere fatto seguendo procedure che tengono conto degli errori che possono intervenire, sono necessari anche dei controlli di qualità sul questionario, che possono essere di 4 tipi:

1. Giudizio degli esperti: quando viene fatto il questionario c’è una commissione di e‐sperti che lo verificano.

2. Pre‐test: prima di utilizzare il questionario lo si sottopone a un campione molto pic‐colo

3. Test di alternative: può far parte del pre‐test a metà persone si pone la domanda in un modo a metà nell’altro e con i risultati vedi quale causa meno errori

4. Indagine pilota: es. istat prima di lanciare censimento che è molto costoso e compli‐cato l’anno prima fa un censimento campionario per testare come va.



Panel Campioni probabilistici che vengono utilizzati per un periodo ripetuto perché hanno det. ca‐ratteristiche.

T2 T1

A B C Tot

A 25 B 30 C 45 Tot 30 20 50 100

Panel

T=1 e t=2

Vogliamo ad esempio in 2 periodi stimare se c’è stato l’aumento o la diminuzione del valore della vendita del prodotto.

Stimatore di Y1‐ y1‐

Stimatore di Y2 ‐ y2‐

Stimatore di (Y2 ‐ Y1‐) y2‐ y1‐

Varianza di (Y2 ‐ Y1‐) = Var(

CAMPIONI INDIPENDENTI

Vengono utilizzati quando di fatto non si ha la possibilità di mettere in piedi un panel oppure se non siamo interessati all’utilizzo del panel. E’ il tipico strumento utilizzato ad esempio per conoscere il consumo di un prodotto nell’anno. Utilizzato anche per monitoraggio audience di alcuni mass media, es. stampa o radio.

L’informazione raccolta tramite campioni indipendenti ha caratteristiche particolari nella misura in cui devo calcolare il valore medio.

Restiamo nell’esempio dei 2 periodi t1 e t2 in cui vogliamo conoscere il valore di y1medio e y2medio per poter conoscere uno stimatore MEDIA . Io so che y1medio ed y2medio sono stimatori corretti, quindi la media di questi 2 è uno stimatore corretto del valore medio rea‐le.

La varianza di (ym1+ym2)/2 = ¼ * (Var( Ym1) + Var (ym2))



Se noi calcoliamo la stessa stima utilizzando i dati di un panel la stia sarebbe la stessa ma la varianza sarebbe:

¼ * var (ym1)+var(ym2) + 2r(ym1‐ym2)*…………… (vedi ale)

Quindi lo stimatore fatto con il panel è meno efficiente perché ha una variabilità + elevata.

Abbiamo chiuso la parentesi sui panel.

Una fase molto importante per la prevenzione e lo studio degli errori non campionari è il

momento della REGISTRAZIONE.

Si tratta di un momento molto delicato dal punto di vista della qualità dei dati, anche se lo è sempre di meno in un contesto di tecnologie che utilizzano software attraverso i quali la compilazione del questionario, la codifica e la registrazione sono CONTEMPORANEE. Mentre nel cartaceo sono successive.

Esistono comunque alcune indagini che vengono ancora svolte per iscritto censimenti.

Come vengono fatti i controlli durante la fase di registrazione?? Si fanno dei campioni e per i campioni estratti si fanno dei controlli con i valori veri e se l’errore è superiore ad un certo livello il lavoro di registrazione viene fatto rifare.

Controlli sequenziali man mano che la registrazione avviene c’è la possibilità di fare un controllo

CORREZIONE DEGLI ERRORI NON CAMPIONARI

Nonostante tutti i controlli e i sistemi di prevenzione, succede che gli errori avvengano ed è quindi necessario trovare dei metodi per correggerli.

Iniziamo dalla correzione degli errori di lista.

Metodi x Lista incompleta (accenno):

‐ Metodo dell’intervallo semi‐aperto Ha una caratteristica particolare. E’ utilizzato per indagini campionarie areali cioè la lista non è di persone ma di aree territoriali all’interno delle quali si identificano gli alloggi (case, villette, appartamenti …). E’ utilizzato negli usa perché non hanno liste anagrafiche.



Consiste nell’identificare sul terreno gli alloggi che sono presenti sul terreno ma non nella lista ed aggiungerli nella lista quando è contiguo ad uno campionato in prece‐denza.

‐ Metodo della doppia base di campionamento E’ stato inventato quando le liste telefoniche erano ancora incomplete. La tecnica consiste nell’utilizzare sia lista telefonica sia lista anagrafica in modo com‐plementare tra di loro cosi da poter raggiungere le unità che sono presenti solo in una delle due.

‐ Metodo della post‐stratificazione A volte succede che un’unità estratta è un grappolo, cioè ne contiene altre. Proble‐ma di sovra rappresentazione. Allora posso intervistare tutte le unità del grappolo estratte, oppure seleziono a caso un elemento del grappolo e successivamente do un peso proporzionale alle dimensioni del grappolo. Nel secondo caso il campione non è più auto ponderante, perché ogni unità avrà un peso diverso, quindi quando vado a calcolare la media devo considerare anche i pesi.

Lista con nominativi inesistenti o estranei.

Se riesco a pulire la lista prima di estrarre il campione è meglio, però non sempre posso far‐lo. Ci sono varie modalità per ovviare al problema:

‐ Estraggo un campione sovradimensionato ne estraggo 1200 invece di 1000 per‐ché so che 200 non vanno bene

‐ Estraggo in un secondo tempo le unità mancanti

Lista con nominativi ripetuti lista elettorale x famiglie

‐ Ponderare le osservazioni per il reciproco della probabilità di inclusione. ESEMPIO: se Bi è il numero del nominativo della famiglia p è la probabilità di estrazione 1/p x Bi è il reciproco della probabilità di inclusione, cioè si ponderano le osservazioni con il reciproco della proba‐bilità i inclusione

‐ Correggere la probabilità di selezione se famiglia è presente 4 volte ad ognuno do ¼ mentre all’intera famiglia do 1. Di fatto, si raggiunge lo stesso risultato di quando si prende solo il membro + giovane.

MANCATE RISPOSTE TOTALI Provocano 2 problemi:

‐ La diminuzione della numerosità del campione aumenta la variabilità delle stime. ‐ Le mancate risposte introducono distorsioni nelle stime.

Metodi di correzione utilizzati durante l’indagine campionaria

‐ Sostituire le unità mancanti direttamente mentre si sta facendo l’indagine. Normalmente lo si fa tramite una lista di riserva. Di fatto, è il metodo utilizzato per formare un panel.



‐ Posso decidere che una parte o tutte le unità dei non rispondenti vengono intervistate utiliz‐zando un diverso metodo di indagine, ad esempio l’indagine telefonica postale invece che diretta. Si ricorre a questa doppia intervista quando si ritiene che le non risposte derivano dal metodo utilizzato.

‐ Metodo della domanda cruciale quando l’intervistatore si accorge che l’intervistato sta ri‐fiutando di partecipare all’intervista cerca di porgli almeno una domanda. Questa domanda può servire ad avere un’informazione diretta sull’argomento che voglio conoscere, oppure può servirmi per sapere che caratteristica ha rispetto al fenomeno che sto studiando. Dipen‐de dalle informazioni che conosco sul soggetto e dall’obiettivo dell’indagine.

DOMANDA CRUCIALE: HAI MAI COMPERATO LA MOZZARELLA BINGO BONGO? Metodi di correzione impiegati dopo l’indagine campionaria Cerchiamo di raddrizzare la sti‐ma, cioè di farla diventare non distorta. Noi sappiamo che il comportamento è collegato a certe caratteristiche socio demografiche. Ad esempio a parità di fattori le donne guadagna‐no meno degli uomini, i giovani fanno scelte diverse dagli anziani. Se divido la popolazione target in 4 classi secondo età e sesso giova‐ni/vecchi/maschi/femmine Se la variabilità è determinata totalmente dal sesso e dall’età io posso dire che rispondenti e non rispondenti hanno lo stesso comportamento. In altre parole andrò a suddividere in clas‐si omogenee al loro interno ed eterogenee tra di loro in modo da ipotizzare che l’omogeneità fa si che il comportamento sia lo stesso proprio perché c’è un solo fattore che lo determina. A questo punto prendo il campione dei rispondenti e divido il campione secondo delle classi (le stesse) e calcolo gli stimatori per classe.

‐ Tecnica della ponderazione ‐ Tecnica della post‐stratificazione

LEZIONE DEL 14/04/08

METODO DELLA PONDERAZIONE:

partendo dal caso di non rispondenti selezionati, si constata che lo stimatore è distorto. Esistono al‐cune variabili che determinano dei gruppi omogenei al loro interno ed eterogenei all’esterno. es:se pigliamo una popolazione in cui le caratteristiche sono sesso e età noi consideriamo che tutti i GIO‐VANI MASCHI si comportano allo stesso modo.

Adesso formalizziamo e CAPIAMO SE CI SIAMO CAPITI!

PONDERAZIONE

Si divide il campione in C classi di numerosità n1, n2, … nc classi prendo il campione e lo divido in c classi, e queste classi le identifico attraverso le variabili controllo.



I rispondenti sono n1r,n2r…ncr. Quindi avrò due tipi di informazione: la suddivisione del campione prima dell’indagine e la suddivisione dopo l’indagine. Il metodo della ponderazione parte dal fatto che le variabili controllo ce le ho prima della intervista. LA numerosità delle classi del campione e‐stratto e dopo ho la numerosità delle classi dei rispondenti.

Dato che il comportamento dei rispondenti e dei non rispondenti è il medesimo. (riascolta questo pezzo)

Per compensare le non risposte ad ogni valore campionario( unità) che chiamo yi si associa il peso ni/nir ovvero la numerosità totale rapportata alla numerosità dei rispondenti(IL PROF è IN CRISI!!!), OVVERO IL RECIPROCO DEL TASSO DI RISPOSTA di ciascuna classe. Associare il peso ad ogni valore equivale ad imputare a ciascun non rispondente il valore medio della classe attribuzione .

FORMULE: copia da pagine fatte a mano!!!NO sono riuscito a fare la foto!!!!!!!!!!!

Lo stimatore y verrà trasformato.

LA POST STRATIFICAZIONE(ha ribadito che ci darà la dispensa!!!)

Quando lo si applica?? Quando ho fatto l’indagine avrò informazioni, e queste si utilizzano per stra‐tificare a posteriori. Identifico i gruppi dopo. Il resto è analogo a prima. La post si usa quando non conosco le variabili controllo ma le posso dedurre dalle informazioni raccolte durante l’interrogazione.

Esistono anche altri metodi per risolvere i problemi legati alle non risposte ma citiamo solo i nomi: Regressione e Quoziente. Con questo abbiamo terminato l’argomento delle mancate risposte totali.

MANCATE RISPOSTE PARZIALI

Per mancate risposte si intende la mancata risposta solo ad alcune risposte del questionario. Se le parziali sono le risposte fondamentali equiparo la parziale alla totale e butto il questionario

Ci sono 3 strategie:

1) IMPUTAZIONE

Tutti questi metodi sono tutti metodi che utilizzano programmi (informatici) ad hoc ed è questo il motivo per il quale i comuni mortali non li usano.

IMPUTAZIONE ANALITICA: di fatto va a ricostruire partendo da info che ho rispetto all’unità (colui che ha risposto) ricostruire il valore vero (se in un punto non c’è la risposta ma se c’è un'altra rispo‐sta simile imputo questa risposta anche a quella mancante).



IMPUTAZIONE DETERMUNISTICA: se esistono dei legami tra 2 variabili, vado a verificare se esiste una risposta con altre variabili legate e le associo. (ha 74 anni allora alla domanda ha avuto figli negli ultimi mesi la risposta è sicuramente NO)

IMPUTAZIONE DA MODELLO: se tra A e B esiste una relazione di tipo statistico derivante da un algo‐ritmo qualsiasi anche matematico il programma sostituirà in b il valore che deriva dalla risposta di A( se dall’algoritmo deriva che se a=6 b=7 allora se B è mancante vado a vedere quanto è A e attribui‐sco il valore a B)

2) CRITERIO DEL DONATORE.

ANCHE QUI ABBIAMO 3 METODI

1. SOSTITUIRE AL DATO mancate il valore medio aritmetico uscito dall’indagine( se uno non mi ha detto quale è il suo reddito calcolo il reddito medio degli altri rispondenti e attribuisco al mancante quel valore)

2. Dividiamo le unità dei corrispondenti in classi utilizzando determinate caratteristiche (età, reddito ecc.posso prendere tutte le caratteristiche che voglio), poi vado a prendere quello che non ha risposto vedo in che gruppo appartiene e vado ad attribuire il valore medio del gruppo.

3. È un derivato del secondo metodo, sostituire il valore dell’unità più vicina all’unità mancan‐te. Identifico tutte le variabili e trovo il rispondente più simile al rispondente mancante e poi associo la stessa risposta del più vicino alla risposta mancante.(posso anche prendere i 2 più vicini e faccio la media)

3) CRITERI DI CASUALITA’ 1. Consiste nell’estrarre a caso un unità tra quelli che hanno risposto alla domanda per la

quale non ho risposta e associo l’unità estratta a caso!!! 2. Esiste poi un metodo più raffinato che estrae dei gruppi e poi estraggo a caso dal grup‐

po.



SECONDA PARTE I MEDIA E LA PUBBLICITA’

Cenni sulla pubblicità.

La pubblicità in un approccio micro economico rappresenta un’importante funzione per il mktg. Ser‐ve all’impresa per vendere quello che produce. Serve a vendere il prodotto facendolo conoscere e creano una propensione la consumo. In questa prospettiva vengono individuati i seguenti punti

1. Il ruolo da attribuire alla pubblicità rispetto agli altri elementi di mktg 2. Le interdipendenze con le iniziative pubblicitarie della concorrenza 3. La dimensione e la temporalità del budget 4. La misurazione degli effetti delle spese pubblicitari sulle vendite 5. I rapporti tra pubblicità e altri metodi di incentivazione vendite

Il prof ha scelto il 4!ci concentriamo soprattutto su questo.

Nel contesto del 4 faremo una veloce rassegna sull’incidenza e ruolo economico della pubblicità

RUOLO ECONOMICO DELLA PUBBLICITÀ

Si cominciò a studiare il titolo solo alla fine dell’800 e il primo a studiarlo fu Marshall. Le teorie si di‐vidono i 2 filoni in conflitto:

teoria potere di mercato vs teoria dell’informazione

Queste due teorie che si contrappongono in M. sono due dimensioni che si separano successivamen‐te. M. fa esplicito riferimento alle attività promozionali dato che ormai queste attività esistono dob‐biamo riconoscere che sono una parte nel costo totale della produzione di un bene. In questo conte‐sto dice: pur costituendo un costo aggiuntivo per l’impresa rispetto alla produzione fisica stretta, questo costo è nell’interesse stesso dell’impresa perché un modo che l’impresa usa per far cono‐scere il bene per far aumentare la domanda di quel bene. Questa è la prima teoria. Trenta’anni do‐po M. in poche pagine fornisce un quadro del ruolo della pubblicità. Dice: la pubblicità è utile per la capacità di illustrare l’esistenza e l’utilizzo di un prodotto. Permette al consumatore di individuare un prodotto che soddisfi i propri bisogni senza sprecare troppo tempo. Quando e nel momento in cui le imprese utilizzano la pubblicità con lo scopo di combattere la concorrenza e attraverso in‐cessante ripetizione di messaggi guadagnare quote di mercato e per fare questo investe forte capi‐tale si finisce per generare un inutile spreco di risorse che con una conseguenza diretta eleva i prezzi del prodotto e col rendere il mercato meno libero.

Negli anni 30 si riprende interesse per la pubblicità con: Robinson e Chamberlin

Essi studiano una teoria economica che spieghi la ragione per la quale nella maggior parte dei mer‐cati avevano delle caratteristiche intermedie tra la concorrenza perfetta e monopolio. Dato che loro erano convinti che in assenza di forze esterne dovevano andare verso una concorrenza perfetta o verso il monopolio vuol dire che se non vanno è perché sci sono delle perturbazione e una perturba‐zione è la pubblicità. La pubblicità è un elemento di disturbo perché è in grado di associare al pro‐dotto caratteristiche di unicità poco importa se vere o fittizie. In questo modo la tendenza è che cia‐



scun produttore diventi monopolista. Pubblicità vista come strumento per avere potere sul merca‐to. Rende i consumatori disposti a pagare di più pur di disporre del bene promosso. Altri due dico‐no(Ekelund e Saurman) che se la pubblicità aumenta la domanda si può o produrre di più o aumen‐tare i prezzi ma generalmente i produttori aumentano il prezzo. La pubblicità ostacola la concor‐renza creando delle barriere all’entrata.(Kaldor). La pubblicità serve a eliminare la concorrenza se fatta in modo massiccio, e inoltre impedisci o rendi molto difficile entrare perché avresti bisogno di investimenti pubblicitari talmente alti. Altri autori(Comanor e Wilson) dicono che aumentando l’investimento pubblicitario si ottiene un incremento delle vendite più che proporzionale delle vendi‐te, perché l’effetto di messaggi cumulativi ripetuti da vantaggio a chi utilizza la pubblicità, inoltre chi fa tanta pubblicità a capacità di contrattare pubblicità più di chi la fa poco. Questo fa si che chi vuole entrare è ancora più in difficoltà.

GALBRAITH: accusa la pubblicità di essere un oscura forza persuasiva che vuole e può modificare i desideri e i bisogno degli individui e può crearne di nuovi. Perché quello che punta l’impresa è ven‐dere e si creano quindi esigenze false e futili. I PERSUASORI OCCULTI 1958 PACKARD: il pubblicitario è un essere abile a modificare le coscienze e che ricorre ad attività persuasive.

1. La pubblicità favorisce l’instaurasi di comportamenti monopolistici attraverso la differenzia‐zione del prodotto creata dalla pubblicità, garantendo all’impresa un potere sul prezzo. I prezzi salgono

2. La pubblicità è persuasiva e manipolatrice ed induce i consumatori all’acquisto manipolando il consumatore

3. La pubblicità è uno spreco di risorse, perché ci sono ingneti investimenti in pubblicità che possono portare a situazioni di conflitti feroci.

TEORIA DELL’INFORMAZIONE

Gli effetti benefici della comunicazione pubblicitaria:

La pubblicità è utile e benefica perché: non solo è compatibile con la concorrenza ma anche è van‐taggiosa per il consumatore. Proprio per questo l’attività di diffusione delle informazioni è vitale per lo sviluppo economici e per lo sviluppo della società. HAYEK E KIRZNER partono criticando gli altri: è scorretto dire che la pubblicità crea i bisogni inesistenti, i bisogni necessari sono poco tutti gli altri sono indotti quindi non è colpa della pubblicità, quindi è la società che crea i bisogni e la pubblicità è uno strumento usato per aumentare la diffusione dei bisogni .

riassunto maffenini

Documents