definizione (fiaschi g.,1998): “complesso delle
TRANSCRIPT
DEFINIZIONE (FIASCHI G.,1998): “Complesso delle applicazioni di marketing condotte su
dati georeferenziati, ossia tutti quei dati che sono riconducibili a precise porzioni di
territorio e rappresentabili su mappa”
IMPLEMENTAZIONE:
PRIMA FASE: organizzazione dei dati interni aziendali.
SECONDA FASE: georeferenziazione degli elementi da mappare.
TERZA FASE: identificazione delle fonti informative esterne adeguate a
stimare il potenziale di mercato dei prodotti/servizi.
QUARTA FASE: visualizzazione, analisi dei dati interni e di potenziale
sui dati spaziali (cartografie elettroniche).
SETTORI ECONOMICI SUI
QUALI INTERVIENE IL
GEOMARKETING:
•BANCARIO–FINANZIARIO
•ASSICURATIVO
•IMMOBILIARE
•LOGISTICO
•TELECOMUNICAZIONI
•COMPARTO DISTRIBUTIVO
•PUBBLICITARIO
QUARTIERI POPOLAZIONE
RESIDENTE
ETA'
MEDIA
REDDITO
MEDIO
N°
COMPONENTI
MEDI FAMILIARI
DOMANDA
AUTO NoIMMATRICOLAZIONI
Quartiere 1 2015 39,10 16200,00 2,40 0 110,00
Quartiere 2 2067 45,37 18300,00 2,50 1 350,00
Quartiere 3 3359 41,24 15400,00 2,70 1 180,00
Quartiere 4 10227 36,48 15900,00 3,30 1 290,00
Quartiere 5 10010 31,98 14400,00 3,10 0 100,00
Quartiere 6 10202 38,64 14700,00 3,20 0 150,00
Quartiere 7 4953 39,11 15800,00 2,80 0 110,00
Quartiere 8 8439 35,00 15900,00 2,90 1 200,00
Quartiere 9 361 46,38 14800,00 2,00 0 80,00
Un Concessionario di automobili plurimarche (vendita nuovo ed usato) è interessato a studiare il
mercato nell’area della città di Campobasso ed in particolare il comportamento di alcune variabili
nelle diverse zone della città per comprendere dove dislocare eventuali nuove filiali.
TECNICHE STATISTICHE
UNIVARIATE
MULTIVARIATE BIVARIATE
CLUSTER ANALYSIS
OBIETTIVO: individuare una o più partizioni delle n unità statistiche in gruppi, in base ad un set di variabili osservate sulle n unità, tali che i gruppi abbiano le seguenti caratteristiche: coesione interna e separazione esterna.
METODI GERARCHICI METODI NON GERARCHICI
Aggregativi Scissori
Matrice delle distanze
,000 12,870 6,654 17,279 12,899 12,904 4,193 11,241 6,71612,870 ,000 9,277 15,297 33,185 26,958 19,626 14,198 20,6366,654 9,277 ,000 7,568 12,422 9,215 4,719 3,976 9,541
17,279 15,297 7,568 ,000 9,894 7,755 11,303 1,658 29,59712,899 33,185 12,422 9,894 ,000 2,491 4,573 7,010 22,49212,904 26,958 9,215 7,755 2,491 ,000 3,130 6,871 17,8404,193 19,626 4,719 11,303 4,573 3,130 ,000 7,142 7,553
11,241 14,198 3,976 1,658 7,010 6,871 7,142 ,000 21,3176,716 20,636 9,541 29,597 22,492 17,840 7,553 21,317 ,000
Caso1:Case 12:Case 23:Case 34:Case 45:Case 56:Case 67:Case 78:Case 89:Case 9
1:Case 1 2:Case 2 3:Case 3 4:Case 4 5:Case 5 6:Case 6 7:Case 7 8:Case 8 9:Case 9 Distanza euclidea quadratica
Questa è una matrice di dissimilarità
Programma di agglomerazione
4 8 1,658 0 0 65 6 2,491 0 0 61 7 4,193 0 0 41 3 6,654 3 0 51 9 9,541 4 0 74 5 9,894 1 2 81 2 20,636 5 0 81 4 33,185 7 6 0
Stadio12345678
Cluster 1 Cluster 2Cluster accorpati
Coefficienti Cluster 1 Cluster 2
Stadio di formazionedel cluster Stadio
successivo
Dendrogram using Complete Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø Case 5 5 òûòòòòòòòòòòò÷ ó Case 6 6 ò÷ ó Case 1 1 òòòòòûòø ó Case 7 7 òòòòò÷ ùòòòòòø ó Case 3 3 òòòòòòò÷ ùòòòòòòòòòòòòòòòòòø ó Case 9 9 òòòòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòò÷ Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
D e n d r o g r a m u s i n g A v e r a g e L i n k a g e ( B e t w e e n G r o u p s ) R e s c a l e d D i s t a n c e C l u s t e r C o m b i n e C A S E 0 5 1 0 1 5 2 0 2 5 L a b e l N u m + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + C a s e 4 4 ò û ò ò ò ò ò ò ò ò ò ø C a s e 8 8 ò ÷ ù ò ò ò ò ò ò ò ø C a s e 3 3 ò ò ò ò ò ò ò ò ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ø C a s e 5 5 ò ò ò û ò ò ò ø ó ó C a s e 6 6 ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ø C a s e 7 7 ò ò ò ò ò ò ò ÷ ó ó C a s e 1 1 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò û ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷ ó C a s e 9 9 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷ ó C a s e 2 2 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷
Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòø Case 3 3 òòòòòòòòòòòòòòò÷ ó Case 5 5 òòòòòûòòòø ùòòòòòòòòòòòø Case 6 6 òòòòò÷ ùòòòòòòòø ó ó Case 7 7 òòòòòòòòò÷ ùòòò÷ ùòòòòòòòòòòòòòòòø Case 1 1 òòòòòòòòòòòòòòòòò÷ ó ó Case 9 9 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
Dendrogram using Complete Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø Case 5 5 òûòòòòòòòòòòò÷ ó Case 6 6 ò÷ ó Case 1 1 òòòòòûòø ó Case 7 7 òòòòò÷ ùòòòòòø ó Case 3 3 òòòòòòò÷ ùòòòòòòòòòòòòòòòòòø ó Case 9 9 òòòòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòò÷ Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
Programma di agglomerazione
4 8 1,658 0 0 65 6 2,491 0 0 61 7 4,193 0 0 41 3 6,654 3 0 51 9 9,541 4 0 74 5 9,894 1 2 81 2 20,636 5 0 81 4 33,185 7 6 0
Stadio12345678
Cluster 1 Cluster 2Cluster accorpati
Coefficienti Cluster 1 Cluster 2
Stadio di formazionedel cluster Stadio
successivo
DETERMINAZIONE DEL NUMERO OTTIMO DI CLUSTER
P1 = {1} {2} {3} {4} {5} {6} {7} {8} {9}P2 = {1} {2} {3} {4,8} {5} {6} {7} {9}P3 = {1} {2} {3} {4,8} {5,6} {7} {9}P4 = {1,7} {2} {3} {4,8} {5,6} {9}P5 = {1,7,3} {2} {4,8} {5,6} { 9}P6 = {1,7,3, 9} {2}{4,8},{5,6} P7 = {1,7,3, 9} {2}{4,8,5,6} P8 = {1,7,3,9,2} {4,8,5,6}
Variabili Gruppo 1 Gruppo 2 Gruppo 3 Popolazione residente
nei vari quartieri -0,765805131 -0,91696732 0,99504696
Età media della popolazione 0,475917273 1,32154548 -0,806303644
N°medio componenti nucleo familiare -0,697216689 -0,63745526 0,856580503
Domanda auto nei quartieri -0,368932394 1,054092553 0,105409255
N°auto immatricolate in ciascun quartiere -0,589570348 1,901063573 0,114304455
Reddito medio della popolazione -0,068970073 2,023122155 -0,436810465
NUMEROSITA' 4 1 4
DEFINIZIONE:“E’ quella parte della statistica che tratta le osservazioni tenendo conto
esplicitamente della posizione in cui esse si manifestano nello spazio”(Zani e Napoletano, 1992)
STRUMENTI
CLUSTER ANALYSIS VINCOLATA
I DI MORAN
•CLUSTER ANALYSIS VINCOLATA
Con il termine classificazione vincolata si indicano i metodi per ottenere gruppi di unità che risultino non
soltanto simili tra loro, ma anche vicini. Il vincolo di contiguità viene realizzato affiancando alla matrice
delle distanze D, una matrice di contiguità, chiamata MATRICE DELLE ADIACENZE di elementi wij.
•I DI MORAN (N numero di unità, S somma dei pesi nella matrice di adiacenza)
•Globale •Locale
N
i
i
N
i
N
j
jiij
xx
xxxxw
S
NI
1
2
1 1
)(
))((
N
j
ijjii wxxxxI1
))((
1 2 3 4 5 6 7 8 9
1 0 1 1 0 0 0 1 0 0
2 1 0 1 1 1 0 1 1 0
3 1 1 0 0 0 0 1 0 0
4 0 1 0 0 1 0 0 1 0
5 0 1 0 1 0 1 0 1 0
6 0 0 0 0 1 0 1 1 0
7 1 1 1 0 0 1 0 1 0
8 0 1 0 1 1 1 1 0 0
9 0 0 0 0 0 0 0 0 0
Caso Distanza euclidea quadratica
1 2 3 4 5 6 7 8 9
1 ,000 15,549 5,495 16,626 11,595 9,723 1,573 9,407 5,133
2 15,549 ,000 10,813 16,239 36,684 27,038 17,897 15,422 22,975
3 5,495 10,813 ,000 7,666 12,780 8,740 4,722 3,893 9,637
4 16,626 16,239 7,666 ,000 10,695 7,251 10,895 2,166 29,989
5 11,595 36,684 12,780 10,695 ,000 2,492 5,964 7,265 22,580
6 9,723 27,038 8,740 7,251 2,492 ,000 3,738 6,298 17,655
7 1,573 17,897 4,722 10,895 5,964 3,738 ,000 6,162 8,296
8 9,407 15,422 3,893 2,166 7,265 6,298 6,162 ,000 20,946
9 5,133 22,975 9,637 29,989 22,580 17,655 8,296 20,946 ,000
:
1. partendo dalla matrice delle distanze, si individuano le 2 unità con la minore distanza e si uniscono per formare il 1° gruppo solo se risultano adiacenti; in caso contrario, si sceglie la distanza immediatamente più grande e si aggregano le unità corrispondenti;
2. si calcola, adottando il metodo del legame completo, la distanza del nuovo gruppo ottenuto dagli altri, ricavando una nuova matrice delle distanze con dimensioni diminuite di uno;
3. si individua nella nuova matrice la coppia di unità (o gruppi) con minore distanza e tra loro adiacenti, riunendole in un unico gruppo;
4. si ripetono le fasi 2 e 3 rispettando sempre il vincolo della distanza geografica.
In base a quanto appena detto, partendo dalla partizione banale in cui tutte le unità sono distinte, e tenendo conto deivari livelli di aggregazione, si ottengono le seguenti partizioni:
P1 = {1} {2} {3} {4} {5} {6} {7} {8} {9}P2 = {1} {2} {3} {4,8} {5} {6} {7} {9}P3 = {1} {2} {3} {4,8} {5,6} {7} {9}P4 = {1,7} {2} {3} {4,8} {5,6} {9}P5 = {1,7,3} {2} {4,8} {5,6} { 9}P6 = {1,7,3} {2} {4,8,5,6} {9}P7 = {1,7,3,4,8,5,6} {2} {9}P8 = {1,7,3,4,8,5,6,2} {9}
PARTIZIONE OTTIMALE P5
PROCEDIMENTO DI CLUSTER VINCOLATA
Q1 Q7 Q3 Q2 Q4 Q8 Q5 Q6 Q9
Q1 Q7 Q3 0,000
Q2 19,626 0,000
Q4 Q8 17,279 15,297 0,000
Q5 Q6 12,904 33,185 9.894 0,000
Q9 9,541 20,638 29,597 22,492 0,000
Q1 Q7 Q2 Q3 Q4 Q8 Q5 Q6 Q9
Q1 Q7 0,000
Q2 19,626 0,000
Q3 6,654 9,277 0,000
Q4 Q8 17,279 15.297 7,568 0,000
Q5 Q6 12,904 33,185 12,422 9.894 0,000
Q9 7,553 20,636 9,541 29,597 22,492 0,000
Q1 Q7 Q3 Q2 Q4 Q8 Q5 Q6 Q9
Q1 Q7 Q3 0,000
Q2 19,626 0,000
Q4 Q8 Q5 Q6 17,279 33,185 0,000
Q9 9,541 20,638 29,597 0,000
Q1 Q7 Q3 Q4 Q8 Q5 Q6 Q2 Q9
Q1 Q7 Q3 Q4 Q8 Q5 Q6 0,000
Q2 33,185 0,000
Q9 29,597 20,638 0,000
Q1Q7Q3Q4Q8Q5Q6Q2Q9
Q1Q7Q3Q4Q8Q5Q6Q20,000
Q9 29,597 0,000
P1 = {1}{2}{3}{4}{5}{6}{7}{8}{9}
P2 = {1,7}{2}{3}{4}{5}{6}{8}{9}
P3 = {1,7}{2}{3}{4,8}{5}{6}{9}
P4 = {1,7}{2}{3}{4,8}{5,6}{9}
P5 = {1,7,5,6}{2}{3}{4,8}{9}
P6 = {1,7,5,6,3}{2}{4,8}{9}
P7 = {1,7,5,6,3,4,8}{2}{9}
P8 = {1,7,5,6,3,4,8,2}{9}
PARTIZIONI OTTENUTE:
PARTIZIONE OTTIMALE
CLUSTER ANALYSIS VINCOLATA
PRIMO CLUSTER SECONDO CLUSTER
TERZO CLUSTER
QUARTO CLUSTER
QUINTO CLUSTER
SESTO CLUSTER
6 CLUSTERS
I DI MORAN GLOBALE e LOCALE relativa alla variable “domanda di auto”
per individuare il quartiere in cui collocare la filiale nell’ambito dei cluster di
quartieri simili e contigui determinati dalla cluster vincolata
N
i
i
N
i
N
j
jiij
xx
xxxxw
S
NI
1
2
1 1
)(
))((
N
j
ijjii wxxxxI1
))((
I1 =(0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)= -0.30 I2 =(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(1-0.44)+(1-0.44)*(0-0.44)+(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)= 0.18 I3 =(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)= -0.18 I4 =(1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)= 0.37 I5 =(0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= -0.54 I6 =(0-0.44)*(0-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= 0.15 I7 =(0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= -0.34 I8 =(1-0.44)*(1-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(0-0.44)= -0.12 I9 =0 I =9/32*(-0.79)/2.22= -0.10
QUARTIERI DI CAMPOBASSO I DI MORAN LOCALE
QUARTIERE 1 -0.30
QUARTIERE 2 0,18
QUARTIERE 3 -0,18
QUARTIERE 4 0,37
QUARTIERE 5 -0,54
QUARTIERE 6 0,15
QUARTIERE 7 -0,34
QUARTIERE 8 -0,12
QUARTIERE 9 0
I=
I DI MORAN LOCALE relativa alla variable “domanda di auto”
I = -0.30
I = -0.18
I = 0
I = -0.12
I = -0.34
I = 0.15
I = -0.54
I = 0.37
I = 0.18
P4 = {1,7}{2}{3}{4,8}{5,6}{9}