definizione (fiaschi g.,1998): “complesso delle

DEFINIZIONE (FIASCHI G.,1998): “Complesso delle applicazioni di marketing condotte su

dati georeferenziati, ossia tutti quei dati che sono riconducibili a precise porzioni di

territorio e rappresentabili su mappa”

IMPLEMENTAZIONE:

PRIMA FASE: organizzazione dei dati interni aziendali.

SECONDA FASE: georeferenziazione degli elementi da mappare.

TERZA FASE: identificazione delle fonti informative esterne adeguate a

stimare il potenziale di mercato dei prodotti/servizi.

QUARTA FASE: visualizzazione, analisi dei dati interni e di potenziale

sui dati spaziali (cartografie elettroniche).

SETTORI ECONOMICI SUI

QUALI INTERVIENE IL

GEOMARKETING:

•BANCARIO–FINANZIARIO

•ASSICURATIVO

•IMMOBILIARE

•LOGISTICO

•TELECOMUNICAZIONI

•COMPARTO DISTRIBUTIVO

•PUBBLICITARIO

QUARTIERI POPOLAZIONE

RESIDENTE

ETA'

MEDIA

REDDITO

MEDIO

N°

COMPONENTI

MEDI FAMILIARI

DOMANDA

AUTO NoIMMATRICOLAZIONI

Quartiere 1 2015 39,10 16200,00 2,40 0 110,00

Quartiere 2 2067 45,37 18300,00 2,50 1 350,00

Quartiere 3 3359 41,24 15400,00 2,70 1 180,00

Quartiere 4 10227 36,48 15900,00 3,30 1 290,00

Quartiere 5 10010 31,98 14400,00 3,10 0 100,00

Quartiere 6 10202 38,64 14700,00 3,20 0 150,00

Quartiere 7 4953 39,11 15800,00 2,80 0 110,00

Quartiere 8 8439 35,00 15900,00 2,90 1 200,00

Quartiere 9 361 46,38 14800,00 2,00 0 80,00

Un Concessionario di automobili plurimarche (vendita nuovo ed usato) è interessato a studiare il

mercato nell’area della città di Campobasso ed in particolare il comportamento di alcune variabili

nelle diverse zone della città per comprendere dove dislocare eventuali nuove filiali.

TECNICHE STATISTICHE

UNIVARIATE

MULTIVARIATE BIVARIATE

CLUSTER ANALYSIS

OBIETTIVO: individuare una o più partizioni delle n unità statistiche in gruppi, in base ad un set di variabili osservate sulle n unità, tali che i gruppi abbiano le seguenti caratteristiche: coesione interna e separazione esterna.

METODI GERARCHICI METODI NON GERARCHICI

Aggregativi Scissori

Matrice delle distanze

,000 12,870 6,654 17,279 12,899 12,904 4,193 11,241 6,71612,870 ,000 9,277 15,297 33,185 26,958 19,626 14,198 20,6366,654 9,277 ,000 7,568 12,422 9,215 4,719 3,976 9,541

17,279 15,297 7,568 ,000 9,894 7,755 11,303 1,658 29,59712,899 33,185 12,422 9,894 ,000 2,491 4,573 7,010 22,49212,904 26,958 9,215 7,755 2,491 ,000 3,130 6,871 17,8404,193 19,626 4,719 11,303 4,573 3,130 ,000 7,142 7,553

11,241 14,198 3,976 1,658 7,010 6,871 7,142 ,000 21,3176,716 20,636 9,541 29,597 22,492 17,840 7,553 21,317 ,000

Caso1:Case 12:Case 23:Case 34:Case 45:Case 56:Case 67:Case 78:Case 89:Case 9

1:Case 1 2:Case 2 3:Case 3 4:Case 4 5:Case 5 6:Case 6 7:Case 7 8:Case 8 9:Case 9 Distanza euclidea quadratica

Questa è una matrice di dissimilarità

Programma di agglomerazione

4 8 1,658 0 0 65 6 2,491 0 0 61 7 4,193 0 0 41 3 6,654 3 0 51 9 9,541 4 0 74 5 9,894 1 2 81 2 20,636 5 0 81 4 33,185 7 6 0

Stadio12345678

Cluster 1 Cluster 2Cluster accorpati

Coefficienti Cluster 1 Cluster 2

Stadio di formazionedel cluster Stadio

successivo

Dendrogram using Complete Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø Case 5 5 òûòòòòòòòòòòò÷ ó Case 6 6 ò÷ ó Case 1 1 òòòòòûòø ó Case 7 7 òòòòò÷ ùòòòòòø ó Case 3 3 òòòòòòò÷ ùòòòòòòòòòòòòòòòòòø ó Case 9 9 òòòòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòò÷ Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

D e n d r o g r a m u s i n g A v e r a g e L i n k a g e ( B e t w e e n G r o u p s ) R e s c a l e d D i s t a n c e C l u s t e r C o m b i n e C A S E 0 5 1 0 1 5 2 0 2 5 L a b e l N u m + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + C a s e 4 4 ò û ò ò ò ò ò ò ò ò ò ø C a s e 8 8 ò ÷ ù ò ò ò ò ò ò ò ø C a s e 3 3 ò ò ò ò ò ò ò ò ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ø C a s e 5 5 ò ò ò û ò ò ò ø ó ó C a s e 6 6 ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ÷ ù ò ò ò ò ò ò ò ò ò ò ò ø C a s e 7 7 ò ò ò ò ò ò ò ÷ ó ó C a s e 1 1 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò û ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷ ó C a s e 9 9 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷ ó C a s e 2 2 ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ò ÷

Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòø Case 3 3 òòòòòòòòòòòòòòò÷ ó Case 5 5 òòòòòûòòòø ùòòòòòòòòòòòø Case 6 6 òòòòò÷ ùòòòòòòòø ó ó Case 7 7 òòòòòòòòò÷ ùòòò÷ ùòòòòòòòòòòòòòòòø Case 1 1 òòòòòòòòòòòòòòòòò÷ ó ó Case 9 9 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

Dendrogram using Complete Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Case 4 4 òûòòòòòòòòòòòø Case 8 8 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø Case 5 5 òûòòòòòòòòòòò÷ ó Case 6 6 ò÷ ó Case 1 1 òòòòòûòø ó Case 7 7 òòòòò÷ ùòòòòòø ó Case 3 3 òòòòòòò÷ ùòòòòòòòòòòòòòòòòòø ó Case 9 9 òòòòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòò÷ Case 2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

Programma di agglomerazione

4 8 1,658 0 0 65 6 2,491 0 0 61 7 4,193 0 0 41 3 6,654 3 0 51 9 9,541 4 0 74 5 9,894 1 2 81 2 20,636 5 0 81 4 33,185 7 6 0

Stadio12345678

Cluster 1 Cluster 2Cluster accorpati

Coefficienti Cluster 1 Cluster 2

Stadio di formazionedel cluster Stadio

successivo

DETERMINAZIONE DEL NUMERO OTTIMO DI CLUSTER

P1 = {1} {2} {3} {4} {5} {6} {7} {8} {9}P2 = {1} {2} {3} {4,8} {5} {6} {7} {9}P3 = {1} {2} {3} {4,8} {5,6} {7} {9}P4 = {1,7} {2} {3} {4,8} {5,6} {9}P5 = {1,7,3} {2} {4,8} {5,6} { 9}P6 = {1,7,3, 9} {2}{4,8},{5,6} P7 = {1,7,3, 9} {2}{4,8,5,6} P8 = {1,7,3,9,2} {4,8,5,6}

Variabili Gruppo 1 Gruppo 2 Gruppo 3 Popolazione residente

nei vari quartieri -0,765805131 -0,91696732 0,99504696

Età media della popolazione 0,475917273 1,32154548 -0,806303644

N°medio componenti nucleo familiare -0,697216689 -0,63745526 0,856580503

Domanda auto nei quartieri -0,368932394 1,054092553 0,105409255

N°auto immatricolate in ciascun quartiere -0,589570348 1,901063573 0,114304455

Reddito medio della popolazione -0,068970073 2,023122155 -0,436810465

NUMEROSITA' 4 1 4

DEFINIZIONE:“E’ quella parte della statistica che tratta le osservazioni tenendo conto

esplicitamente della posizione in cui esse si manifestano nello spazio”(Zani e Napoletano, 1992)

STRUMENTI

CLUSTER ANALYSIS VINCOLATA

I DI MORAN

•CLUSTER ANALYSIS VINCOLATA

Con il termine classificazione vincolata si indicano i metodi per ottenere gruppi di unità che risultino non

soltanto simili tra loro, ma anche vicini. Il vincolo di contiguità viene realizzato affiancando alla matrice

delle distanze D, una matrice di contiguità, chiamata MATRICE DELLE ADIACENZE di elementi wij.

•I DI MORAN (N numero di unità, S somma dei pesi nella matrice di adiacenza)

•Globale •Locale

N

i

i

N

i

N

j

jiij

xx

xxxxw

S

NI

1

2

1 1

)(

))((

N

j

ijjii wxxxxI1

))((

1 2 3 4 5 6 7 8 9

1 0 1 1 0 0 0 1 0 0

2 1 0 1 1 1 0 1 1 0

3 1 1 0 0 0 0 1 0 0

4 0 1 0 0 1 0 0 1 0

5 0 1 0 1 0 1 0 1 0

6 0 0 0 0 1 0 1 1 0

7 1 1 1 0 0 1 0 1 0

8 0 1 0 1 1 1 1 0 0

9 0 0 0 0 0 0 0 0 0

Caso Distanza euclidea quadratica

1 2 3 4 5 6 7 8 9

1 ,000 15,549 5,495 16,626 11,595 9,723 1,573 9,407 5,133

2 15,549 ,000 10,813 16,239 36,684 27,038 17,897 15,422 22,975

3 5,495 10,813 ,000 7,666 12,780 8,740 4,722 3,893 9,637

4 16,626 16,239 7,666 ,000 10,695 7,251 10,895 2,166 29,989

5 11,595 36,684 12,780 10,695 ,000 2,492 5,964 7,265 22,580

6 9,723 27,038 8,740 7,251 2,492 ,000 3,738 6,298 17,655

7 1,573 17,897 4,722 10,895 5,964 3,738 ,000 6,162 8,296

8 9,407 15,422 3,893 2,166 7,265 6,298 6,162 ,000 20,946

9 5,133 22,975 9,637 29,989 22,580 17,655 8,296 20,946 ,000

:

1. partendo dalla matrice delle distanze, si individuano le 2 unità con la minore distanza e si uniscono per formare il 1° gruppo solo se risultano adiacenti; in caso contrario, si sceglie la distanza immediatamente più grande e si aggregano le unità corrispondenti;

2. si calcola, adottando il metodo del legame completo, la distanza del nuovo gruppo ottenuto dagli altri, ricavando una nuova matrice delle distanze con dimensioni diminuite di uno;

3. si individua nella nuova matrice la coppia di unità (o gruppi) con minore distanza e tra loro adiacenti, riunendole in un unico gruppo;

4. si ripetono le fasi 2 e 3 rispettando sempre il vincolo della distanza geografica.

In base a quanto appena detto, partendo dalla partizione banale in cui tutte le unità sono distinte, e tenendo conto deivari livelli di aggregazione, si ottengono le seguenti partizioni:

P1 = {1} {2} {3} {4} {5} {6} {7} {8} {9}P2 = {1} {2} {3} {4,8} {5} {6} {7} {9}P3 = {1} {2} {3} {4,8} {5,6} {7} {9}P4 = {1,7} {2} {3} {4,8} {5,6} {9}P5 = {1,7,3} {2} {4,8} {5,6} { 9}P6 = {1,7,3} {2} {4,8,5,6} {9}P7 = {1,7,3,4,8,5,6} {2} {9}P8 = {1,7,3,4,8,5,6,2} {9}

PARTIZIONE OTTIMALE P5

PROCEDIMENTO DI CLUSTER VINCOLATA

Q1 Q7 Q3 Q2 Q4 Q8 Q5 Q6 Q9

Q1 Q7 Q3 0,000

Q2 19,626 0,000

Q4 Q8 17,279 15,297 0,000

Q5 Q6 12,904 33,185 9.894 0,000

Q9 9,541 20,638 29,597 22,492 0,000

Q1 Q7 Q2 Q3 Q4 Q8 Q5 Q6 Q9

Q1 Q7 0,000

Q2 19,626 0,000

Q3 6,654 9,277 0,000

Q4 Q8 17,279 15.297 7,568 0,000

Q5 Q6 12,904 33,185 12,422 9.894 0,000

Q9 7,553 20,636 9,541 29,597 22,492 0,000

Q1 Q7 Q3 Q2 Q4 Q8 Q5 Q6 Q9

Q1 Q7 Q3 0,000

Q2 19,626 0,000

Q4 Q8 Q5 Q6 17,279 33,185 0,000

Q9 9,541 20,638 29,597 0,000

Q1 Q7 Q3 Q4 Q8 Q5 Q6 Q2 Q9

Q1 Q7 Q3 Q4 Q8 Q5 Q6 0,000

Q2 33,185 0,000

Q9 29,597 20,638 0,000

Q1Q7Q3Q4Q8Q5Q6Q2Q9

Q1Q7Q3Q4Q8Q5Q6Q20,000

Q9 29,597 0,000

P1 = {1}{2}{3}{4}{5}{6}{7}{8}{9}

P2 = {1,7}{2}{3}{4}{5}{6}{8}{9}

P3 = {1,7}{2}{3}{4,8}{5}{6}{9}

P4 = {1,7}{2}{3}{4,8}{5,6}{9}

P5 = {1,7,5,6}{2}{3}{4,8}{9}

P6 = {1,7,5,6,3}{2}{4,8}{9}

P7 = {1,7,5,6,3,4,8}{2}{9}

P8 = {1,7,5,6,3,4,8,2}{9}

PARTIZIONI OTTENUTE:

PARTIZIONE OTTIMALE

CLUSTER ANALYSIS VINCOLATA

PRIMO CLUSTER SECONDO CLUSTER

TERZO CLUSTER

QUARTO CLUSTER

QUINTO CLUSTER

SESTO CLUSTER

6 CLUSTERS

I DI MORAN GLOBALE e LOCALE relativa alla variable “domanda di auto”

per individuare il quartiere in cui collocare la filiale nell’ambito dei cluster di

quartieri simili e contigui determinati dalla cluster vincolata

N

i

i

N

i

N

j

jiij

xx

xxxxw

S

NI

1

2

1 1

)(

))((

N

j

ijjii wxxxxI1

))((

I1 =(0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)= -0.30 I2 =(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(1-0.44)+(1-0.44)*(0-0.44)+(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)= 0.18 I3 =(1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)= -0.18 I4 =(1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(1-0.44)= 0.37 I5 =(0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= -0.54 I6 =(0-0.44)*(0-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= 0.15 I7 =(0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(1-0.44)+ (0-0.44)*(0-0.44)+ (0-0.44)*(1-0.44)= -0.34 I8 =(1-0.44)*(1-0.44)+ (1-0.44)*(1-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(0-0.44)+ (1-0.44)*(0-0.44)= -0.12 I9 =0 I =9/32*(-0.79)/2.22= -0.10

QUARTIERI DI CAMPOBASSO I DI MORAN LOCALE

QUARTIERE 1 -0.30

QUARTIERE 2 0,18

QUARTIERE 3 -0,18

QUARTIERE 4 0,37

QUARTIERE 5 -0,54

QUARTIERE 6 0,15

QUARTIERE 7 -0,34

QUARTIERE 8 -0,12

QUARTIERE 9 0

I=

I DI MORAN LOCALE relativa alla variable “domanda di auto”

I = -0.30

I = -0.18

I = 0

I = -0.12

I = -0.34

I = 0.15

I = -0.54

I = 0.37

I = 0.18

P4 = {1,7}{2}{3}{4,8}{5,6}{9}

definizione (fiaschi g.,1998): “complesso delle

Documents