marketinŠko istraŽivanje ix.4. analiza skupina · varijable standardizuju (radi uporedivosti,...
TRANSCRIPT
1
MARKETINŠKO ISTRAŽIVANJE
• Decembar 2018
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
2
IX.4. Analiza skupina
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
3
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
4
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
2
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
5
Šta je analiza skupina?• Analiza skupina je tehnika za grupisanje jedinica
posmatranja u unapred nepoznate grupe• Po tome se razlikuje od diskriminacione analize:
– U diskriminacionoj analizi tražimo funkciju koja najbolje razdvaja predmete posmatranja u unapred definisane grupe (koristeći observirane varijable)
– U postupku analize skupina treba upravo identifikovati ove grupe budući da nije unapred poznato na koji način se predmeti posmatranja najbolje odvajaju
Šta je cilj analize skupina?• Cilj je da se pronađe najbolji mogući način
grupisanja predmeta posmatranja u grupe koje, idealno, imaju smislenu ili svrsishodnuinterpretaciju
• Formirane grupe bi trebalo da budu homogene(slične) unutar sebe u odnosu na posmatranevarijable, a da postoji razlika između grupa u odnosu na observirane varijable
• Takve grupe se nazivaju skupinama.
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
6
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
7
Kod analize skupina treba imati
u vidu da:
• Većina metoda su relativno jednostavni postupci
bez strogih statističkih postavki
• Primena i na metričkim i nemetričkim podacima
• Metode analize skupina su nastale iz mnogih
disciplina, pa su raznovrsne i nastale pristrasnosti
• Različiti metodi formiranja skupina daju različita
rešenja za isti skup podataka
• Strategija analize skupina je okrenuta ka traženju
strukture, iako se samim njenim sprovođenjem ova
struktura (grupisanje) nameće.Decembar 2018 Istraživanje tržišta
Ekonomski fakultet, Beograd8
Postupak analize skupina
Sastoji se iz sledećih koraka:
1. Definisanje problema
2. Pronalaženja odgovarajuće mere sličnosti
3. Određivanja kako će se jedinice posmatranja
grupisati
4. Odlučivanje koliki će biti ukupan broj skupina
5. Interpretacije dobijenih skupina, njihovog opisa
i validacije kako bi dobijene skupine bile
relevantne za korisnika istraživanja.
3
Moramo da znamo:A. Mere sličnosti (bliskosti)
– Mere za metričke varijable– Mere za nemetričke varijable
B. Pristupi formiranju skupina– Hijerarhijski– Nehijerarhijski
C. Pristupi merenju sličnosti grupa– Metod najbližih suseda– Metod najudaljenijih suseda– Metod prosečnog povezivanja– Metod centroida– Vordov metod
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
9 Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
10
A. Mere sličnosti • Koriste se da bi se slične jedinice
posmatranja grupisale u istu, a različite jedinice u različite skupine
• A.1. Mere sličnosti za metričke varijable:1. Euklidsko odstojanje;2. Menhetn-odstojanje;3. Mahalanobisovo odstojanje;4. Kosinusni koeficijent;5. Koeficijenti korelacije,
• A.2. Mere sličnosti za nemetričke varijable
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
11
A.1. Mere sličnosti za metričke varijable
• Euklidsko odstojanje, dij: (mera različitosti)gde su xim i xjm standardizovane vrednostim-tog atributa za jedinice posmatranja i i j
– Osnovni nedostatak je što se primenjuje pošto se sve varijable standardizuju (radi uporedivosti, jedinice mere)
– Ali tako se smanjuju i razlike između grupa i varijabli– Treba ukloniti one koji otskaču (outliers)...• Manhattan metrica
• Kosinusni koeficijenti (mera bliskosti)• Kosinus ugla koji se dobija tako sto se iz koordinatnog sistema
povuce linija ka tackama koje se porede. Max vrednost 1 kada je najveća sličnost i min vrednost 0 kada je najveća različitost.
€
dij2 = (xim − x jm )
2
m=1
p
∑
€
dij = xim − x jmm=1
p
∑
Primer
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
12
4
Matrica bliskosti Euklidskih odstojanja
Euclidean Distance 1 2 3 4 5 6 7
1 .000 1.163 1.199 3.383 3.663 3.164 4.4472 1.163 .000 .065 2.571 2.795 2.610 3.6773 1.199 .065 .000 2.597 2.815 2.653 3.7044 3.383 2.571 2.597 .000 .334 .804 1.1075 3.663 2.795 2.815 .334 .000 1.099 .9436 3.164 2.610 2.653 .804 1.099 .000 1.4147 4.447 3.677 3.704 1.107 .943 1.414 .000
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
13
Proximity Matrix
This is a dissimilarity matrix
Euklidsko odstojanje između tačaka 1 i 7
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
14
Matrica bliskosti Menhetn-odstojanja
Minkowski (1) Distance1 2 3 4 5 6 7
1 .000 1.563 1.634 3.981 4.158 4.203 5.4912 1.563 .000 .070 3.469 3.645 3.690 4.9793 1.634 .070 .000 3.529 3.706 3.751 5.0394 3.981 3.469 3.529 .000 .438 1.116 1.5105 4.158 3.645 3.706 .438 .000 1.554 1.3346 4.203 3.690 3.751 1.116 1.554 .000 1.5297 5.491 4.979 5.039 1.510 1.334 1.529 .000
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
15
Proximity Matrix
This is a dissimilarity matrix
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
16
Menhetn-odstojanje između tačaka 1 i 7
5
Matrica bliskosti kosinusnih koeficijenata
Cosine of Vectors of Values1 2 3 4 5 6 7
1 1.000 .968 .965 .944 .931 .975 .9392 .968 1.000 1.000 .997 .993 1.000 .9953 .965 1.000 1.000 .997 .994 .999 .9964 .944 .997 .997 1.000 .999 .994 1.0005 .931 .993 .994 .999 1.000 .989 1.0006 .975 1.000 .999 .994 .989 1.000 .9927 .939 .995 .996 1.000 1.000 .992 1.000
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
17
Proximity Matrix
This is a similarity matrix
Udaljenost i kosinusni koeficijenti
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
18
A.2. Mere sličnosti kada su varijable nemetričke (1)
• Npr. poredićemo dva predmeta posmatranja u odnosu na binarne varijable. Tražimo:a - broj promenljivih kod kojih oba predmeta posmatranja imaju istu krakteristiku;b - broj promenljivih kod kojih prvi predmet posmatranja ima datu karakteristiku, a drugi nema;c - broj promenljivih kod kojih drugi predmet posmatranja ima datu karakteristiku, a prvi nema;d - broj promenljivih kod kojih oba predmeta posmatranja nemaju datu krakteristiku.
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
19
A.2. Mere sličnosti kada su varijable nemetričke (2)
• Kosinusni koeficijent se računa na isti način kao i kod metričnih promenljivih:
• Jednostavni koeficijent podudarnosti, uzima u obzir i situaciju kada predmeti posmatranja paralelno ne poseduju određene karakteristike
• Džakardov koeficijent izuzima promenljive kod kojih oba predmeta posmatranja paralelno ne poseduju datu karakteristiku
• Fi-koeficijent se može izračunati kao običan koeficijent korelacije na binarnim podacima.
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
20
a / (a+ b+ c+ d)
(a+ d) / (a+ b+ c+ d)
6
B. Pristupi formiranju skupina
• B.1. Hijerarhijski pristupi formiranju skupina– Od dna naviše– Od vrha nadole
• B.2. Nehijerarhijski pristupi formiranju skupina
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
21 Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
22
B.1. Hijerarhijski pristup formiranju skupina
• Kada se dve jedinice posmatranja dodele istoj skupini, one na dalje i ostaju u toj skupini. 1. Pristup „od vrha na dole” ili pristup odlučivanja:
• Na početku se sve jedinice posmatranja nalaze u jednoj skupini koja se zatim deli sve dok svaka jedinica posmatranja ne bude u svojoj, jednočlanoj skupini.
2. Pristup „od dna naviše” ili aglomerativni pristup:• Na početku se svaka jedinica posmatranja nalazi u svojoj
(jednočlanoj) skupini koje se sistematski kombinuju dok sve jedinice posmatranja ne budu u jednoj skupini.
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
23
• Prednosti: – Ima logičku strukturu, veoma je pregledno i lako se
tumači.• Nedostaci:
– Rezultat je relativno nestabilan i nepouzdan jer prvo kombinovanje ili odvajanje jedinica na bazi malih razlika u vrednosti kriterijuma može predstavljati veliko ograničenje u smislu kvaliteta dalje analize
• Stoga:– Treba uzorak podeliti na dva dela i uporediti dobijene
skupine. Ako se rešenja značajno razlikuju...
Prednosti i nedostaci hijerarhijskog pristupa formiranju skupina
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
24
B.2. Nehijerarhijski pristup formiranju skupina
• Jedinice posmatranja mogu da napuste jednu skupinu i da se pridruže drugoj skupini, ako tako kaže kriterijum za formiranje skupina– Prvo se bira centar skupine (centroid) i sve jedinice
posmatranja koje se nalaze na unapred određenom pragu udaljenosti se uključuju u tu skupinu,
– Unapred se određuje broj željenih skupina, – Centroidi skupina mogu biti slučajno izabrani ili se
mogu dobiti prethodnom primenom hijerarhijskog pristupa.
7
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
25
• Prednosti: – Pouzdaniji pristup (slični rezultati i za poduzorke),
jedinice mogu menjati mesto u skupinama, dakle nije osetljiv na male razlike u kriterijumu
• Nedostaci: – Dobijena serija skupina može biti haotična i teška za
tumačenje i dalju analizu (što ponekad i nije loše); broj skupina se mora unpared definisati.
• Stoga– Oba pristupa se koristite sukcesivno – hijerarhijski da
bi se odredio broj skupina, centroidi i outliers ...
Prednosti i nedostaci nehijerarhijskog pristupa
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
26
C. Pristupi merenju sličnosti grupa
C.1. Metod jednostrukog povezivanjaC.2. Metod potpunog povezivanjaC.3. Metod prosečnog povezivanjaC.4. Vordov metodC.5. Metod centroida
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
27
• Zasniva se na najmanjem odstojanju i naziva i pristup najbližeg suseda– Rastojanje između dve skupine je jednako rastojanju između
njihova dva nabliža člana
C.1. Metod jednostrukog povezivanja
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
28
C.2. Metod potpunog povezivanja
• Zasniva na najvećem odstojanju između jedinica posmatranja i naziva i pristup najudaljenijeg suseda– Dve najudaljenije jedinice posmatranja se dodeljuju dvema
odvojenim skupinama (minmax metod)
8
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
29
C.3. Metod prosečnog povezivanja
• Za formiranje skupina se koristi prosečno odstojanje između jedinica posmatranja u jednoj skupini i jedinica posmatranja u drugoj skupini, odnosno koriste se svi članovi skupina za kriterijum spajanja
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
30
C.4. Vordov metod (metod minimalne sume kvadrata)
• Meri se ukupnom sumom kvadrata odstupanja svake jedinice od centroida novoformirane skupine (sve kombinacije)– U svakoj fazi se suma kvadrata greške minimizira u odnosu
na sve particije koje je moguće dobiti kombinacijom dve skupine iz prethodne faze
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
31
C.5. Metod centroida
• Meri razdaljinu između centroida grupa– Proces se nastavlja kombinacijom grupa u skladu sa
odstojanjem između njihovih centroida– Centroid je fiktivna tačka na ovom grafikonu
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
32
B.2. Nehijerarhijsko formiranje skupina (1)
• Zove se i iterativno deljenje• Jedinice posmatranja mogu da napuste jednu
skupinu i pređu u drugu, ako bi to bilo bolje sa stanovišta kriterijuma za formiranje skupina
1. Sekvencionalni prag– Bira se centar skupine i sve jedinice posmatranja u okviru
unapred oređenog praga vrednosti se grupišu u tu skupinu– Zatim se bira novi centar skupine i postupak ponavlja za
negrupisane jedinice posmatranja– Kada jedinice posmatranja budu dodeljene skupini, one se
ne koriste u daljoj proceduri.
9
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
33
2. Paralelni prag– Slično kao prethodni metod, ali se sada bira nekoliko
centara istovremeno, a jedinice posmatranja koje se nalaze na određenoj udaljenosti se dodeljuju najbližem centru
– Visine praga mogu da se prilagode3. Optimizacija
– Modifikacija prethodne dve procedure. – Jedinice posmatranja mogu kasnije da budu dodeljene
nekoj drugoj skupini tako što se optimizira kriterijumska mera (npr. prosečna vrednost odstojanja unutar skupine za dati broj skupina)
Nehijerarhijsko formiranje skupina (2)
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
34
Broj skupina
1. Može se unapred odrediti (npr. ako proizilazi iz teorijskih, logičkih ili praktičnih razloga)
2. Može se odrediti na osnovu određenog kriterijuma za formiranje skupina
3. Na osnovu obrasca formiranja skupina koji je generisao program kojim se daje različit broj skupina
4. Odnos ukupnog varijabiliteta unutar skupina i varijabiliteta između grupa se grafički predstavi u odnosu na broj skupina. Bira se tačka preloma.
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
35
Evaluacija i formiranje profila skupina
• Opis novoformiranih skupina?• Često se u tu svrhu koristi centroid,
– Pogodno ako su podaci dati na intervalnoj skali a formiranje skupina je u prostoru originalnih varijabli
– Ako su podaci standardizovani ili se analiza vrši korišćenjem komponenti faktorske analize, onda se vraća na originalne skorove za originalne varijable i prosečni profili računaju na bazi ovih podataka
• Prosečnim skorovima se opisuje profil skupina• U tu svrhu mogu da se koriste i profili skupina u odnosu
na varijable koje nisu korišćene za formiranje skupina (demografske, psihografske...) a diskra da se koristi...
• Na zadatku ćemo primeniti hijerarhijski metodformiranja skupina od dna naviše
• Primenićemo svaki od pet opisanih pristupamerenju sličnosti grupa
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
36
10
Formiranje skupina metodom najbližih suseda
• Dve skupine se porede tako što se porede njihova dva najbliža elementa
• Poredimo udaljenost između njih korišćenjem Euklidskog odstojanja
• U prvoj iteraciji svaki predmet posmatranja je jedna skupina (hijerarhijski pristup od dna na više), dakle imamo 7 skupina (tj. elemenata)
• Dva elementa (skupine) sa najmanjim rastojanjem će formirati novu skupinu
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
37
Matrica bliskosti kvadrata Euklidskih odstojanja
Case Squared Euclidean Distance 1 2 3 4 5 6 7
1 .000 1.353 1.437 11.442 13.419 10.012 19.7772 1.353 .000 .004 6.609 7.810 6.810 13.5233 1.437 .004 .000 6.746 7.927 7.038 13.7224 11.442 6.609 6.746 .000 .112 .647 1.2265 13.419 7.810 7.927 .112 .000 1.208 .8896 10.012 6.810 7.038 .647 1.208 .000 1.9997 19.777 13.523 13.722 1.226 .889 1.999 .000
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
38
Proximity Matrix
This is a dissimilarity matrix
• Dva najbliža elementa su 2 i 3 (tu imamonajmanje rastojanje koje mereno kvadratomEuklidskog odstojanja iznosi 0,004)
• Ova dva elementa će formirati novu skupinu• Postupak se na isti način ponavlja u narednoj
iteraciji, gde sada imamo samo 6 skupina• Izlazni rezultat prikazuje Tabela nagomilavanja• Iteracije se ponavljaju dok svi elementi ne budu
bili u jednoj skupini (imaćemo 6 iteracija)
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
39
Tabela nagomilavanja, metod najbližih suseda
Stage Cluster Combined CoefficientsStage Cluster First
Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 2 3 .004 0 0 52 4 5 .112 0 0 33 4 6 .647 2 0 44 4 7 .889 3 0 65 1 2 1.353 0 1 66 1 4 6.609 5 4 0
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
40
Agglomeration Schedule
11
Dendrogram za metod najbližih suseda
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
41
Predmetiposma-tranja
Udaljenostizmeđu
predmetaposmatranja
• Postupak prikazuje i dendrogram• Ako nije unapred definisan željeni broj skupina,
biramo onaj broj gde dolazi do naglog povećanja udaljenosti
• U našem primeru to se dešava posle pretposlednje (pete) iteracije (odnosno u šestoj iteraciji)
• U konačnom rešenju postoje dve skupine: – Predmeti posmatranja 1, 2 i 3 u jednoj, i– Predmeti posmatranja 4, 5, 6 i 7 i drugoj skupini
• Dobijeno rešenje se može prikaziti grafički
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
42
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
43
• Postupak je sličan kao prethodno opisani• Koristimo isto kvadrate Euklidskih odstojanja• Isto tako koristimo hijerarhijski pristup formiranju
skupina od dna naviše• Videćemo da su prve tri iteracije iste, da su
četvrta i peta iteracija zamenile mesta, ali da se u petoj dobija isto rešenje
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
44
Formiranje skupina metodom najudaljenijih suseda
12
Tabela nagomilavanja, metod najudaljenijih suseda
StageCluster Combined
CoefficientsStage Cluster First
Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 2 3 .004 0 0 42 4 5 .112 0 0 33 4 6 1.208 2 0 54 1 2 1.437 0 1 65 4 7 1.999 3 0 66 1 4 19.777 4 5 0
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
45
Agglomeration Schedule
Dendrogram za metod najudaljenijih suseda
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
46
Hijerarhijsko formiranje skupina, metod najudaljenijih suseda
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
47
Metod prosečnog povezivanja• Udaljenost između dve skupine se meri kao
prosečna udaljenost između svih elemenata tih dveju skupina
• Mnogo češće se primenjuje u praksi od prethodna dva, jer nije osetljiv na ekstremne vrednosti
• Za meru udaljenosti koristimo isto kvadrate Euklidskih odstojanja
• Dobija se isti rezultat kao u prethodna dva slučaja
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
48
13
Tabela nagomilavanja, metod prosečnog povezivanja
StageCluster Combined
CoefficientsStage Cluster First
Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 2 3 .004 0 0 52 4 5 .112 0 0 33 4 6 .928 2 0 44 4 7 1.372 3 0 65 1 2 1.395 0 1 66 1 4 10.403 5 4 0
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
49
Agglomeration Schedule
Dendrogram za metod prosečnog povezivanja
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
50
Formiranje skupina metodom centroida
• Grupe (tj. skupine) se porede tako što se porediudaljenost njihovih centroida
• Ovde koristimo, kao i do sada, hijerarhijskipristup od dna naviše
• Mera udaljenosti su kvadrati Euklidskogodstojanja
• Dobija se isto rešenje
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
51
Tabela nagomilavanja, metod centroida
Stage Cluster Combined CoefficientsStage Cluster First
Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 2 3 .004 0 0 52 4 5 .112 0 0 33 4 6 .900 2 0 44 4 7 1.153 3 0 65 1 2 1.394 0 1 66 1 4 9.712 5 4 0
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
52
Agglomeration Schedule
14
Dendrogram za metod centroida
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
53 Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
54
Hijerarhijsko formiranje skupina, metod centroida
Vordov metod• Kod Vordovog metoda za svaku skupinu
računamo sumu kvadrata odstupanja njenih članica od centroida te skupine
• Kada dve skupine formiraju novu skupinu suma kvadrata novoformirane skupine će biti veća od zbira sume kvadrata skupina koje su je formirale
• To povećanje sume kvadrata predstavlja meru odstojanja
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
55
Tabela nagomilavanja, Vordov metod
Stage Cluster Combined CoefficientsStage Cluster First
Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 2 3 .002 0 0 52 4 5 .058 0 0 33 4 6 .658 2 0 44 4 7 1.522 3 0 65 1 2 2.452 0 1 66 1 4 19.102 5 4 0
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
56
Agglomeration Schedule
15
Dendrogram za Vordov metod
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
57
Nehijerarhijski pristupi formiranju skupina
• Član skupine može da promeni članstvo • Optimalan broj skupina je poznat unapred• Korstićemo Metod K-sredina• Polazi se od zadatih centroida za zadat broj
skupina• Ako inicijalni centroidi nisu zadati, u prvoj iteraciji
su to onda predmeti posmatranja koji su međusobno najudaljeniji
• Zatim se u iterativnoj proceduri tim centroidima dodaju predmeti posmatranja koji su im najbliži
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
58
Inicijalne skupine (klasteri) zanaš primer i njihovi centroidi
Cluster1 2
Stav studenata prema Bolonjskom procesu 3.54 4.76Stav studenata prema Beogradskom univerzitetu 2.45 6.73
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
59
Initial Cluster Centers
• Ovo su, zapravo, naši predmeti posmatranja 1 i 7 koji sumeđusobno najudaljeniji
Inicijalni centroidi za metod K-sredina
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
60
16
Iteracije do pronalaženja finalnog rešenja
IterationChange in Cluster Centers1 2
1 .787 .8052 .000 .000
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
61
• Vrlo brzo nalazimo rešenje, već u drugoj iteraciji• Razlog tome je raspored naših predmeta posmatranja
koji je veoma pogodan i očeigledan
Centroidi za finalne skupine
Cluster1 2
Stav studenata prema Bolonjskom procesu 3.17 4.48Stav studenata prema Beogradskom Univerzitetu 3.15 5.97
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
62
• Svi stavovi su dati na skali od 1 do 7, gde je 1 najnegativniji, a 7 najpozitivniji stav
Predmeti posmatranja po finalnim skupinama i njihova udaljenost od centroida odgovarajuće
skupine
Case Number Cluster Distance1 1 .7872 1 .3773 1 .4124 2 .3415 2 .4156 2 .7647 2 .805
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
63
• Za meru udaljenosti koristili smo Euklidsko odstojanje
Cluster Membership
Udaljenost između finalnih skupina
Cluster 1 21 3.1162 3.116
Decembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
64
• Za meru udaljenosti smo koristili Euklidsko odstojanje