analiza promocije brandova na - ieee rad 2378.pdfrečenica ili samih dijelova tekstova. sadržaj...
TRANSCRIPT
SVEUČILIŠTE U ZAGREBU
FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA
ZAVRŠNI RAD br. 2378
ANALIZA PROMOCIJE BRANDOVA NA
DRUŠTVENIM MREŽAMA
Goran Jelen
Zagreb, lipanj 2012.
Zahvaljujem se mentoru prof.dr.sc.
Ignacu Lovreku i docentu Doc.dr.sc.
Vedranu Podobniku na ukazanom
povjerenju što su mi omogućili rad na
vrlo novoj i atraktivnoj temi. Pored toga
zahvaljujem se na ukazanoj pomoći,
savjetima, diskusijama i iskazanom
razumijevanju tijekom izrade i pisanja
ovoga rada.
Sadržaj
Popis slika .............................................................................................................................. 1
Uvod ...................................................................................................................................... 3
1. Analiza sadržaja ............................................................................................................. 4
1.1. Primjena analize sadržaja ...................................................................................... 5
1.2. Proces analize sadržaja .......................................................................................... 7
1.3. Pouzdanost u analizi sadržaja ................................................................................ 8
2. Analiza sadržaja na društvenim mrežama ..................................................................... 9
2.1. Metode analize sadržaja na društvenim mrežama ............................................... 13
2.2. Regresija .............................................................................................................. 14
2.3. Višestruka regresija ............................................................................................. 17
2.4. Faktorska analiza ................................................................................................. 20
2.5. Složena analiza varijacije .................................................................................... 22
3. Analiza brandova na društvenoj mreži Facebook ....................................................... 26
3.1. Stranice branda na društvenoj mreži Facebook ................................................... 26
3.2. Izvori podataka .................................................................................................... 30
4. Sustav za analizu brandova na društvenoj mreži Facebook ........................................ 34
4.1. Prijava na sustav za analizu brandova ................................................................. 34
4.2. Dohvaćanje podataka s Facebooka ..................................................................... 36
4.3. Procesiranje podataka dohvaćenih s Facebooka ................................................. 41
4.4. Baza podataka za analizu promocije brandova.................................................... 44
4.5. Model analize brandova na društvenoj mreži Facebook ..................................... 47
4.5.1. Regresijska analiza za promociju brandova na društvenoj mreži Facebook48
4.5.2. Složena analiza varijacije promocije brandova na društvenoj mreži
Facebook 53
Zaključak ............................................................................................................................. 57
Literatura ............................................................................................................................. 58
Sažetak ................................................................................................................................. 60
Summary .............................................................................................................................. 61
Privitak ................................................................................................................................ 62
1
Popis slika
Slika 1: Kategorije analize sadržaja....................................................................................... 5
Slika 2: Manifesno i latentno značenje podataka u analizi sadržaja...................................... 7
Slika 3: Elementi društvenog utjecaja na društvenim mrežama ............................................ 9
Slika 4: Google +1 tipka za dijeljenje sadržaja ................................................................... 10
Slika 5: Stranica profila na društvenoj mreži Facebook ...................................................... 11
Slika 6: Stranica branda na društvenoj mreži Facebook ..................................................... 11
Slika 7: Naslovna stranica društvene mreže Facebook ....................................................... 12
Slika 8: eViews 7,2 .............................................................................................................. 19
Slika 9: Na desnoj strani je prikaz pozitivne, a na lijevoj strani negativne korelacije ........ 20
Slika 10: Desno je prikazana savršeno pozitivna, a na lijevoj savršeno negativna korelacija
............................................................................................................................................. 21
Slika 11: Nema korelacije (nepostojeća korelacija) ............................................................ 21
Slika 12: Rezultat dobiven s Excelom ................................................................................. 24
Slika 13: Povećanje broja korisnika Facebooka.................................................................. 26
Slika 14: Storefront na društvenoj mreži Facebook ............................................................ 27
Slika 15: Novi Storefront uključen unutar Facebook-Timelinea ........................................ 28
Slika 16: Kategorizacija sadržaja na stranici branda ........................................................... 28
Slika 17: Promocija novih proizvoda na stranicama brandova društvene mreže Facebook 29
Slika 18: Zid branda na društvenoj mreži Facebook ........................................................... 30
Slika 19: Fotografije na stranici branda ............................................................................... 32
Slika 20: Informacije na stranici branda .............................................................................. 32
Ispis 21: Dohvaćanje podataka sa zida stranice branda ....................................................... 33
Slika 22: Obrazac uporabe za analizu promocije brandova na društvenoj mreži Facebook 34
2
Slika 23: Sekvencijski dijagram za akciju prijave na sustav ............................................... 35
Slika 24: Implementirano sučelje aplikacije brand za prijavu na sustav ............................. 35
Slika 25: Ispis pogreške kod prijave na sustav za analizu brandova ................................... 36
Slika 26: Unos podataka branda u obrazac implementirane web-aplikacije ....................... 37
Slika 27: Unos linka u obrazac implementirane web-aplikacije ......................................... 37
Slika 28: Popunjena polja obrasca za unos branda putem prethodno predanog linka ......... 38
Slika 29: Sekvencijski dijagram za dohvaćanje podataka sa poslužitelja Facebook .......... 38
Slika 30: Web-aplikacija započinje dohvaćanje podataka sa Facebook-brands stranice ... 39
Slika 31: Prikaz obavijesti o uspješnom dohvaćanju podataka s Facebook-brand stranice 39
Slika 32: Sekvencijski dijagram spremanja dohvaćenih podataka u bazu podataka ........... 40
Slika 33: Prikaz Excel datoteke u sučelju implementirane web-aplikacije za brand Konzum
............................................................................................................................................. 41
Slika 34: Sekvencijski dijagram za procesiranje podataka .................................................. 42
Slika 35: Prikaz statističkog skupa po tipovima objava u Excel datoteci za brand Konzum
............................................................................................................................................. 42
Slika 36: Prikaz statističkog skupa za provedbu složene analize varijanci ......................... 43
Slika 37: Prikaz statističkog skupa za regresijsku analizu .................................................. 48
Slika 38: Prikaz grupiranja objava po tipovima za brand Konzum ..................................... 49
Slika 39: Prikaz rezultata regresije za objave tipa video ..................................................... 50
Slika 40: Prikaz tablice predviđenih vrijednosti broja lajkova za objave tipa video branda
Konzum ............................................................................................................................... 51
Slika 41: Prikaz vrijednosti regresijskog koeficijenta ......................................................... 52
Slika 42: Prikaz linearnog regresijskog pravca ................................................................... 52
Slika 43: Prikaz tablice za izračun složene analize varijanci .............................................. 54
Slika 44: Prikaz rješenja složene analiza varijanci za brand Konzum ................................ 55
3
Uvod
Suvremeni način života koji je popraćen velikim brojem statističkih analiza u
kratkom vremenskom roku, predstavlja ljudima nedostatak vremena. Pokazala se potreba
za što efikasnije, preciznije i kvalitativno prikupljanje potrebnih informacija. Rast količine
informacija u današnje doba bilježi eksponencijalni rast. Takva velika količina podataka
predstavlja za većinu korisnika veliki problem u njihovom snalaženju i analizi. Najčešće
analize takvih količina podataka su na niskoj razini apstrakcije i ne pružaju željene
informacije koje bi otkrile uzrok određenog rasta ili pada u nastalim konkluzijama.
Rješenje za navedene probleme možemo pronaći u modelima za analizu sadržaja koji
analiziraju cjelokupni generirani sadržaj i predočavaju razloge rasta ili pada u statistici.
Globalna popularnost društvenih mreža omogućila je pristup osobnim
informacijama i informacijama uvjetovanim ponašanjem korisnika putem inteligentnih
sustava. Inteligentni sustavi metodama određenog modela analize sadržaja rade usporedbe
podataka i vrše prezentaciju rezultata analize. Time je postavljen osnovni temelj analize
sadržaja prema unaprijed odabranom modelu. Model analize sadržaja predstavlja pouzdanu
i činjeničnu informaciju jer se analiza temelji na verificiranim i pouzdanim metodama
modela.
U završnome radu analiziran je i implementiran sustav za analizu brandova na
društvenoj mreži Facebook. Analiza brandova na društvenoj mreži temelji se na djelovanju
korisnika i njihove interakcije sa stranicama brandova na društvenoj mreži Facebook.
Implementirani model u završnom radu temelji se na kvalitativnoj analizi sadržaja koja
uključuje bilo koju vrstu analize gdje je sadržaj kategoriziran i klasificiran.
U poglavljima 1 i 2 opisana je analiza sadržaja, vrste analize sadržaja i metode analize
sadržaja na društvenim mrežama. U poglavlju 3 su opisani svi izvori društvenih podataka i
načini korištenja istih prilikom izrade završnog rada. U poglavlju 4 opisana je implementacija
sustava za preporuku i primjer korištenja implementirane aplikacije Brands. Opisani su i
implementirani modeli za analizu sadržaja koji koriste opisane izvore podataka. Rad završava
zaključkom i najavom mogućih budućih istraživanja.
4
1. Analiza sadržaja
Analiza sadržaja je metoda temeljena na društvenim znanostima koja služi za
proučavanje svrhe, učinke i utjecaje komunikacije, međudruštvene integracije i
degradacije, predikcije pojedinih djelovanja i služi za sustavnu reprezentaciju prikupljenih
podataka. Američki sociolog Earl Babbie [1] definirao je analizu kao učenje o zabilježenim
ljudskim komunikacijama kao što su knjige, web stranice, slike i zakoni. Potpuniju
definiciju analize sadržaja iznio je akademik Ole Holsti [2] koji analizu definira kao bilo
koji način za izradu zaključaka tako da objektivno i sustavno identificira određena obilježja
poruke. Analiza sadržaja smatra se također školskom metodologijom u društvima kod
kojih su tekstovi proučavani prema autorstvu, autentičnosti i značenju. U samim počecima
analiza se smatrala metodologijom za pobijanje hipoteza. Time je postala poznata kao
tehnika analize sadržaja. Ona omogućuje uključivanje velikih količina tekstualnih
informacija (npr. objava na Facebook stranicama) i sistematično identificiranje njegovih
karakteristika (npr. frekvencija pojavljivanja nekih ključnih riječi, kao ime pojedine osobe,
u objavama na stranicama Facebooka).
Od 1980-tih [3] analiza sadržaja postala je važan alat u procjeni medijskih profila.
Time je analiza sadržaja element medijske procjene ili medijske analize. U analizama ovih
kategorija, podaci iz analize sadržaja obično su kombinirani s medijskim podacima (npr.
broj obožavatelja, broj likeova, broj objava, broj gledatelja ...). Također je korištena za
predviđanje i identificiranje trendova. S gledišta procjene, analiza sadržaja je
kvaziprocjeniteljska, jer odluke analize sadržaja ne moraju se bazirati na vrijednosti izjava,
ako subjekt istraživanja u prvi plan stavlja subjektivne doživljaje (npr. da li nam se sviđa
stranica branda na Facebooku). Dakle, mogu biti temeljene na znanju svakodnevno
proživljenih iskustava. Takvu analizu sadržaja ne smatramo procjeniteljskom. Odluke
analize sadržaja temeljene na vrijednostima, kao što su studije, su procjeniteljske (npr.
znanstveno utemeljen model za analizu sadržaja prikupljenih s Facebook-brands stranica1).
1 Facebook-brands stranica – stranica profila branda na Facebooku, primjer:
https://www.facebook.com/Konzum
5
Napraviti zaključke o
prethodnicima
komunikacije
Opisati i napraviti zaključke
o karakteristikama
komunikacije
Napraviti zaključke o
učincima komunikacije
Kategorije analize sadržaja
1.1. Primjena analize sadržaja
Prema akademiku Ole Holstiu [2] postoje petnaest osnovnih primjena analize
sadržaja unutar društvene domene, uključujući i društvene mreže. Sve primjene svrstao je u
kontekst osnovne komunikacijske paradigme. Prema tome sve primjene analize sadržaja
možemo svrstati u tri osnovne kategorije:
napraviti zaključke o prethodnicima komunikacije;
opisati i napraviti zaključke o karakteristikama komunikacije;
napraviti zaključke o učincima komunikacije.
Zbog niske razine apstrakcije pojedine primjene analize sadržaja mogu biti unutar više
kategorija istovremeno (Slika 1).
Sljedeća tablica prikazuje primjene analize sadržaja u smislu njihove opće namjene,
elemenata komunikacijske paradigme na koju se primjenjuju i osnovnog pitanja na koje se
namjeravalo odgovoriti (Tabela 1).
Slika 1: Kategorije analize sadržaja
6
Tabela 1. Svrha korištenja analize sadržaja, komunikacijski element i pitanje.
Svrha korištenja analize sadržaja, komunikacijski element i pitanje
Svrha Element Pitanje Korištenje
Napraviti
zaključke o
prethodnicima
komunikacije
Izvor Tko? Odgovoriti na pitanja osporavanih
autorstva
Proces
kodiranja
Zašto? Osigurati vojne i obavještajne službe
Analizirati utjecaje individualaca
Izvoditi zaključke o kulturnim
aspektima i promjenama
Pružiti legalne i procjenjive dokaze
Opisati i napraviti
zaključke o
karakteristikama
komunikacije
Kanal Kako? Analizirati tehnike uvjeravanja
Analizirati stil
Poruka Što? Pisati trendove u sadržaju
komunikacije
Povezati poznate karakteristike izvora
sa porukama koje oni stvaraju
Usporediti sadržaj komunikacije sa
standardima
Primatelj Kome? Povezati poznate karakteristike
publike sa porukama stvorenim za nju
Opisati uzorke komunikacije
Napraviti
zaključke o
učincima
komunikacije
Proces
dekodiranja
S kojim
efektom?
Izmjeriti čitljivost
Analizirati tijek informacija
Ocijeniti odgovore komunikacije
7
1.2. Proces analize sadržaja
U počecima, koristeći prve novine krajem 19. stoljeća, analiza sadržaja radila se
ručno, mjerenjem broja linija i dodijeljenoj količini medijskog prostora pojedinom
predmetu. Razvojem računalnih tehnologija, najviše osobnih računala, popularnost
računalnih metoda temeljenih na analizi je u eksponencijalnom porastu. Time svi sadržaji
komunikacije u strojno čitljivom obliku mogu postati objekti sustavne analize tekstualnih
podataka. Samim time sav sadržaj generiran od strane korisnika u strojno čitljivom obliku
može biti sustavno analiziran sa bilo kojom metodom analize sadržaja.
Kod procesa analize sadržaja bitno je razlikovati stvarno i latentno značenje riječi,
rečenica ili samih dijelova tekstova. Sadržaj generiran od strane autora ili govornika
predstavlja njegov „manifest“ [3]. Manifest opisuje što je definitivno napisano, dok
latentno značenje predstavlja što je autor želio reći, odnosno napisati. Latentno značenje
predstavlja rizik kod analize sadržaja jer ne predstavlja činjenično, već fiktivno stanje koje
nama nije dostupno. Zbog toga analize sadržaja mogu biti primijenjene samo na manifesni
sadržaj: riječi, rečenice i dijelove teksta.
Na sljedećoj slici (Slika 2) možemo vidjeti primjer obmane manifestom. Naftne
kompanije su iznijele manifest o ograničenosti nafte u što nisu bili sigurni (najnovije
studije upravo pokazuju neograničenost nafte). Ipak analitičari u ekonomiji uzeli su samo
manifest o ograničenosti nafte (izneseno činjenično stanje), te je time cijena barela nafte
120 dolara, a ne realnih 70-75 dolara [4].
Možda neće
nestati.
Manifest
Nafte ima u
ograničenim
količinama.
Analiza
ANALIZA
Analiza
Slika 2: Manifesno i latentno značenje podataka u analizi sadržaja
8
Također iznimno važno kod procesa analize sadržaja je obraćanje pozornosti na
šest osnovnih pitanja analize [3]:
Koji podaci su analizirani?
Kako su definirani?
Koji je uzorak populacije iz koje su oni izvučeni?
U kojem su kontekstu analizirani ti podaci?
Koje su granice analize?
Koji je cilj zaključaka?
Na primjeru društvene mreže Facebook, podaci koji će biti analizirani su dijeljenja
informacije između korisnika koji su definirani preko korisničkog profila ili „fan page“
stranica. Uzorak populacije se može ograničavati na brandove pojedine države. Kontekst
analize podataka može biti rangiranje brandova na društvenoj mreži Facebook po
unaprijed određenim parametrima. Granice analize određuje količina podataka koji su
dostupni. Cilj zaključaka je ispis rangiranih brandova na društvenoj mreži Facebook.
1.3. Pouzdanost u analizi sadržaja
Pouzdanost u bilo kojem obliku istraživanja je stupanj točnosti analize rezultata
koji se dobivaju nizom mjerenja. Svojstva pouzdanosti u analizi sadržaja su dosljednost i
ponovljivost. Neke vrste pouzdanosti su [3] :
unutarnje vrednovanje
o različite skupine ispitanika, ali isti test;
ponavljajući testovi
o ista skupina ispitanika je ispitivana u različitim vremenskim trenucima;
paralelni oblici
o različite skupine ispitanika u istim vremenskim trenucima pristupaju
istom testu;
unutarnja dosljednost
o postavljaju se različito oblikovana pitanja sa istim značenjem.
9
2. Analiza sadržaja na društvenim mrežama
Društvene mreže predstavljaju pristupačni internetski servis koji istovremeno
uključuje i tehnologiju i društvenu interaktivnost. Najčešće su zasnovane na internetskim i
pokretnim tehnologijama.
Društvene mreže osim međusobne povezanosti između više korisnika imaju svoju
ulogu u marketingu i promociji [3]. Marketing i promocija su noviji termini na društvenim
mrežama koji iz dana u dan dobivaju sve veći značaj. Mjerenje uspješnosti učinaka
marketinga i promocije vrši se upravo analizom sadržaja na društvenim mrežama. Bitan
čimbenik koji utječe na uspješnost učinaka marketinga i promocije je društveni utjecaj.
Društveni utjecaj definiran je sa četiri elemenata [3] koji su prikazani na slici (Slika 3):
Izvori;
Konverzije;
Stranice;
Dodaci za društvene mreže.
Izvori
Stranice Konverzije
Dodaci za društvene
mreže
Društveni
utjecaj
Slika 3: Elementi društvenog utjecaja na društvenim mrežama
10
Izvori predstavljaju cjelokupni sadržaj generiran na društvenim mrežama. Pri čemu
izvorom se ne smatra sadržaj koji nije dostupan drugim korisnicima. Sadržaj se međusobno
razlikuje po tipu i po značenju. Tipovi sadržaja mogu biti: video, slika, audio i običan
tekst. Sadržaj po svojoj semantici postaje jedinstveni između ostalih sadržaja, a određuje
samu informaciju i njezinu primjenu.
Konverzije predstavljaju interakcije na društvenim mrežama. Interakcije mogu biti
između korisnika preko međusobne komunikacije ili preko dijeljenja sadržaja jedne
društvene mreže u drugoj društvenoj mreži. Mjerenjem tog prometa može se steći bolji
uvid u društveni utjecaj na društvenim mrežama.
Stranice predstavljaju mjesta na društvenim mrežama na kojima korisnici u sve
većoj mjeri stupaju u interakciju sa sadržajem, dijele ga i raspravljaju o njemu. Ako
uzmemo na primjer Facebook tada postoje tri vrste stranica na kojima korisnici dolaze u
interakciju sa sadržajem:
korisnički profil (Slika 5);
fan page stranice (Slika 6);
naslovna stranica (Slika 7).
Dodaci za društvene mreže predstavljaju dodatne mogućnosti koje nude društvene
mreže. Ponuđene dodatne mogućnosti imaju za cilj olakšati dijeljenje sadržaja sa drugih
internetskih lokacija na društvenu mrežu ili obratno. Kao primjer možemo uzeti Googleov
gumb „+1“ (Slika 4) koji označava dijeljene sadržaja sa drugih internetskih lokacija na
društvenu mrežu Google+.
Slika 4: Google +1 tipka za dijeljenje sadržaja
11
Slika 5: Stranica profila na društvenoj mreži Facebook
Slika 6: Stranica branda na društvenoj mreži Facebook
12
Slika 7: Naslovna stranica društvene mreže Facebook
13
2.1. Metode analize sadržaja na društvenim mrežama
Analiza sadržaja na društvenim mrežama usko je vezana uz znanstvenu disciplinu
ekonometrije. Ekonometrija je relativno mlada grana ekonomske znanosti koja se
intenzivnije počinje razvijati tridesetih godina prošlog stoljeća [5].
Cilj metodologije ekonometrijskih istraživanja je, u biti, povezivanje ekonomske
teorije i stvarnih podataka, koristeći teoriju i tehnike inferencijalne statistike kao spone
između njih. Ekonometrija se može definirati kao društvena znanost u kojoj se
instrumentarij ekonomske teorije, matematike i inferencijalne statistike primjenjuje u
analizi ekonomskih fenomena.
Ekonometrija se razlikuje od matematičke ekonomije koja se bavi kvantitativnim
utemeljenjem ekonomske teorije i proučavanjem odnosa između ekonomskih varijabli i pri
tome koristi suvremeni matematički aparat i jezik. Matematička ekonomija ne traži
verifikaciju konkretnim empirijskim mjerenjem, ocjenjivanjem i testiranjem parametara u
relacijama koje definira. Verifikaciju parametra u definiranim relacijama traži upravo
ekonometrija. To znači da se ekonometrija oslanja na matematičku ekonomiju pri
specifikaciji relacija, ali joj je osnovni cilj mjerenje, ocjenjivanje i testiranje relacija na
temelju stvarnih opažanja.
Ekonometrija zapravo vrednuje u kojoj mjeri je ekonomska teorija konzistentna sa
stvarnim podacima. Omogućuje dublje promicanje u bit stvarnih pojava i procesa, a
vrednovane ekonometrijske relacije i modeli mogu poslužiti za definiranje ekonomskih
parametara potrebnih za predviđanje tendencija budućih kretanja vrijednosti međusobno
ovisnih ekonomskih varijabli. Ako u svojoj analizi uključuje sredstva i rezultate
istraživanja teorijske ekonometrije tada prerasta u primijenjenu ekonometriju. Primijenjena
ekonometrija koristi ekonometrijske metode u istraživanjima primijenjenim u okvirima
određenih ekonomskih područja. Neke od ekonometrijskih metoda su:
Regresija;
Višestruka regresija;
Faktorska analiza;
Složena analiza varijanci.
14
2.2. Regresija
Regresijska analiza je najčešće korištena metodologija u ekonometriji, a bavi se
opisivanjem ovisnosti jedne varijable o jednoj ili više drugih varijabli. Varijabla od
primarnog interesa, čije se varijacije objašnjavaju pomoću varijacija drugih varijabli,
naziva se zavisnom (regresand) varijablom, a varijable kojima se objašnjavaju varijacije
zavisne varijable nazivaju se nezavisnim (regresorskim) varijablama [6].
Model kojim se izražava stohastička (statistička) povezanost između zavisne
varijable i odabranog skupa nezavisnih varijabli je regresijski model. Pod regresijskim
modelom podrazumijevana klasa stohastičkih modela izraženih jednom jednadžbom u
kojima je zavisna varijabla 'y' predočena kao linearna ili nelinearna funkcija varijabli X1,
X2, ... , Xk.
Stohastička povezanost između 'y' i X1, X2, ... , Xk karakterizirana je time da za
svaki vektor opaženih vrijednosti nezavisnih varijabli [Xi1, Xi2, ... , Xik] postoji distribucija
vrijednosti zavisne varijable. Da bi se taj odnos formalno opisao, u model se uvodi slučajna
varijabla ili greška relacije koja se zbraja ili množi s funkcionalnim dijelom modela [5]:
y = f(X1, X2, ... , Xk) + ε, y = f(X1, X2, ... , Xk) * ε. (2.2.1)
Varijabla 'y' naziva se regresand, endogena ili na primjer output varijabla, dok se varijable
s desne strane jednakosti X1, X2, ... , Xk nazivaju još i regresorskim, egzogenim ili na
primjer input varijablama. Varijabla ε je slučajna varijabla koja daje odabranom modelu
stohastički karakter.
Model jednostavne linearne regresije izražena je stohastička linearna veza između
zavisne varijable 'y' i nezavisne varijable 'x' , koja se može formalno opisati izrazom:
y = f(x) + ε. (2.2.2)
U (2.2.2) f(x) je linearna funkcija varijable 'x', tj.:
f(x) = β0 + β1x (2.2.3)
pri čemu su β0 i β1 nepoznati parametri. β1 opisuje marginalni utjecaj varijable x na zavisnu
varijablu y, odnosno β1 je apsolutna promjena varijable y uzorkovana apsolutnim
jediničnim porastom varijable x. ε je vektor slučajnih varijabli koje još nazivamo greškama
relacije (eng. error term).
15
Zadatak regresijske analize je da se pronađu procjene nepoznatih parametara
(procjena vektora β) i procjena nepoznate varijance σ2 slučajnih varijabli εi. Za
određivanje procjena pretpostavka o normalnosti distribucije slučajnog vektora nije bitna.
Ta je pretpostavka važna u kasnijim koracima analize kako bi se odredila distribucija
procjenitelja i proveli postupci testiranja hipoteze o modelu.
Za određivanje nepoznatih parametara koriste se različite metode. Najčešće
korištene metode su:
metoda najmanjih kvadrata;
metoda momenata;
metoda najveće vjerodostojnosti.
U narednom primjeru bit će opisana metoda najmanjih kvadrata koja je najčešće
upotrebljavana metoda za procjenu nepoznatih parametara u modelima regresije.
Primjer 2.1
Analizira se prolaznost predmeta Vjerojatnost i statistika na Fakultetu
elektrotehnike i računarstva u ovisnosti o prosječnom broju sati samostalnog učenja
gradiva svih studenata. Podaci se odnose na raspon učenja od jednog sata, pa sve do 7
sati koliko je i preporučeno prema broju ECTS bodova. Prosječan broj sati je
neovisna o bilo kojim drugim parametrima sustava, dok prolaznost predmeta ovisi o
uloženom vremenu učenja gradiva. U Tablici 2 nalaze se podaci za promatrani
primjer regresije. U prvom stupcu je broj sati, u drugome stupcu je ukupna
prolaznost dok u zadnjem retku nalazi se suma pojedinog stupca. Svi navedeni podaci
u Tablici 2 su fiktivni i ne podliježu nikakvoj stvarnoj raspodijeli.
Odabran je model jednostavne linearne regresije. Varijable modela su:
y = prolaznost predmeta za određeni prosječni broj učenja, zavisna
varijabla;
x = prosječan broj sati učenja za predmet Vjerojatnost i statistika, nezavisna
varijabla.
16
Tabela 2: Prosječni broj sati učenja i prolaznost na predmetu Vjerojatnost i statistika
Prosječan broj sati učenja - xi (h) Ukupna prolaznost - yi (%)
1 20
2 35
3 47
4 64
5 75
6 89
7 95
SUMA: 28 330
Prvi korak je računanje vrijednosti regresijskih koeficijenata procijenjenog modela:
y' = β0' + β1'x + ε. (2.2.4)
Za vrijednosti iz tablice dobivene su vrijednosti parametara regresijskog modela:
β1' = 27.71;
β0' = -63.71.
Regresijski koeficijent β1' pokazuje da će se na temelju procijenjenog modela, za
povećanje prosječnog broja sati učenja prolaznost povećati za 27.71%. Konstantni član β0'
rijetko se interpretira u modelu i često ima suvislo značenje. Njegova uloga je povezana s
jednadžbom regresijskog pravca. Naime ako nemamo konstantni član tada pravac uvijek
prolazi kroz središte, što je često nerealna pretpostavka.
17
2.3. Višestruka regresija
Višestruka (multipla) regresija je posebna vrsta osnovne regresije. Kao i osnovna
regresija sa jednom nezavisnom varijablom (regresorom) i višestruka regresija se sastoji od
jedne primarne zavisne varijable (regresand) [6]. Za razliku od osnovne regresije,
višestruka regresija sastoji se od dviju ili više varijabli kojima se objašnjavaju varijacije
zavisne varijable, a nazivaju se nezavisnim varijablama (regresorskim).
Model višestruke regresije temelji se na linearnim vezama između zavisne varijable
y i skupa nezavisnih varijabli xi. Linearni model višestruke regresije je:
y = β0 + β1x1 + β2x2 + ... + βjxj + ... + βkxk + ε. (2.3.1)
U (2.3.1) y je zavisna, regresand, endogena ili output varijabla , a x1, x1, ... , xk su
nezavisne, regresorske, egzogene ili input varijable, β0, β1, ... , βk su nepoznati parametri, a
ε je slučajna varijabla (tzv. greška relacije). Regresijski koeficijenti pokazuju prosječnu
promjenu zavisne varijable u originalnim jedinicama mjere kada odgovarajuća nezavisna
varijabla poraste za jednu jedinicu, uz uvjet da su sve ostale neovisne varijable
neizmijenjene. Najčešća metoda za procjenjivanje regresijskih koeficijenata je metoda
najmanjih kvadrata. Procjenjivanje regresijskih koeficijenata mora prethodno zadovoljavati
nekoliko polaznih pretpostavki za model višestruke regresije:
veza između zavisne varijable i odabranog skupa nezavisnih varijabli je
linearna;
regresorske varijable su nestohastičke, te su stoga nezavisne o greškama
relacije εi, i = 1, ... ,n;
greške relacije su međusobno nezavisne;
varijable xi međusobno su nezavisne.
Za višestruku regresiju s dvije regresorske varijable , tj. za k = 2, linearni model je sljedeći:
y = β0 + β1x1 + β2x2. (2.3.2)
U sljedećem primjeru (Primjer 2) bit će korišten upravo linearni model sa dvije
regresorske varijable. Predstavljani model u primjeru zadovoljava sve navedene
pretpostavke modela višestruke regresije.
18
Primjer 2.2
Predmet regresijske analize je ostvaren promet na društvenoj mreži Facebook u
razdoblju od 2004 do 2012 [15]. Svi podaci u Tablici 3 su fiktivni i nisu povezani sa
mogućom stvarnom raspodjelom. Varijable modela su:
y = ostvareni promet na Facebooku u milijunima, PROMET – zavisna
varijabla;
x1 = broj posjećenosti drugih stranica (drugih korisničkih profila) na
Facebooku , STRANICA – nezavisna varijabla;
x2 = indeks vremena u minutama provedenog na Facebook društvenoj
mreži, IND_TF – nezavisna varijabla.
Podaci su navedeni u Tablici 3.
Tabela 3 : Ostvareni promet na društvenoj mreži Facebook
Godina Stranica Promet IND_TF
2004 12919 2816,625 79,2
2005 12139 2649,857 83,9
2006 11529 2781,05 95,5
2007 11190 2839,454 97
2008 13082 3242,059 100
2009 12725 3428,835 103,8
2010 13364 3736,535 108
2011 12772 3826,388 109,6
2012 12183 3980,57 111,7
Iz navedenih podataka u tablici 3 dobivamo sljedeće regresijske koeficijente :
β0 = -4193,3680;
β1 = 0,2913;
β2 = 38,4687.
19
Procijenjena jednadžba glasi:
y = -4193,3680 + 0,2913x1 + 38,4687x2. (2.3.3)
Prvi regresijski koeficijent koji iznosi 0,2913 govori nam ako se poveća broj posjećenosti
drugih stranica za jedan, a indeks provedenog vremena na Facebooku ostane
nepromijenjen, promet će se u prosjeku povećati za 0,2913 milijuna. Drugi regresijski
koeficijent koji iznosi 38,4687 tumači se kao prosječno povećanje vremena provedenog na
Facebooku za povećanje indeksa IND_TF za jedan, uz pretpostavku da je broj posječenosti
drugih stranica konstantan. Svi podaci predočeni ovdje dobiveni su uvrštavanjem u
program za izračun višestruke regresije eViews 7.2 2 (Slika 8).
Slika 8: eViews 7,2
2eViews 7,2 – statistički program za izračun regresijskih modela (http://www.eviews.com).
20
2.4. Faktorska analiza
Faktorskom se analizom ispituju međuzavisnosti unutar velikog broja varijabli, te
ih se nastoji objasniti pomoću malog broja zajedničkih faktora. Ubraja se u metode
međuzavisnosti, a primjenjuje se [7]:
za redukciju podataka;
za otkrivanje strukture povezanosti među varijablama, odnosno za
klasifikaciju varijabli.
Osnovni cilj faktorske analize je sažeti informacije sadržane u velikom broju
izvornih varijabli u manji broj zajedničkih faktora uz minimalan gubitak informacija, te
postići bolje razumijevanje odnosa među varijablama. Međuodnos varijabli utvrđuje se
korelacijom sa kojom započinje multivarijantna analiza. Povezanost između dviju varijabli
može biti različitog stupnja. Može biti pozitivna i negativna. Stupanj povezanosti se
iskazuje koeficijentom korelacije, a koji se kreću u rasponu od -1 preko 0 do +1. Vrste
korelacija su:
pozitivna korelacija (Slika 9);
negativna korelacija (Slika 9);
savršeno pozitivna korelacija (Slika 10);
savršeno negativna korelacija (Slika 10);
nepostojeća korelacija (Slika 11).
Slika 9: Na desnoj strani je prikaz pozitivne, a na lijevoj strani negativne korelacije
21
Slika 10: Desno je prikazana savršeno pozitivna, a na lijevoj savršeno negativna korelacija
Slika 11: Nema korelacije (nepostojeća korelacija)
Jedna od osnovnih pretpostavki za primjenu faktorske analize je mjerenje podataka
na intervalnoj skali. No u empirijskim se istraživanjima često javlja problem mjerenja
varijabli, na primjer različite izjave ispitanika, njihova mišljenja, stavovi i slično. Problem
se u takvim slučajevima rješava traženjem od ispitanika da na skali od npr. 1 do 7 procjene
svaku navedenu izjavu, pri čemu 1 bi označavalo „uopće se ne slažem se s navedenom
izjavom“, a 7 „izrazito se slažem s navedenom izjavom“. Ovakva skala je ordinalna, ali
ipak se može smatrati intervalnom ako se polazi od pretpostavke da su intervali na skali
jednaki. Empirijska istraživanja često koriste ordinalne skale, ali prikupljeni podaci
analiziraju se na način kao da su prikupljeni na intervalnoj skali.
22
2.5. Složena analiza varijacije
Složena analiza varijance je statistički postupak koji se primjenjuje u onim
slučajevima kada uspoređujemo rezultate više zavisnih varijabli unutar više nezavisnih
varijabli koje imaju različite razine ili kategorije. Postoje dva osnovna tipa analize
varijance [9] :
osnovna analiza varijance;
složena analiza varijance.
Jednostavna analiza varijance ima samo jednu zavisnu varijablu koja se promatra u
definiranom modelu. Za razliku od osnovne, složena analiza varijance promatra utjecaj
većeg broja nezavisnih varijabli na zavisnu. Osim toga gledamo i međudjelovanje
(interakciju) između većeg broja zavisnih varijabli.
U slučaju kada se podaci mogu podijeliti duž dvije različite dimenzije (faktora),
složena (dvofaktorska) analiza varijacije daje nam odgovor na tri pitanja:
1) Postoji li statistički značajan utjecaj prvoga faktora na zavisnu varijablu
(zanemarujemo mogući utjecaj drugoga faktora)?
2) Postoji li statistički značajan utjecaj drugoga faktora na zavisnu varijablu
(zanemarujemo utjecaj prvoga faktora)?
3) Postoji li statistički značajna interakcija između promatrana dva faktora, tj.
utječu li „istovremene“ promjene u oba faktora statistički značajno na
promjene zavisne varijable?
Primjer 2.3
U tablici su zadani podaci o utjecaju konzumiranja čokolade na broj bodova na testu
iz matematike (16 ispitanika). Ispitanici su na temelju dviju dimenzija (spol: muški i
ženski; količina konzumirane čokolade sate vremena prije pisanja testa) podijeljeni u
4 jednakobrojne grupe. Treba odgovoriti na sljedeća pitanja:
1) Postoji li statistički značajan utjecaj konzumirane čokolade na sposobnost
rješavanja matematičkih zadataka (zanemarujući spol)?
2) Postoji li statistički značajan utjecaj spola na sposobnost rješavanja
matematičkih zadataka (zanemarujući konzumiranu čokoladu)?
23
3) Postoji li statistički značajna interakcija između spola i količine konzumirane
čokolade pri utjecaju na sposobnost rješavanja matematičkih zadataka?
Obrazložite odgovor.
Rješenje:
Rješenje zadatka dobit će se primjenom MS Excela:
1) klikom na Tools odabiremo u padajućem meniju opciju Data Analysis;
2) u dobivenom okviru označavamo proceduru Anova: Two-Factor With
Replication i kliknemo OK.
3) U Input Range upisujemo blok ćelija u kojem se nalaze kvantitativni podaci
koje analiziramo zajedno s naslovnim ćelijama u kojima su upisane
kategorije dva promatrana faktora
4) Pod Rows per sample upisujemo broj redaka u kojima se nalaze podaci o
svakom od uzoraka koje analiziramo.
5) Alpha predstavlja razinu značajnosti (rizika) i u ovom ćemo primjeru mi
uzeti da je ona 0.05.
Vrijednosti ulazne tablice prikazane su u Tablici 4, a rezultat obrade na slici 14.
Tabela 4: Ulazne vrijednosti za analizu varijance
M Ž
100g 40 45
38 42
35 47
42 41
0g 39 30
40 25
38 24
45 20
24
Rezultat obrade dobiven primjenom uređivačkog alata Excel se sastoji od nekoliko
dijelova:
tablica SUMMARY koja sadrži osnovne statističke podatke dobivenih iz tablice;
tablica ANOVA koja sadrži vrijednosti dobivene statističkim izračunima.
Slika 12: Rezultat dobiven s Excelom
Kao rješenje složene analize varijanci uzima se zadnja tablica dobivena u MS
Excelu koja sadrži statističke podatke za analizu. Upravo iz tih podataka dobit ćemo
odgovore na postavljena pitanja.
25
Odgovori:
a) Kao što možemo očitati iz tablice ANOVA (Slika 14) p-vrijednost3 vezana uz
faktor konzumiranja čokolade (pod Sample) iznosi 0,000202. Dakle postoji
statistički značajan utjecaj konzumirane čokolade na sposobnost rješavanja
matematičkih zadataka (zanemarujući spol). Iz deskriptivnih podataka vidimo
da ispitanici koji su sat vremena prije testa pojeli 100g čokolade postižu bolji
rezultat na testu iz matematike od ispitanika koji nisu pojeli čokoladu prije
pisanja testa.
b) Pripadajuća p-vrijednost faktora spola (pod Columns) je 0.006635, što znači
da postoji statistički značajan utjecaj spola na sposobnost rješavanja
matematičkih zadataka (zanemarujući konzumiranu čokoladu). Ispitanici
muškog spola postižu bolje rezultate na testu iz matematike od ispitanika
ženskog spola.
c) P-vrijednost vezana uz interakciju (pod Interaction) iznosi 0.382 * 10-4
.
Zaključujemo da postoji statistički značajna interakcija između spola i
količine konzumirane čokolade pri utjecaju na sposobnost rješavanja
matematičkih zadataka. Ispitanici ženskog spola koji su konzumirali 100g
čokolade sat vremena prije pisanja testa bolje su napisali test od muškaraca
koji su pojeli istu količinu čokolade, dok su žene koje nisu konzumirale
čokoladu znatno gore napisale test iz matematike od muških ispitanika koji
isto nisu konzumirali čokoladu sat vremena prije pisanja testa.
Odgovaranjem na tri osnovna pitanja modela složene analize varijance završava
analiza sadržaja. Daljnja analiza sadržaja temelji se na dobivenim odgovorima. Zbog toga
moramo što konkretnije i točnije razumjeti dobivene statističke podatke u tablici ANOVA.
3 P-vrijednost – određuje prihvaćanje ili odbacivanje hipoteze. Hipoteza se odbacuje u
slučaju kada je vrijednost veća od 0,05, a prihvaća kada je manja. Time je definirana
signifikantnost p-vrijednosti.
26
3. Analiza brandova na društvenoj mreži Facebook
Društvena mreža Facebook osnovana je prije osam godina, no u samome početku
stranice brandova na Facebooku nisu postojale. Facebook-brands stranice javljaju se tek tri
godine kasnije i postigle su veliki uspjeh. Uspjeh Facebook-brands stranica je u uvođenju
poslovnih sustava u društvenu mrežu Facebook. Time Facebook nije namijenjen samo
djeci i studentima za međusobnu interakciju već i za veliki broj poslovnih i financijskih
ustanova. Veliki uspjeh vidio se u povećanju broja korisnika društvene mreže Facebook
koji je nakon tri godine uvođenja brands stranica bio preko 845 milijuna (Slika 13) [14].
3.1. Stranice branda na društvenoj mreži Facebook
Cilj Facebook-brands stranica bio je u povećanju interakcije između korisnika
Facebooka i brandova. Zbog toga velike i male tvrtke počele su stvarati svoje fan-page
stranice kako bi postigle što bolju promociju i što veću interakciju sa svojim fanovima.
Slika 13: Povećanje broja korisnika Facebooka
Broj korisnika
(milijun)
Godina
27
Postavlja se pitanje o učinkovitosti promocije brandova na društvenoj mreži Facebook.
Odgovor na ovo pitanje sadrži tri dijela:
1. Potiče objavljivanje novoga sadržaja i aktivnu interakciju;
2. Pruža bogatiju okolinu za poslovanje;
3. Pruža ozbiljniji uvid u uspješnost poslovanja.
S novim izgledom Facebook stranice (Timeline), stranice branda izgledaju i
ponašaju se kao stranice profila branda [13]. Prije uvođenja Timelina postojao je
Facebook Storefront (Slika 14) koji je bio dostupan kao zasebna usluga dolaskom na
stranicu branda. Putem Storefronta omogućavale su se promocije brandova kroz reklame
[14]. Sada je usluga Storefronta integrirana unutar timelinea (Slika 15). Velika prednost
Storefronta je preglednost sadržaja, no mana je bila slabo stvaranje novog aktivnog
sadržaja, što smanjuje interakciju sa fanovima.
Slika 14: Storefront na društvenoj mreži Facebook
Timeline, koji je nastao 2011. godine, pruža preglednost generiranog sadržaja na
stranicama branda. Osim preglednosti pruža i kategorizaciju sadržaja, tj. odjeljuje sadržaj
generiran od strane fanova i sadržaj generiran od strane branda (Slika 16).
28
Slika 15: Novi Storefront uključen unutar Facebook-Timelinea
Slika 16: Kategorizacija sadržaja na stranici branda
Stranice brandova na društvenoj mreži Facebook daju prodavačima svojih
proizvoda okolinu za predstavljanje i promociju. Prodavači mogu sa novim izgledom
Facebook-brands stranica (Timeline) još više osnažiti prezentaciju svojih proizvoda
fanovima koji su istovremeno potencijalni kupci (Slika 17) [17]. Time stranice branda nisu
više samo stranice za razmjenu sadržaja između branda i fanova već i okolina za uspostavu
poslovnih suradnji i transakcija.
Sadržaj generiran od strane fanova
Sadržaj generiran od strane branda
29
Slika 17: Promocija novih proizvoda na stranicama brandova društvene mreže Facebook
Društvena mreža Facebook nudi svim brandovima statistiku uspješnosti promocije
na Facebook-brand stranicama [12]. U prijašnjoj verziji Facebooka, verzija prije dolaska
timelina, statistika koja je bila namijenjena moderatorima stranica branda na Facebooku,
čekala se do nekoliko dana [9]. Novija verzija Facebooka nudi stvarno-vremensku uslugu
dostave statistika moderatorima stranica branda na Facebooku. Time moderatori mogu
vidjeti uspješnost objava koje su objavili. Pri tome sve objave koje su uspješne prema
dobivenoj statistici mogu postati uz odobrenje moderatora Premium oglas ili samo
popratna sponzorirana priča.
S novim izgledom stranice, kategorizacijom objava, povećanjem generiranja novih
sadržaja, većom integracijom usluga na Facebook-brands stranicama i dostupnosti
podataka omogućena je kvalitetna i kvantitativna analiza sadržaja. Analiza sadržaja koja će
biti provedena uključuje sav kategorizirani sadržaj (slike, objave, statusi, poveznice i
informacije o brandovima) generirane na timelineu stranice branda.
30
3.2. Izvori podataka
Izvori podataka za analizu sadržaja provedenu na društvenoj mreži Facebook
uključuje sve generirane podatke na stranicama brandova. Podaci koji su generirani na
stranici branda su:
objave na zidu („Wall“) (Slika 18);
fotografije (Slika 19);
informacije o brandu (Slika 20).
Slika 18: Zid branda na društvenoj mreži Facebook
Zid branda nudi najviše informacija. Informacije koje se nalaze na zidu su
generirane od strane pristalica branda ili od moderatora stranice branda. Tipovi informacija
koje možemo naći na zidu pojedinog branda su:
statusi ili objave;
fotografije;
video poveznice.
Uvođenjem vremenske crte (Timeline) pojavljuju se novi tipovi koji su nevažni za analizu.
31
Svaku pojedinu objavu korisnik i moderator branda može komentirati ili lajkati.
Time je dostupan broj komentara i lajkova za pojedinu objavu. Upravo ta statistika je
važna za analizu sadržaja. Ovom statistikom možemo mjeriti interakciju između stranice
branda i fanova. Naravno što je veća interakcija između stranice branda i fanova to je veća
popularnost tok branda. Samim time povećava se broj fanova stranice branda. Fenomen
povećanja fanova stranice povećanjem interakcije između fanova i stranice branda može se
pripisati korištenju algoritma za filtriranje objava. Nazivi algoritama su EdgeRank i
GraphRank [10]. EdgeRank i GraphRank su najčešće korišteni algoritmi u društvenim
mrežama za filtriranje velikog broja objava generiranih od korisnika, stranice brandova i
aplikacija. Nama najvažniji algoritam za našu analizu brandova je EdgeRank algoritam koji
odlučuje koje objave smije prikazivati na našoj naslovnoj stranici. Razumijevanje ovog
algoritma može pomoći kod analize povećanja broja pristalica pojedinog branda.
Algoritam svakoj objavi (branda, ostalih korisnika) dodjeljuje vrijednost koja se temelji na:
sklonosti (affinity);
težini (weight) ;
vremenu (time).
Sklonost predstavlja odnos između korisnika i korisnikovog prijatelja ili branda
koji je objavio objavu. Težina predstavlja utjecaj tipa objave, na primjer da li je objavljena
slika ili je samo komentar na drugi status itd. Ova mjera uvodi se zbog stalnog uvođenja
novih medija u Facebook, te se stoga javlja potreba filtriranja prema tipovima objava koje
su zanimljive korisnicima. Treći parametar je vrijeme koje predstavlja koliko dugo je
prošlo od stavljanja objave. Upravo ovaj algoritam je razlog zašto ne vidimo svaku
fotografiju koja se objavi na stranicama brandova koje smo lajkali. Ukoliko je interakcija
između korisnika i stranice branda sve veća tada svaka objava na stranici branda dobiva
sve veću vrijednost sklonosti. Što je veća vrijednost sklonosti to je veća vjerojatnost
prikazivanja te objave na našoj naslovnoj stranici.
Svi podaci na zidu brandova dostupni su preko programskog sučelja koje
predstavlja i razvija Facebook pod imenom Facebook API (Faceboook Aplication
Programming Interface) [16]. Zbog toga moguća je implementacija inteligencije za
analizu sadržaja brandova na društvenoj mreži Facebook.
32
Slika 19: Fotografije na stranici branda
Fotografije na stranicama brandova imaju namjenu povećanja interakcije između
korisnika i branda. Povećanje interakcije moguće je kroz komentiranje, lajkanje slika i
označavanje imena korisnika na slikama. Kroz medij slike brand može pospješiti svoju
prezentaciju i promociju imidža.
Slika 20: Informacije na stranici branda
33
Informacije o brandu (Slika 20) su najmanje značajni dio koji bi mogao povećati
komunikaciju između korisnika i stranice branda. U informacijama se nalaze generičke
osobine samoga branda, a to su:
osnovni podaci
o kada je osnovan brand;
o lokacija branda;
kontakt-informacije
o adresa elektroničke pošte;
o web-stranica;
povijest po godinama;
o brandu;
opis branda.
Podaci i informacije koje su važne za analizu sadržaja provedenu u ovome radu su
podaci sa zida stranice branda. Podaci na zidu stranice branda se razlikuju po tipu, sadržaju
i datumu objave. Primjer djelomičnog dohvaćanja podataka sa zida možemo vidjeti na
ispisu 21 [18].
Ispis 21: Dohvaćanje podataka sa zida stranice branda
34
4. Sustav za analizu brandova na društvenoj mreži
Implementacija inteligencije za analizu promocije brandova na društvenoj mreži
Facebook ima za cilj dohvaćanje podataka koji su potrebni za daljnju provedbu analize
sadržaja. Analizom sadržaja dobivamo potrebne zaključke o razlozima povećanja i
smanjenja interakcije između pristalica branda i stranice branda. Sastavni dijelovi
inteligencije su baza podataka koja ima svrhu spremanja podataka za naknadni prikaz u
obliku grafova i za analizu sadržaja, te sustav za dohvaćanje podataka i njihovog
procesiranja. Sve dijelove inteligencije možemo vidjeti na obrascu uporabe sustava za
analizu promocije brandova na društvenoj mreži Facebook (Slika 22).
Slika 22: Obrazac uporabe za analizu promocije brandova na društvenoj mreži Facebook
4.1. Prijava na sustav za analizu brandova
Preduvjet za početak skidanja podataka s Facebooka je prijava na sustav (Slika
23). Korisnik preko implementiranog sučelja unosi svoje korisničko ime i lozinku (Slika
24). Sustav provjerava u našoj bazi podataka ispravnost unesenog korisničkog imena i
lozinke. U slučaju pogrešnog unosa podataka dobivamo poruku o pogrešci. Ako su uneseni
podaci ispravni, dolazimo do obrasca za popunjavanje podataka o brandu (Slika 26).
35
Slika 23: Sekvencijski dijagram za akciju prijave na sustav
Implementirano sučelje za prijavu na sustav za analizu brandova ima svrhu personalizacije
aplikacije. Ovime se osigurava potpuna anonimnost podataka dobivenih analizom branda
na društvenoj mreži Facebook. Korisnik može samo na vlastitu inicijativu objaviti rezultate
analize dobivene implementiranim sustavom za analizu brandova. Sučelje prima
korisničko ime i lozinku administratora branda.
Slika 24: Implementirano sučelje aplikacije brand za prijavu na sustav
Ukoliko se pokušava prijaviti neovlaštena osoba s krivim korisničkim imenom i lozinkom
ili ovlašteni administrator pogriješi kod unosa podataka dobiva poruku o krivom unosu
36
(Slika 25). Korisnik ima mogućnost neograničeno puta pokušati prijaviti se na sustav, to
jest sve dok ne unese ispravno korisničko ime i lozinku.
Slika 25: Ispis pogreške kod prijave na sustav za analizu brandova
4.2. Dohvaćanje podataka s Facebooka
Glavni sudionik je administrator branda. Uspješnom prijavom administrator branda
je preusmjeren na stranicu koja sadrži obrazac za unos podataka o brandu. Postoje dva
načina unosa podataka. Administrator branda može ukoliko su mu poznati podaci:
ID branda na Facebooku;
ime branda;
ime branda dodijeljeno od Facebooka (Facebook name),
unijeti u obrazac prikazan na slici 26. Za primjer uzeli smo podatke o Facebook-brands
stranice Konzum. Unosom svih podataka implementirana web-aplikacija započinje
dohvaćanje podataka s Facebooka. Unos podataka na ovaj način ne zahtjeva unos
poveznice Facebook-brands stranice Konzuma. Drugi način je unos samo URL-a (eng.
Uniform Resource Locator) Facebook-brands stranice (Slika 27).
37
Slika 26: Unos podataka branda u obrazac implementirane web-aplikacije
Slika 27 prikazuje unos URL-a (eng. Uniform Resource Locator) Facebook-brands
stranice Konzuma u obrazac za unos novoga branda. Nakon unosa možemo pritisnuti samo
tipku Enter ili tipku „Spremi“ za dohvaćanje potrebnih podataka o brandu.
Slika 27: Unos linka u obrazac implementirane web-aplikacije
Implementirani sustav prikuplja podatke o brandu s Facebook poslužitelja. Prikupljene
podatke upisuje u nepopunjena polja obrasca za unos novog branda (Slika 28).
38
Slika 28: Popunjena polja obrasca za unos branda putem prethodno predanog linka
U slučaju nemogućnosti obrade poveznice na stranicu branda pristupa se ručnom unosu
podataka. Ako su podaci navedeni u početnom obrascu ispravni započinje spajanje na
poslužitelj društvene mreže Facebook (Slika 29).
Slika 29: Sekvencijski dijagram za dohvaćanje podataka sa poslužitelja Facebook
Ako je uspješno uspostavljena internetska veza s društvenom mrežom Facebook pritiskom
na tipku „Spremi“ započinje dohvaćanje podataka sa zida stranice branda (Slika 29, Slika
39
30). Na sučelju web-aplikacije prikazuje se traka napretka (eng. Progress bar) koja
prikazuje napredak dohvaćanja podataka. Osim trake napretka prikazuje se vrijeme
početka dohvaćanja podataka.
Slika 30: Web-aplikacija započinje dohvaćanje podataka sa Facebook-brands stranice
Brzina dohvaćanja ovisi o brzini internetske veze i brzini obrade zahtjeva na Facebook poslužitelju.
Definirano ograničenje ne utječe na logiku rada sustava, već na iskustvenu kvalitetu korisnika (eng.
Quality of experience). O završetku dohvaćanja podataka dobivamo obavijest preko sučelja web-
aplikacije (Slika 31).
Slika 31: Prikaz obavijesti o uspješnom dohvaćanju podataka s Facebook-brand stranice
40
Postupnim dohvaćanjem podataka započinje ujedno i njihovo procesiranje (Slika 32) koje se sastoji
od:
zbrajanje svih objava koje su generirane tog dana;
zbrajanje svih komentara, lajkova i dijeljenja koji su vezani za sve objave
tog dana;
grupiranje objava po tipovima;
stvaranje statističkih skupova za statističku analizu;
zapisivanje podataka u Excel datoteku.
Tokom procesiranja podataka dohvaćenih sa stranice branda istovremeno se podaci
sustavno spremaju u bazu podataka (Slika 32). Kada su podaci uspješno spremljeni u bazu
podataka pokreće se proces generiranja statistike koja će biti zapisana u obliku Excel
datoteke. Zapisivanje podataka u Excel datoteku provodi se na kraju procesa analize
podataka. Rezultat zapisivanja podataka u Excel datoteku je statistički skup koji se koristi
u definiranim modelima za analizu promocije brandova na društvenoj mreži Facebook.
Slika 32: Sekvencijski dijagram spremanja dohvaćenih podataka u bazu podataka
Nakon uspješnog stvaranja Excel datoteke, datoteka se pohranjuje u repozitorij koji se
nalazi na poslužitelju. Administrator branda može preko sučelja web-aplikacije (unutar
web-preglednika) dobiti popis svih datoteka koje se nalaze u repozitoriju (Slika 33).
Odabirom Excel datoteke određenog branda pokreće se skidanje istoimene datoteke na
računalo administratora branda.
41
Slika 33: Prikaz Excel datoteke u sučelju implementirane web-aplikacije za brand Konzum
Dohvaćanje i procesiranje podataka su dva osnovna procesa koja se izvode u
implementiranom sustavu. Zbog toga implementirani sustav za analizu promocije brandova
na društvenoj mreži Facebook sastoji se od:
algoritma za dohvaćanje podataka sa Facebooka;
algoritma za procesiranje podataka.
Zadnji dio sustava koji se ne implementira je verifikacija sa stranicom Socialnumbers [19].
Služi za provjeru vjerodostojnosti definiranih modela za analizu sadržaja.
4.3. Procesiranje podataka dohvaćenih s Facebooka
Nakon uspješnog dohvaćanja podataka provodi se njihovo procesiranje (Slika 34).
Proces procesiranja podataka dohvaća podatke koji su spremljeni u bazi podataka.
Dohvaćanjem svih potrebnih podataka započinje analiza i provjera ispravnosti podataka.
Analiza podataka analizira broj lajkova, komentara, dijeljenja pojedine objave. Ako imamo
više objava isti dan tada analiza agregira broj lajkova, komentara i dijeljenja svih objava u
jednu podatkovnu strukturu. U toj strukturi podataka zapisan je i broj objava tog dana.
Procesiranjem svih objava od datuma kad je pokrenuto dohvaćanje podataka do 1.11.2011
završava faza analize i započinje zapisivanje i oblikovanje modela za ekonometrijsku
analizu.
42
Slika 34: Sekvencijski dijagram za procesiranje podataka
Faza zapisivanja radi grupiranje podataka po tipu objava i priprema statističke
skupove. Svi pripremljeni statistički skupovi zapisuju se u Excel datoteku. Statistički
skupovi za pojedini tip objave sastoji se od četiri stupaca u kojima su redom zapisani
datum, broj lajkova, komentara, dijeljenja i objava tog dana (Slika 35). Ovakav statistički
skup namijenjen je provedbi jednostrukog ili višestrukog regresijskog modela.
Slika 35: Prikaz statističkog skupa po tipovima objava u Excel datoteci za brand Konzum
. . .
43
Slika 36: Prikaz statističkog skupa za provedbu složene analize varijanci
. . . . . .
. . .
44
Sljedeći statistički skup sastoji se od dva stupca koji redom sadrže broj lajkova i
komentara svih tipova objava (Slika 36). Po recima prvo slijede objave tipa slika, nakon
toga tipa status i na kraju tipa video. Statistički skup koristi se za provedbu modela složene
analize varijanci. Po završetku zapisivanja u Excel datoteku vraća se poruka o uspješnosti
zapisivanja i završetku rada sustava.
4.4. Baza podataka za analizu promocije brandova
Podatke koje sustav sprema i s kojima radi potrebno je spremati na adekvatan
način, stoga koristimo bazu podataka. Ona pohranjuje podatke i povezuje ih na način da se
eliminira redundancija. Podaci koje sustav sprema koriste se kod daljnje analize promocije
brandova. Tablice baze podataka prikazane su u Tablici 5.
Tabela 5: Prikaz baze podataka sustava za analizu promocije brandova
Entitet Atributi Objašnjenje
BRAND IDBrand
Name
Fname
Network
K={IDBrand}
Atribut IDBrand predstavlja
jedinstveni identifikator branda
dodijeljen od strane Facebooka.
Atribut Name predstavlja ime branda,
dok Fname predstavlja ime branda
napisano unutar URL-a (Uniform
Resource Locator). Atribut Network
predstavlja ime mreže u kojoj
proučavamo promociju branda.
BRAND_INFO IDBrand
More_About
About
Likes
Web_Page
Talking_About
K={IDBrand}
Atribut IDbrand jednoznačno
određuje brand. Ostali atributi
predstavljaju informacije dohvaćene
sa Facebook poslužitelja o tom
brandu.
45
Entitet Atributi Objašnjenje
AGREGACIJA IDBrand
Date
Likes
Comment
Share
Post
K={IDBrand}
Atributom IDBrand određujemo
jednoznačno kome pripadaju zapisane
objave. Sve objave, svih tipova,
pojedinog dana su agregirane u ovoj
tablici. Atributom Date označavamo
datum dana za koji su agregirane sve
objave tog dana. Atributi Likes,
Comment i Share predstavljaju ukupni
broj lajkova, komentara i dijeljenja
tog dana.
VIDEO IDBrand
Date
Likes
Comment
Share
Post
K={IDBrand}
Tablica VIDEO predstavlja broj
lajkova, komentara i dijeljenja svih
objava tipa video agregiranih po danu.
PHOTO IDBrand
Date
Likes
Comment
Share
Post
K={IDBrand}
Tablica PHOTO predstavlja broj
lajkova, komentara i dijeljenja svih
objava tipa video agregiranih po danu.
46
Entitet Atributi Objašnjenje
LINK IDBrand
Date
Likes
Comment
Share
Post
K={IDBrand}
Tablica LINK predstavlja broj
lajkova, komentara i dijeljenja svih
objava tipa video agregiranih po danu.
STATUS IDBrand
Date
Likes
Comment
Share
Post
K={IDBrand}
Tablica STATUS predstavlja broj
lajkova, komentara i dijeljenja svih
objava tipa video agregiranih po danu.
Ovakva relacijska shema baze podataka je u normaliziranom obliku. Uklonjena je
redundancija – anomalije unosa, izmjene i brisanja te neracionalno korištenje prostora za
pohranu. Omogućena je analiza promocije brandova na drugim društvenim mrežama.
Osigurana je skalabilnost sustava povećanjem broja brandova i spremanja novih podataka
za analizu. Podaci o pojedinim tipovima objava međusobno se ne isprepliću. Time je
postignuta podatkovna apstrakcija koja je korisna za međusobne usporedbe podataka.
47
4.5. Model analize brandova na društvenoj mreži
Model analize promocije brandova na društvenoj mreži Facebook provodi se nad
dobivenom Excel datotekom pomoću metoda temeljenih na linearnoj regresiji. Strukturalni
opis Excel datoteke nalazi se u poglavlju 4.3. Sustavnim proučavanjem podataka dobivenih
sa zidova na stranicama Facebooka ustanovljena je mogućnost stvaranja potpuno
pouzdanog modela za analizu promocije brandova. Model koji je implementiran i proveden
u ovoj analizi temelji se na regresiji. Vrijednost korelacijskog koeficijenta
implementiranog modela približno je jednak jedinici. Što je vrijednost korelacijskog
koeficijenta približno jednaka jedinici to je model bolje reprezentativan i pouzdaniji za
daljnju analizu. Kao rezultat implementiranih modela je maksimalno povećanje interakcije
između stranica brandova i pristalica brandova. Dobiveni rezultati su temelj za daljnje
proučavanje promocije brandova na društvenoj mreži Facebook. Implementirani modeli
su:
Regresijski model
o regresijski model za objavu tipa slike;
o regresijski model za objavu tipa video poveznice;
o regresijski model za objavu tipa status;
o regresijski model za objavu tipa poveznice;
o regresijski model za sve vrste objava (agregirane objave);
Model za složenu analizu varijanci
o ovisnost između objava tipa:
status;
video;
slika;
o ovisnost između broja lajkova i broja komentara.
Navedeni modeli biti će objašnjeni u sljedećim poglavljima na primjeru branda
Konzum. Za svaki model biti će prikazana rješenja koja su dobivena implementacijom
sustava za promociju brandova. Svako rješenje biti će analizirano i prokomentirano.
48
4.5.1. Regresijska analiza za promociju brandova na društvenoj
mreži Facebook
Regresijski model temeljen na metodama linearne regresije provodi se nad skupom
podataka dobivenih od svih objava objavljenih do datuma 1.11.2011 za brand Konzum.
Ovaj datum je odabran iz potrebe za što većim skupom podataka. Prema zakonima
statistike što je veći skup podataka modaliteta, to su rezultati statistike više vjerodostojniji.
Kod povećanog modaliteta podataka u statistici pristupa se postupku grupiranja podataka.
U svim prethodno navedenim regresijskim modelima podaci su grupirani prema tipovima
objava. Kod svakog tipa objave gleda se broj:
komentara;
lajkova;
dijeljenja objave drugim korisnicima.
Objave svih tipova generirane na zidovima brandova podliježu nelinearnim
vjerojatnostima generiranja novog sadržaja na Facebooku, što nas dovodi do problema
prevelikog skupa podataka za samo jedan dan. Zbog toga podaci o objavama grupiraju se
po danu. Svaka vrsta objave dobiva svoju vlastitu tablicu u koju se uz broj komentara,
lajkova i dijeljenja dopisuju datum generiranja objave i broj objava generiranih tog dana.
Prikaz konačnog rješenja skupa podataka za regresijsku analizu branda Konzum prikazan
je na slici 37.
Slika 37: Prikaz statističkog skupa za regresijsku analizu
1
. . .
49
Statistički skup za regresijsku analizu generiran je i spremljen u obliku Excel
dokumenta. Generiranje i opis Excel dokumenta dano je u poglavlju 4.3. Svaki pojedini
redak u Excel datoteci (Slika 37, dio 1) označava ukupni broj lajkova, komentara,
dijeljenja i objava pojedinog dana koji je označen datumom. Excel je uređivački alat koji
nudi alate za analizu podataka koji su sadržani u samome dokumentu. Jedina mana
uređivačkog alata Excel je nepodržana podrška za višestruku regresiju. Višestruka
regresija je moguća nad generiranim statističkim skupom podataka. Ipak postoje drugi
uređivački alati kao što su eViews koji ima podršku za izračunavanje višestruke regresije.
Metode analize sadržaja koje su nama važne a podržane su uređivačkim alatom Excel su:
Jednostruka linearna regresija;
Složena analiza varijanci
Cilj jednostruke linearne regresije u našem modelu je pokazati zavisnost između
broja objava koji su generirani u jednome danu i broja komentara ili broja lajkova ili broja
dijeljenja sadržaja. Rezultat regresijske analize trebao bi pokazati vrstu objave koju mora
moderator stranice branda generirati kako bi se interakcija između pristalica branda i
stranice branda povećavala. Interakcija pristalica i stranice branda predstavljena je kroz
broj komentara, lajkova i dijeljenja sadržaja pojedine objave (Slika 37, dio 1).
Statistički podaci grupirani su po vrsti objava na (Slika 38 ):
slike;
video;
poveznica ;
status;
agregirano.
Slika 38: Prikaz grupiranja objava po tipovima za brand Konzum
. . .
50
Razlog grupiranja sadržaja po vrstama objava je dobivanje regresijskog koeficijenta
rasta interakcije po objavi određenog tipa. Ako provodimo regresiju za objavu tipa
(regresijski model za objave tipa video) video stranice branda Konzum između zavisne
varijable (regresand) like koja predstavlja broj lajkova određenog dana i nezavisna
varijabla (regresor) post koja predstavlja broj objava tog tipa određenog dana. Rezultat
regresijske analize prikazan je na slici 39.
Slika 39: Prikaz rezultata regresije za objave tipa video
Na slici 39 dio 1 predstavlja vrijednosti koeficijenata (β) regresije u izrazu 2.2.3. Prvi
koeficijent β0 iz izraza 2.2.3 u ovome primjeru iznosi 1,55, dok β1 iz izraza 2.2.3 iznosi
43,82. Prema izrazu 2.2.3 pravac regresije je sljedeći:
Like = 1,55 + 43,82*Post.
Dio 2 na slici 39 predstavlja tablicu predviđenih vrijednosti broja lajkova (predicted Like) i
odstupanja od stvarne vrijednosti (Residuals). Ako promatramo slučaj pod rednim brojem
1 vidimo da je predviđeni broj lajkova za ni jednu objavu jednak 1,55 (zaokruženo na 2).
Naravno ovo je pogrešno dobivena vrijednost jer ne može se lajkati ukoliko objava ne
postoji. Upravo zbog toga vrijednost β0 se u regresijskim analizama odbacuje. Prema tome
stvarna vrijednost regresijskog pravca je sljedeća:
Like = 43,82*Post. (4.5.1.1)
2
1
3
51
Primjenom regresijskog pravca 4.5.1.1 bez koeficijenta β0 dobivamo preciznije predikcije
broja lajkova za svaku objavu. Na slici 40 je prikazana ispravna tablica vrijednosti
predviđenog broja objava i vrijednosti odstupanja od stvarne vrijednosti.
Slika 40: Prikaz tablice predviđenih vrijednosti broja lajkova za objave tipa video branda Konzum
U 3. dijelu slike 39 prikazane su p-vrijednosti za pojedini koeficijent. Ako su p-vrijednosti
manje od 0,05 tada je iznos koeficijenta dobiven regresijom pouzdan. U suprotnom ako je
p-vrijednost puno veća od 0,05 tada su vrijednosti dobivene regresijom nepouzdane.
Korelacijski koeficijent dobiven analizom približno je jednak jedinici i prema tome
. . .
52
zaključujemo da je provedena analiza reprezentativna i pouzdana. Vrijednost korelacijskog
koeficijenta može se vidjeti na slici 41 [11] :
Slika 41: Prikaz vrijednosti regresijskog koeficijenta
Rezultat provedene regresije je rast broja lajkova po povećanju broja objava.
Dobiveni koeficijent regresije βlike iznosi približno 44 (43,82). Koeficijent predstavlja
nagib linearnog regresijskog pravca iz izraza 2.2.3 kojeg možemo vidjeti na slici 42.
Koeficijent βlike tumači se kao povećanje broja interakcija između Facebook-brands
stranice Konzum i pristalica branda za 16 interakcija generiranjem jedne objave.
Generiranjem dviju objava dogodit će se 32 interakcije.
Slika 42: Prikaz linearnog regresijskog pravca
Analogno izračunavanju koeficijenta βlike izračunavamo koeficijente βcomment i βshare.
Βcomment predstavlja ovisnost broja objava i komentara, a βshare predstavlja ovisnost broja
objava i dijeljenja. Ukupno maksimalno povećanje interakcije po objavi tipa video za
brand Konzum dobivamo zbrajanjem svih dobivenih koeficijenata. Formula za
izračunavanje ukupne maksimalne interakcije po objavi je:
MAX = βlike + βcomment + βshare. (4.5.1.2)
Koeficijent MAX dobiven regresijom predstavlja maksimalno statističko povećanje
interakcije za objavljenu objavu, bez obzira na vrstu interakcije.
53
4.5.2. Složena analiza varijacije promocije brandova na
društvenoj mreži Facebook
Model složene analize varijanci uklanja nedostatak regresijskog modela.
Nedostatak regresijskog modela je nemogućnost usporedbe skupova podataka koji su
međusobno zavisni. Taj nedostatak možemo uočiti u bitnom smanjenju koeficijenta
regresije koji je približno jednak nuli. Takav regresijski model je statistički neprihvatljiv. U
tom slučaju moramo pokušati analizirati podatke sa drugom metodom. Glavna odlika
modela složene analize varijanci je prikazati međusobni utjecaj i interakciju između većeg
broja zavisnih varijabli. Broj lajkova, komentara i dijeljenja međusobno su zavisni (npr.
kada nam se neka objava svidi najčešće uz komentiranje objave dolazi i do lajkanja iste
objave, a u najboljem slučaju i do njenog dijeljenja) u odnosu na tipove objava koji nisu.
Kroz modele složene analize varijanci prikazat ćemo ovisnost povećanja interakcije
između pristalica i stranice branda Konzum o tipu generirane objave. Prikazat ćemo ujedno
i ovisnost između povećanja broja lajkova i broja komentara. Za svaki navedeni model
postojat će generirane tablice sa skupom podataka za provedbu statistike.
Naziv tablice u kojoj se nalazi statistički skup podataka za složenu analizu varijanci
je „Model“ (Slika 43). Statistički skup sadržan u toj tablici uključuje oba navedena modela
složene analize varijanci. Stupci tablice sastoje se od broja lajkova i komentara dobivenih
sa stranica branda Konzum. U recima tablice navedeni su tipovi objava na koje se odnosi
određeni broj lajkova i komentara. Ovakav oblik tablice (Slika 43) je obavezan jer u
suprotnom nećemo moći provesti složenu analizu varijanci.
Pitanja na koje naš model mora odgovoriti su sljedeća:
1. Postoji li statistički značajan utjecaj tipa objave na povećanje interakcije
(zanemarujemo tip interakcije)?
2. Postoji li statistički značajan utjecaj tipa interakcije na povećanje interakcije
(zanemarujemo tip objave)?
3. Postoji li statistički značajna povezanost između tipa objave i tipa
interakcije pri utjecaju na povećanje interakcije?
Zbog ograničenja u uređivačkom alatu Excel možemo proučavati odnos između samo dvije
vrste interakcija i istovremeno samo sa dvije vrste objava. Statistički skup sadrži sve vrste
objava sa ciljem mogućnosti odabira dviju vrsta objava za koje želimo provesti analizu.
54
Slika 43: Prikaz tablice za izračun složene analize varijanci
. . . . . .
. . .
55
Za primjer uzet ćemo objave tipa slika i video Facebook-brands stranice Konzum.
Rješenje dobiveno uređivačkim alatom Excel za složenu analizu varijance prikazano je na
slici 44.
Slika 44: Prikaz rješenja složene analiza varijanci za brand Konzum
Rezultat dobiven sa uređivačkim alatom Excel sastoji se od nekoliko dijelova. Prvi dio
predstavlja općenite informacije za skupove podataka. Skupovi podataka na slici 44 u
oznaci 1 su:
photo (slika);
video.
Deskriptivni podaci u tablicama koriste se za međusobnu usporedbu skupova podataka.
1
2
56
Drugi dio koji je predstavljen tablicom ANOVA predstavlja rješenje dobiveno
složenom analizom varijacija. Pomoću vrijednosti dobivenih u tablici ANOVA dobit ćemo
odgovore na naša postavljena pitanja. Najvažnije vrijednosti koje koristimo tokom
provođenja analize rješenja su P-vrijednosti (Slika 44, dio 2). P-vrijednost određuje
prihvaćanje ili odbacivanje postavljene hipoteze. Ako je P-vrijednost veća od 0,05 hipoteza
se odbacuje, a ako je manja tada se prihvaća.
Odgovori na naša postavljena pitanja su sljedeći:
1) Kao što možemo očitati iz tablice ANOVA (Slika 44) P-vrijednost vezana uz faktor
tipa objave (pod Sample) iznosi 1,97 * 10-58
. Dakle postoji statistički značajan
utjecaj tipa objave na povećanje interakcije na Facebook-brands stranici Konzuma
(zanemarujući tip interakcije). Iz deskriptivnih podataka vidimo da objave tipa slika
(Photo) imaju veću interakciju od objava tipa video (redak Sum).
2) Pripadajuća P-vrijednost faktora tipa interakcije (pod Columns) je 2,01 * 10-17
, što
znači da postoji statistički značajan utjecaj tipa interakcije na povećanje interakcije
na Facebook-brands stranici Konzuma (zanemarujući tip objave). Možemo vidjeti
u tablici Total na slici 44 u retku Sum da lajkovi više doprinose interakciji na
Facebook-brands stranici nego komentari.
3) P-vrijednost vezana uz interakciju (pod Interaction) iznosi 3,3 * 10-11
.
Zaključujemo da postoji statistički značajna interakcija između vrste obajava i broja
lajkova i komentara na stranicama branda. Broj lajkova je veći objavljivanjem
objava tipa slika. Broj komentara je manji od broja lajkova objavljivanjem objava
tipa slika i tipa video. Broj komentara dobivenih objavljivanjem objava tipa slika je
puno veći od broja komentara dobivenih objavljivanjem objava tipa video.
Iz dobivenih odgovora zaključujemo da objave tipa slika najviše povećavaju interakciju na
stranicama branda Konzum. Zavisnost između broja lajkova i komentara ovisi o tipu
objave generirane na stranici branda. Najveći broj lajkova dobit ćemo objavljivanjem
objava tipa slika.
57
Zaključak
Društvena mreža kao platforma danas više ne predstavlja samo medij za
međusobnu interakciju korisnika nego i medij za prikupljanje ciljanih informacija putem
različitih pretplata. Velik broj korisnika usluga društvenog umrežavanja vijesti ili poruke
objavljene posredstvom društvenih stranica nekog branda ne shvaćaju kao reklamu za
određeni brand nego kao zanimljivu obavijest koju su voljni svojevoljno pregledati,
komentirati pa čak i označiti da im se taj sadržaj sviđa (tkz. like). Postavlja se pitanje kako
mjeriti uspješnost promocije branda na društvenim mrežama.
Sustav Brands nastoji primjenom različitih metoda analize sadržaja dobiti potrebne
zaključke o razlozima povećanja i smanjenja broja interakcija između pristalica branda i
Facebook-brands stranice. Izrađen je algoritam za stvaranje modela statistike svih objava
objavljenih na stranicama branda. Algoritam se sastoji od dva osnovna dijela. Prvi dio se
odnosi na dohvaćanje podataka o objavama s Facebook-brands stranica. Dohvaćeni podaci
se predaju algoritmu za njihovo procesiranje i stvaranje statistike. Stvorena statistika o
uspješnosti promocije branda trajno se sprema u bazu podataka. Statistika se temelji na dva
definirana modela dobivenih vlastitim istraživanjima. Administrator branda može stvorene
statističke modele preuzeti preko sustava Brands u obliku Excel datoteke koja je prethodno
stvorena. Primjenom metoda analize sadržaja administrator branda može dobiti povratne
informacije o uspješnosti promocije branda na društvenoj mreži Facebook.
Sustav Brands moguće je unaprijediti novim modelima za analizu sadržaja o
uspješnosti promocije brandova na društvenoj mreži Facebook. Osim društvene mreže
Facebook sustav Brands moguće je proširiti na druge društvene mreže. Širenjem sustava
na druge društvene mreže zahtjeva izradu novih algoritama za stvaranje statistike o
uspješnosti promocije brandova. Za kontinuirano stvaranje novih statistika svakog dana
potrebno je implementirati algoritam dohvaćanja novih podataka sa stranica branda.
Algoritam bi se trebao izvršavati svaki drugi dan tokom noći kada je korištenje društvenih
mreža najmanje. Zbog velike raširenosti i popularnosti pametnih mobilnih uređaja moguće
je izraditi mobilne aplikacije preko kojih će administratoru branda biti u svako doba dana
dostupne statistike o uspješnosti promocije branda.
58
Literatura
[1] E. BABBIE, The Practice of Social Research, Wadsworth, Thomson Learning Inc..,
2007
[2] O. R. HOLSTI: Content Analysis for the Social Sciences and Humanities. Reading,
Addison-Wesley, 1969.
[3] „An Overview of Content Analysis“
http://pareonline.net/getvn.asp?v=7&n=17, Svibanj 2012
[4] W. ENGDAHL, Mitovi, laži i ratovi za naftu, Zagreb, PROFIL KNJIGA d.o.o., 2012
[5] V. BAHOVEC, N. ERJAVEC: Uvod u ekonometrijsku analizu, Zagreb, Element,
2009.
[6] C. DOUGHERTY: Introduction to Econometrics, Oxford, Oxford University Press,
2002.
[7] „Faktorska analiza“
http://web.efzg.hr/dok/sta/vbahovec//Faktorska%20analiza03.pdf, Svibanj 2012.
[8] „Multivariate Analysis of Variance (MANOVA): I. Theory“
http://ibgwww.colorado.edu/~carey/p7291dir/handouts/manova1.pdf, Svibanj 2012
[9] „3 Reasons Facebook Brand Pages are good for Businesses“
http://mashable.com/2012/03/30/facebook-brand-pages-business/, Svibanj 2012
[10] „EdgeRank and GraphRank defined“
http://www.insidefacebook.com/2011/12/27/edgerank-and-graph-rank-defined/,
Svibanj 2012
[11] „EXCEL 2007: Multiple Regression“
http://cameron.econ.ucdavis.edu/excel/ex61multipleregression.html, Svibanj 2012
[12] „4 tools to enhance brand engagement on Facebook“
http://mashable.com/2012/05/10/facebook-marketing-tools/, Svibanj 2012
[13] „Facebook Timeline Changed the Way We See Brand Pages; Here’s How“
http://mashable.com/2012/04/30/facebook-timeline-eyetrack-study/, Svibanj 2012
[14] „The evolution of Facebook for brands“
http://mashable.com/2012/03/30/facebook-for-brands/, Svibanj 2012
[15] „Facebook brand statistic“
http://www.socialbakers.com/facebook-pages/brands/, Svibanj 2012
[16] „Facebook for websites“
https://developers.facebook.com/docs/guides/web/, Svibanj 2012
[17] „How to use Facebook timeline without reworking your brand strategy“
http://mashable.com/2012/04/16/facebook-timeline-for-brands-facebook-strategy/,
Svibanj 2012
59
[18] „Graph API Explorer“
https://developers.facebook.com/tools/explorer?method=GET&path=Konzum,
Svibanj 2012
[19] „Socialnumbers“
http://hr.socialnumbers.com/, Svibanj 2012
60
Sažetak
Analiza promocije brandova na društvenoj mreži Facebook zasnovano na statističkim
modelima
U radu je pokazana mogućnost analize promocije brandova na temelju podataka
generiranih na Facebook-brands stranicama. Sadržaj na stranicama brandova analizira se
primjenom statističkih metoda analize sadržaja. Analiza sadržaja kao znanstvena disciplina
opisana je kroz povijest svog razvitka. Time dobivamo uvid u razvoj metoda i primjenu
metoda za analizu sadržaja. Najvažnije metode analize sadržaja su: regresija, višestruka
regresija, faktorska analiza i složena analiza varijacije. Za svaku pojedinu metodu
navedene su sve prednosti i nedostaci, te su navedeni primjeri modela za provedbu analize
sadržaja tom metodom. Nadalje u radu su opisani izvori informacija na Facebook-brands
stranicama. Navedeni su i opisani sastavni dijelovi stranica brandova. Opisan je utjecaj
uvođenja Timelinea na promociju i marketing brandova na Facebooku. Praktični dio rada
sadrži implementirani sustav za generiranje statističkih modela nad kojima se provodi
regresijska analiza, te složena analiza varijanci. Sustav se sastoji od algoritama za
dohvaćanje podataka sa društvene mreže Facebook i algoritma za procesiranje dohvaćenih
podataka. Opis algoritama nalazi se u pisanom dijelu rada. Značenje i način tumačenja
dobivene statistike primjenom metoda analize sadržaja nad dobivenim modelima iz
implementiranog sustava dani su u pisanom dijelu rada.
Ključne riječi: analiza sadržaja, metode analize sadržaja, regresija, višestruka regresija,
složena analiza varijacije, faktorska analiza, Facebook-brands stranice, fan-page, brand,
promocija brandova, modeli analize sadržaja, EdgeRank, Facebook
61
Summary
Brand promotion analyses on the social network Facebook are based on statistical
models.
The paper shows the possibility of promoting brands analysis based on data
generated on the Facebook pages of the brands. The contents of the brands are analyzed
using statistical methods of content analysis. Content analysis as a scientific discipline is
described through the history of its development. Thus we get an insight into the
development of methods and application of methods for content analysis. The most
important methods of content analysis are: regression, multiple regression, factor analysis
and analysis of complex variations. For each method are listed all the advantages and
disadvantages, and there are examples of models for the implementation of this method of
content analysis. Furthermore, the paper describes the sources of information on Facebook
brands pages. The paper also describes the components of the brands page on Facebook.
The impact of the introduction of Timeline for the promotion and marketing of brands on
Facebook is also described. The practical part of the work conatins an implemented system
for generating statistical models using regression analysis and complex analysis of
variance. The system consists of algorithms to retrieve data from the social network
Facebook and algorithms for processing the retrieved data. The description of the
algorithm is written in the paper. The meaning and method of interpretation of the statistics
obtained from the implemented system are given in the written part of the paper.
Keywords: content analysis, content analysis method, regression, multiple regression,
analysis of complex variations, factor analysis, Brands Facebook page, fan page, brand,
promotion of brands, models of content analysis, EdgeRank, Facebook
62
Privitak
1. Instalacija programa XAMPP
Preuzeti program sa stranice http://www.apachefriends.org/en/xampp.html
Pokrenuti .exe datoteku i instalirati XAMPP prema uputama
2. Podešavanje baze podataka u XAMPP-u
Pokrenuti XAMPP Control Panel Application
Pokrenuti usluge Apache i MySQL pritiskom na gumbe Start
Kliknuti na Admin, otvara se web stranica. U izborniku kliknuti na
phpMyAdmin (Slika 1.)
Slika 1. Podešavanje baze podataka
Pritisnuti na Uvoz i odabrati datoteku localhost.sql iz foldera Brands
3. Podešavanje programa Brands na XAMPP poslužitelju
Otvoriti datoteku XAMPP na particiji C (C:\xampp\)
Otvoriti datoteku htdocs
Kopirati datoteku Brand iz doteteke Brands koja se nalazi na priloženom CD-u
Pokrenuti web-preglednik i upisati sljedeći URL: http://localhost/Brand/login.php