social network analysis
DESCRIPTION
Přednáška o social network analysis pro posluchače semináře o vizualizaci, Brno, 19.4. 2012TRANSCRIPT
Social network analysis 19. 4. 2012, Josef Šlerka, Brno, seminář o VizualizaciStudia nových médií, ÚISK, FF UK
Sociální síť
... vzniká jako soubor lidí mezi kterými existují nějaké vztahy, které formalizujeme pomocí matice nebo grafu a dále analyzujem.
Řekni to písní...
Igor má rád Evu, Eva jeho nie
a tak preto Igor stále smutný je.
Eva chce mít Vojta, Vojto Evu nie
a tak preto Eva, stále smutná je.
Soubor
set prvků, které vytvářejí graf
sám může být zajímavý třeba pro průniky
Soubor
Igor
Eva
Vojta
Matrix lásky
Igor Vojta Eva
Igor --- 0 1
Vojta 0 --- 0
Eva 0 1---
Malý graf lásky
Velký graf lásky
Vztahy jsou totiž všude
Twitter: princip followingu
Facebook: kamarádi, členství ve skupině, lajky
Flickr: přátelé, tagy
Diskuse: členství v diskusích, reagování
Politika: společná hlasování
Stavební prvky grafuuzel (nodes, vertices, entities, items etc.)
vazba (ties, connections, relationships etc.)
vazby mohou mít směr případně váhu či jich může být víc
z pohledu sociologie mohou mít i kvality např. silné nebo slabé
Typologie grafů I.
Unimodal (jedna přímá vazba)
Multimodal (vícero přímých vazeb)
Affiliation (vazba prostřenictvím např. akce)
Multiplex Network (kvalitativně různé vazby)
Typologie grafů II.
Full (každý s každý)
Partial (tak nějak všichni)
Egocentric (já jsem centrum dění)
Typologie grafů III.
Centralized
Decentralized
Distributed
Co lze třeba měřitPočet hran (Degree Centrality)
Prostřednictví (Betweenness Centralities)
Blízkost (Closeness Centrality)
Hustota (Density), Dosažitelnost (Reachability)
Eigenvector Centrality
Shluky a komunity
... ale proč????
Degree Centrality
počet přímých vazeb k dalším uzlům
měří aktivitu uzlů v síti.
uzly s vysokou hodnotou Degree Centrality jsou „spojky“ nebo „středy“ v této síti.
Closeness Centralitynejvyšší, jestliže z uzlu lze dosáhnout ke všem dalším uzlům v síti.
nejmenší hodnota součtu vzdáleností k ostatním uzlům
uzly snadno přijímají a přenášejí inovace.
uzel s vysokou mírou blízkosti středu mají velký vliv na to, co se v síti odehrává.
Betweenness - Bridgesnejvyšší pokud cesty mezi libovolnými dvěma uzly sítě vždy procházejí tímto uzlem.
měří, kolik cest mezi dvojicí uzlů prochází daným uzlem.
závora, propojení nebo zprostředkovatel rolí.
kontroluje tok informací v síti a umožňuje dobrou viditelnost všeho, co se děje v síti.
Hustota sítě
koeficient shlukování
okolí bodu či celá síť
počet hran/počet možných hran
čím vyšší číslo, tím vyšší hustota sítě
hustota = n * (n - 1) / 2
Reachibility
počet uzlu dosažitelných z jedno bodu na jeden, dva či tři kroky
Eigenvector centralityLze počítat jen v neorientovaném grafu
Přidává k výsledku nejen počet vazeb uzlu, ale také počet vazeb uzlů, které mají uzly s ním spojené
Odhaluje i nepřímý vliv
Google Page Rank je variant Eigenvector centality
Shlukování a komunity
segmentování podle vlastností
buď sdílené vlasnosti (degree)
nebo možná příslušnost do komunity
Role uzlů v síti
Peripheral – výrazně menší než průměrná centrality
Central connector – výrazně větší než průměrná centralita
Broker – výrazaně větší než průměrná betweenness
Sociální roleKomunikátoři
Spojovatelé / Úzká hrdla
Prodavači
Inovátoři
Maveni
Lidé na okraji
Software pro SNA
Pajek
UCINET
Gephi
NWB
... řada dalších
NodeXL
volně dostupný, GPL licence
funguje i jako template pro Excel
snadno ovladatelný
mnoho formátů (Pajek, UCINET, GraphML)
import z Twitteru, Flickru a daších
SNA pro starší
R - nástroj pro statistickou a další matematickou analýzu
vynikající knihovna igraph
pomalá učící křivka, ale vynikající výsledky
vyžaduje, ale programování
Praktické ukázkyanalýza průniků fanoušků telco operátorů
analýza průniků fanoušků na Twitteru
analýza Twitteru followerů @stunome
analýza hashtagu #lumia800
analýza zmínek o slovenské Tatrabance
analýza hlasování politiků v Praze
Průniky fanoušků
listy fanoušku stránek O2, Vodafone a T-Mobile, kteří od 1.3. do 18.4. alespoň jednou komentovali statusy operátorů
data získána pomoci NodeXL
Aktivní fanoušci
O2 1.240 unikátních komentujících
T-Mobile 455 unikátních komentující
Vodafone 1.362 unikátních komentujících
Průnikyo2 T-Mobile
Vodafone
(1.240) (455)
(1.362)
2765
30
10
1.270
3981.145
10 procent konkurence
konkurenční poměr = počet fans / pouze mých
O2 - 0.92
T-Mobile - 0.87
Vodafone - 0.93
Průniky fanoušků
listy fanoušků Twitter účtů ct24zive, rozanek a zpravyrozhlascz
data získána pomoci Klábosení
Aktivní fanoušci@ct24zive 11.289 followers
@rozanek 1.543 followers
@zpravyrozhlascz 1.033 followers
Prostý součet: 13.865, Unikátní součet: 12.772
Poměr shody: 0.92
Společný průnik: 145
Průniky - první pokus
ct24zive rozanek zpravyrozhlascz
ct24zive x 494 584
rozanek 494 x 210
zpravyrozhlascz 584 210 x
Průniky - druhý pokuspoměry mezi průnikem a
počtemct24zive rozanek zpravyrozhlascz
ct24zive x 0.04 0.05
rozanek 0.32 x 0.13
zpravyrozhlascz 0.57 0.2 x
@stunome
@stunome
Lumia 800
přehled za týdenní komunikaci o hashtagu
zoohlednění lidé, kteří napsal aspoň třikrát
různé možnosti pohledu
generováno v R (igraphu)
běžný orientovaný graf
velikost uzlu je dána jeho betweenness
Neighbor-Joining Tree
Tatra Banka
přehled za týdení komunikaci o Tatra Bance
kdokoli, kdo zmínil během března
různé možnosti pohledu
generováno v R (igraphu)
indegree
betweenness
Pražský magistrát
analýza hlasování za tři volební období
vazba existuje při 75% shodných hlasování
ukazuje skutečné hlasovací jádro
ukazuje vazby napříč stranami
inspirace americkým experimentem
1998 - 2002
2002 - 2006
2006 - 2010
Děkuji za pozornost!
Otázky? Odpovědi?
Email: [email protected],
Twitter: http://www.twitter.com/josefslerka
Blog: http://ttgoogle.blogspot.com