facebookの友達ネットワーク 表示の設定 を可視化 …19...
Post on 27-Feb-2020
2 Views
Preview:
TRANSCRIPT
TOKYO METROPOLITAN UNIVERSITY
ネットワーク分析
首都大学東京 都市環境学部 自然・文化ツーリズムコース
ykurata@tmu.ac.jp倉田 陽平
観光地理情報学特論Ⅰ 2014年度第8回
2
さまざまなネットワーク
3
今日の授業の目的
交通網・インターネット・人間関係など、社会のあちこちで登場する「ネットワーク」について、統一的に分析する手法の基礎を、実際に手を動かしながら学ぶ!
4
自分のFacebookの友達ネットワークを可視化してみよう
• https://apps.facebook.com/touchgraph/にアクセス
• Facebookアカウントでログイン
• 「TouchGraphがあなたの代わりにFacebookに投稿する許可を求めています」とでるが、スキップする
• 自動的に別のサイトにジャンプする
• 「このアプリケーションを実行しますか。Touch Graph Facebook…」と出るので実行を選択
5
表示の設定
Show All Friendsに☑<をクリック
Advancedの中にあるShow self: ☑を□にUser Label Shows:をFull nameに変更
友達が多いときはZoom,Spacingの値を下げる
6
• 「コミュニティ」が自動抽出されている• 関係の近い人同士・コミュニティ同士が近くに配置されている• 中心性の高い人ほど大きく表示される
中高同期
大学同学科
大学友人
ジオキャッシング静岡IT
地理情報
観光情報
留学友人
留学同学科
Toursim①
Toursim②
東大原研
7
• なぜツーリズムは2グループに分かれたのか?• なぜ先生方は中央付近に表示されているのか?• この中にいるツーリズムでない人は何者か? 8
中心性とは?
• 各ノードがネットワーク中でどれだけ中心にあるかを示す量
• いろいろな計算方法がある– 次数中心性: リンクの数
– ケーニッヒ指数: 最も遠くのノードまでの距離
– シンベル指数: ほかの全ノードまでの距離和
– 近接中心性: (ノード数-1)÷シンベル指数
– 媒介中心性: ノード間の最短経路上となる度合
– ページランク: Googleの基本アルゴリズム9
中心性指標①:ケーニッヒ指数
• 各ノードから最遠ノードまでのグラフ距離
• 「値が小さいノードほど中心にある」とみなす
• 最小値を「グラフの半径」という
6 5 4 3 4 5 6
6
5 4 6
6
5
10
中心性指標②:シンベル指数
• 各ノードから他のノードまでのグラフ距離の和
• 値が小さいほど中心
3 2 1 0 1 2 3
3
2 1 3
3
2
47 36 29 27 32 43
47
3740 43
43
38
26
11
中心性指標③:近接中心性
• 近接中心性=(ノード数-1)÷シンベル指数
• 値が大きいほど中心
.26 .33 .41 .43 .38 .28
.26
.32.30 .28
.28
.24
.46
47 36 29 27 32 43
47
3740 43
43
38
26
12
中心性指標④:媒介中心性
各ノードが、他のノードの組み合わせを結ぶ最短経路上に存在する割合
0 .32 .53 .59 .45 0
0
00 0
0
0
.62
13
中心性指標⑤:ページランク
• Googleのかつてのアルゴリズム
• 有向ネットワークを前提
• リンクを「投票」と考える
• 重要度=投票される量(in)=各ノードが投票できる量(out)
• 「投票を集めること」あるいは「投票を集めるノードの数少ないリンク先になること」が重要度↑の秘訣
14
コミュニティとは
• 内部同士の結合が多く、外との結合が比較的少ない、ネットワークの部分集合(クラスター)
• 段階構成をとる
コミュニティ数15 コミュニティ数5 15
コミュニティ算出法:ギルバンーニューマン法
このリンクの媒介中心性が高い
二つの部分(=コミュニティ)
に分割
• 媒介中心性の高いリンクから順に切断
• 切断の結果、独立部分が生じたら、それを「コミュニティ」と考える
16
ギルバンーニューマン法の雰囲気を味わってみよう
Clustersの数を2から順に大きくしていって見る
17
ネットワーク分析の観光への応用例
• 交通網分析
–中心性→地域の交通網や観光資源ネットワークの要衝はどこか?
• 組織分析(まちづくり)
–中心性→中心人物は誰か?
–どのようなコミュニティが内在しているか?
18
例:多摩動物公園をネットワーク分析してみよう
19
使用するツール:NodeXL• Excel上でネットワーク分析を行うための無料のアドイン(インストール必要)
• 英語
• スタートメニューの中の「NodeXL Excel Template」もしくはNodeXLで作成したExcelファイルを直接、読み込むことで起動
http://nodexl.codeplex.com
20
多摩動物公園のデータを読む
• Zドライブの「14観光地理情報学特論Ⅱ」内にある「NodeXL-多摩動物園」だけをデスクトップにコピー
• 上のファイルをダブルクリックして開く
Vertices: ノードについてのデータEdges: リンクについてのデータ
21
統計量を算出する
• NodeXLリボンを選択
• Graph Metricesを選択
• Select All、Calculate Metricesを順に選択
22
統計量を計算する(結果)
Degree: 次数(リンクの数)Between Centrality: 媒介中心性Closeness Centrality: 近接中心性PageRank: ページランク
Overall Metricesタブ(ネットワーク全体の情報)
Verticesタブ(各ノードの情報)
Graph Type: 有向か無向かVertices: ノードの数Total Edges: リンクの数Max Geodesic Distance: 最大距離Graph Density: 結合度指標
23
コミュニティを計算する
• Groups→Group by Clusters• Girvan-Newmanを選択して,OK
24
コミュニティを計算する(結果)
Groupsタブ(コミュニティの情報)
Group Verticesタブ(各コミュニティの所属ノードの一覧)
コミュニティが6個できた!
25
ネットワークの図示
• ①Autofill Columns→②Verticesタブ→③Vertex sizeをPageRank, Betweeness Centrality(媒介中心性),Closeness Centrality(近接中心性)から選択→④Autofill→⑤Close
• ⑥Refresh Graphボタンを押す
①
②
③
④ ⑤
⑥
26
ネットワークの図示(結果)
Layoutをいろいろ変えてみよう(変えたらRefresh Graph)
27
28
ネットワーク分析に必要なデータ
• ノードのリスト
– ID–名称
– xy座標(オプション): 地理的データの場合
• リンクのリスト
–ノードIDとノードIDのペア
–ウェイト(オプション): 交通量、通信量など
29
課題:ディズニーランドをネットワーク分析してみよう
NodeXLを使って、次のネットワークのデータを自分で入力し、分析してみよう
シンデレラ城
アドベンチャーランド
トゥーンタウンファンタジーランド
ウエスタンランド
クリッタカントリー
ワールドバザール
トゥモローランド
ID: CC
ID: WL
ID: ALID: WB
ID: CJ
ID: FL ID: TT
ID: TL
30
補足:ネットワーク(グラフ)の種類
• 有向ネットワーク(directed network)↔無向ネットワーク(non-directed network)
• 重みつきネットワーク(weighted network)• 完全ネットワーク(complete network)• ツリー
31
道路網、鉄道網のようなネットワークは他のネットワークと何が違うのか?
V.S.
32
スモールワールドネットワーク
• 任意の2つのノードが、中間にわずかな数の
ノードを介するだけで接続されるというような性質のネットワーク
• 代表例:人脈
– 「6次の隔たり」
– 「友達の友達がアルカイダ」
• 道路網は?
• 航空網は?33
スケールフリーネットワーク
• ハブ(大量のノードと繋がっているようなノード)が存在するようなネットワーク
• 代表例:インターネット
– Google, Yahoo…
• 道路網は?
• 航空網は?
http://internet‐map.net/
34
今日のキーワード
• ネットワークとグラフ
• 中心性
• 近接性
• コミュニティ
• ソーシャルグラフ
• スケールフリーネットワーク
• スモールワールドネットワーク
top related