twitter研究会 榊 剛史 takeshi sakaki
TRANSCRIPT
![Page 1: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/1.jpg)
今そこにある呟きTwitterからのリアルタイムなイベント抽出
及び応用アプリケーションについて
榊 剛史 @tksakaki 松尾 豊 @ymatsuo
東京大学 松尾研究室
![Page 2: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/2.jpg)
軽く自己紹介
東京大学 松尾研究室 博士課程1年
株式会社 ホットリンク 特任研究員
以前は、東京電力で電柱昇ったりしてました。
Twitter上で、よく教授と間違われます。
海外でも間違えられてた・・・・
↑ウェブ学会のところ
↑口コミ係長のところ
![Page 3: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/3.jpg)
今日のアジェンダ
Twitterで分かる「今」と「どこ」
地震抽出システムについて
リアルタイムイベント抽出の仕組み
キーワード検索とSVMによるイベント抽出
Particle Filter による位置推定
Twitter上でのリアルタイム情報伝播の特徴
イベント種類による情報伝播の特性
リアルタイムイベント抽出 応用システム
にじったー/Toretter
電車遅延抽出/渋滞抽出
Celeb Paparazzi(仮)
![Page 4: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/4.jpg)
今日のアジェンダ
Twitterで分かる「今」と「どこ」
地震抽出システムについて
リアルタイムイベント抽出の仕組み
キーワード検索とSVMによるイベント抽出
Particle Filter による位置推定
Twitter上でのリアルタイム情報伝播の特徴
イベント種類による情報伝播の特性
リアルタイムイベント抽出 応用システム
にじったー/Toretter
電車遅延抽出/渋滞抽出
Celeb Paparazzi(仮)
![Page 5: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/5.jpg)
Twitterにおける「今」と「どこ」
Twitterにおける「今」の重要性
ニュースサイト
ツイちぇき!!
Buzztter
TV見ながらTweet
TVzin
フォロワーの行動
![Page 6: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/6.jpg)
Twitterにおける「今」と「どこ」
Twitterにおける「今」の重要性
ニュースサイト
Buzztter
TV見ながらTweet
TVzin
フォロワーの行動
今何が起きているかが分かる
![Page 7: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/7.jpg)
Twitterにおける「今」と「どこ」
Twitterにおける「今」の重要性
ニュースサイト
Buzztter
TV見ながらTweet
TVzin
フォロワーの行動
今何が起きているかが分かる
他人が何をしているかが分かる
![Page 8: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/8.jpg)
リアルタイム性と位置情報を利用した使い方
地震の発生と震源地を知る
天体現象を知る
ゲリラ豪雨
虹
朝の電車遅延情報
Twitterにおける「今」と「どこ」
![Page 9: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/9.jpg)
リアルタイム性と位置情報を利用した使い方
地震の発生と震源地を知る
天体現象を知る
ゲリラ豪雨
虹
朝の電車遅延情報
Twitterにおける「今」と「どこ」
リアルな世界で「今」「そこで」何かが起きているのが
分かる
![Page 10: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/10.jpg)
Twitterにおける「今」と「どこ」
「今」と「どこ」を利用したアプリケーション
Torretter :地震検出システム
時間的な近さから同じ地震であることを同定
Geolocation情報、ユーザーのプロフィールの場所情報を利用して、震源地を推定する(未実装)
Nijitter:虹検出システム
時間的な近さとTweet数から虹が出ていることを同定
位置情報をもとに、虹が出ていると思われる場所に虹を表示
本日はこの仕組みについて説明
サンプル:地震
![Page 11: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/11.jpg)
今日のアジェンダ
Twitterで分かる「今」と「どこ」
地震抽出システムについて
リアルタイムイベント抽出の仕組み
キーワード検索とSVMによるイベント抽出
Particle Filter による位置推定
Twitter上でのリアルタイム情報伝播の特徴
イベント種類による情報伝播の特性
リアルタイムイベント抽出 応用システム
にじったー/Toretter
電車遅延抽出/渋滞抽出
Celeb Paparazzi(仮)
![Page 12: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/12.jpg)
アプローチ
「地震」「揺れた」を含むTweetから地震直後に呟いたTweetのみを抽出
Twitterユーザーをセンサーと捉えて地震検出・震源地推定
![Page 13: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/13.jpg)
ポイント1
「地震」「揺れた」を含むTweetから地震直後に呟いたTweetのみを抽出
機械学習で
![Page 14: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/14.jpg)
ポイント1
□地震直後につぶやいた呟き
地震だ!!地震!?
揺れた!
こえ~~
地震!
びびったー
□その他のつぶやいた呟き
今更、何故「鍋焼きうどん」買うの! こん
なに沢山?!地震に供えて?
十年後って、自分が生きてる保証も無いですよ
ね。 地震とか、戦争とかもわからんし・・・?
![Page 15: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/15.jpg)
ポイント1
□地震直後につぶやいた呟き
地震だ!!地震!?
揺れた!
こえ~~
地震!
びびったー
□その他のつぶやいた呟き
今更、何故「鍋焼きうどん」買うの! こん
なに沢山?!地震に供えて?
十年後って、自分が生きてる保証も無いですよ
ね。 地震とか、戦争とかもわからんし・・・?
![Page 16: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/16.jpg)
ポイント1~説明
Twitter search API
Mecab
SVMデータベース
Tweetクローラー
提案システム
検索 キーワードを含む呟き
テキスト分析器
Tweet TweetTweet Tweet …
「地震」
「揺れた」
![Page 17: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/17.jpg)
ポイント1~説明
Twitter search API
Mecab
SVMデータベース
Tweetクローラー
提案システム
検索 キーワードを含む呟き
テキスト分析器
Tweet TweetTweet Tweet …
「地震」
「揺れた」
![Page 18: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/18.jpg)
ポイント1~説明
Twitter search API
Mecab
SVMデータベース
Tweetクローラー
提案システム
検索 キーワードを含む呟き
テキスト分析器
Tweet TweetTweet Tweet …
「地震」
「揺れた」
![Page 19: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/19.jpg)
ポイント1~説明
Twitter search API
Mecab
SVMデータベース
Tweetクローラー
提案システム
検索 キーワードを含む呟き
テキスト分析器
Tweet TweetTweet Tweet …
地震に関する呟きのみ抽出
Support Vector
Machine
=機械学習の手法「地震」
「揺れた」
![Page 20: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/20.jpg)
ポイント1~詳細説明
ターゲットとするイベントに関するキーワードを含むTweetを抽出
地震の場合
「揺れた」「地震」
虹の場合
「虹」
収集したTweetを正解と不正解に分類→ 学習データ
例:
「地震だ!!」 --正解
「地震が多い国って、日本だけじゃないんだよな・・・」 --不正解
![Page 21: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/21.jpg)
ポイント1~詳細説明
ターゲットイベント用Tweets分類器作成 収集した学習データを利用
学習手法:Support Vector Machine
使用した特徴量(例文:やばい、地震きた!) 統計量 (3語、2番目)
Tweetsが全部で何語か?また、キーワードは何番目か?
キーワード ( やばい、地震、くる)
Tweets中に含まれている全ての語
キーワード文脈情報 (やばい、くる)
キーワードの前後に出現する語
![Page 22: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/22.jpg)
アプローチ
「地震」「揺れた」を含むTweetから地震直後に呟いたTweetのみを抽出
Twitterユーザーをセンサーと捉えて地震検出・震源地推定
![Page 23: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/23.jpg)
ポイント2
Twitterユーザーをセンサーと捉えて地震検出・震源地推定
![Page 24: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/24.jpg)
ポイント2~説明
・・・ ・・・ ・・・tweets
・・・・・・
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
![Page 25: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/25.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・ ・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
・・・・・・
![Page 26: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/26.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
・・・・・・
![Page 27: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/27.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
地震に関する呟きを抽出
![Page 28: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/28.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
地震に関する呟きを抽出
地震を検出
![Page 29: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/29.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
地震に関する呟きを抽出
地震を検出
地震センサーが地震を検出
![Page 30: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/30.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
地震に関する呟きを抽出
地震を検出
地震センサーが地震を検出
![Page 31: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/31.jpg)
ポイント2~説明
ユーザーが「地震」について呟
く
センサーによる観測と同じ確率的処理で検出可能
・・・ ・・・tweets
確率モデル
呟き分類器
センサーによる観測Twitterユーザーによる観測
イベント発生 ターゲットオブジェクト
確率モデル
センサーの測定値
Twitterからのイベント検出 センサーによるイベント検出
地震に関する呟きを抽出
地震を検出地震を検出
地震センサーが地震に反応
![Page 32: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/32.jpg)
ポイント2~詳細説明
実際には確率モデルを使用して検出
Twitterユーザーをセンサーを考えると、ノイズが多く、また誤検出もあり得る
1つのTweetだけでは、イベントが起きたとは判定できない
→時系列的なセンサーの値から、イベント判定を行う
2つの確率モデルを利用
時系列データよりイベント検出を行う確率モデル
一連の位置情報より位置推定を行う確率モデル
![Page 33: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/33.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160A
ug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Aug …
Au
g …
Au
g …
Au
g …
Aug …
Aug …
Aug …
num
ber
of tw
eets
![Page 34: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/34.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…num
ber
of
tweets
![Page 35: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/35.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…num
ber
of
tweets
0
20
40
60
80
100
120
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
num
ber
of tw
eets
![Page 36: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/36.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…num
ber
of
tweets
0
20
40
60
80
100
120
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
num
ber
of
tweets
![Page 37: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/37.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…n
um
ber
of
tweets
0
20
40
60
80
100
120
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
num
ber
of
tweets
![Page 38: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/38.jpg)
ポイント2~詳細説明~時系列モデル
0
20
40
60
80
100
120
140
160
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…
A…n
um
ber
of
tweets
0
20
40
60
80
100
120
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
num
ber
of
tweets
![Page 39: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/39.jpg)
ポイント2~詳細説明~時系列モデル
観測データを指数関数にフィッティング
ターゲットイベントの発生判定を、指数分布に基づいて確率的に算出
0,0; tetf t34.0
![Page 40: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/40.jpg)
ポイント2~詳細説明~空間モデル
ターゲットイベントの発生場所の確率分布を算出
センサーによる位置推定に使われるベイズフィルタを利用
カルマン フィルタ
パーティクルフィルタ
![Page 41: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/41.jpg)
ポイント2~詳細説明~空間モデル
カルマンフィルタ
ベイズ フィルタとして最もよく使われている手法
長所 計算が速い
短所 適用対象が、高精度かつ計測間隔の短い
センサーに限られてしまう
![Page 42: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/42.jpg)
ポイント2~詳細説明~空間モデル
パーティクルフィルタ(粒子フィルタ)
確率分布をparticle=粒子の集合でシミュレートする手法
長所 さまざまな確率分布に適用可能
短所 高次元なデータを用いた予測には適用できない
(位置推定は2次元なので適用可能)
![Page 43: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/43.jpg)
検出の精度
どのくらいの精度で検出できたのか?
![Page 44: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/44.jpg)
地震自体の検出結果
震度 震度2以上 震度3以上 震度4以上
地震回数 78 25 3
検出数 70(89.7%) 24(96.0%) 3(100.0%)
1分以内の検出数 53(67.9%) 20(80.0%) 3(100.0%)
期間: 2009年8月 – 2009年9月収集したTweet数: 49,314 tweets
利用したTweet数: 6291 tweets by 4218 users
震度3以上の地震を96%の精度で検出
![Page 45: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/45.jpg)
震源地予測結果
Tokyo
Osaka
実際の震源地
Kyoto
予測震源地(提案)
風船:呟きの位置色:呟き時刻
![Page 46: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/46.jpg)
台風の進路予測
実際の経路
予測経路(Particle Filter)
![Page 47: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/47.jpg)
問題点
地震検出の精度・位置推定の精度が
Twitterユーザーの多い地域>少ない地域
震源地が海だと予測できない
![Page 48: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/48.jpg)
今日のアジェンダ
Twitterで分かる「今」と「どこ」
地震抽出システムについて
リアルタイムイベント抽出の仕組み
キーワード検索とSVMによるイベント抽出
Particle Filter による位置推定
Twitter上でのリアルタイム情報伝播の特徴
イベント種類による情報伝播の特性
リアルタイムイベント抽出 応用システム
にじったー/Toretter
電車遅延抽出/渋滞抽出
Celeb Paparazzi(仮)
![Page 49: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/49.jpg)
Twitter上でのイベント情報の伝播
調査の発端
センサーによる観測手法
→センサー同士が影響しないことが前提
→ Twitterユーザー同士は影響を及ぼしてしまうのではないか?
2種類のイベントについてネットワークの特徴量を比較
ユーザーの周囲で突発的に発生するイベント
地震・台風
学会/研究会イベント
![Page 50: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/50.jpg)
Twitter上でのイベント情報の伝播
2種類の情報伝播ネットワークを定義
フォロワー ネットワーク
Retweetネットワーク
user A’s timeline地震??
ユーザーAユーザーB follow
ユーザーAユーザーB
地震??大丈夫!? RT @user B: 地
震??
follow
![Page 51: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/51.jpg)
突発的に発生するイベントの情報伝播
フォロワーネットワークの密度:普通
Retweetネットワーク:中心性の高いユーザーがいない
フォロワーネットワーク 台風
Retweetネットワーク 台風
![Page 52: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/52.jpg)
突発的に発生するイベントの情報伝播
フォロワーネットワーク v.s. Retweet ネットワーク
Rpagerank v.s. Rbetweenretweet
follower
Pagerank max
Pagerank max
pagerankRretweet
follower
betweenmax
betweenmax
betweenR
pagerankR
betweenR0
2
4
6
8
10
12
0.1 1 10 100 1000 10000 100000
![Page 53: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/53.jpg)
0
2
4
6
8
10
12
0.1 1 10 100 1000 10000 100000
突発的に発生するイベントの情報伝播
フォロワーネットワーク v.s. Retweet ネットワーク
Rpagerank v.s. Rbetweenretweet
follower
Pagerank max
Pagerank max
pagerankRretweet
follower
betweenmax
betweenmax
betweenR
pagerankR
betweenR
![Page 54: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/54.jpg)
0
2
4
6
8
10
12
0.1 1 10 100 1000 10000 100000
突発的に発生するイベントの情報伝播
フォロワーネットワーク v.s. Retweet ネットワーク
Rpagerank v.s. Rbetweenretweet
follower
Pagerank max
Pagerank max
pagerankRretweet
follower
betweenmax
betweenmax
betweenR
pagerankR
betweenR
地震台風
地震
![Page 55: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/55.jpg)
学会/研究会イベントの情報伝播
フォロワーネットワークの密度が高い
RTネットワークの密度が高い
フォロワーネットワークWI2
Retweet ネットワークWI2
![Page 56: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/56.jpg)
学会/研究会イベントの情報伝播
フォロワーネットワーク v.s. Retweet ネットワーク
ネットワーク密度
0
0.005
0.01
0.015
0.02
0.025
0.03
0 0.01 0.02 0.03 0.04 0.05 0.06
retweetD
followingD
![Page 57: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/57.jpg)
学会/研究会イベントの情報伝播
0
0.005
0.01
0.015
0.02
0.025
0.03
0 0.01 0.02 0.03 0.04 0.05 0.06
retweetD
followingD
フォロワーネットワーク v.s. Retweet ネットワーク
ネットワーク密度
![Page 58: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/58.jpg)
学会/研究会イベントの情報伝播
0
0.005
0.01
0.015
0.02
0.025
0.03
0 0.01 0.02 0.03 0.04 0.05 0.06
SIG-WI2
Twitter 研究会
web 学会
retweetD
followingD
フォロワーネットワーク v.s. Retweet ネットワーク
ネットワーク密度
![Page 59: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/59.jpg)
Twitter上でのイベント情報の伝播
Conference Events
他のイベントと比べ、フォロワーネットワークの密度が高い
Retweetも発生しやすい
→ 情報伝播が発生しやすいイベント
Events around them
Retweetネットワークには中心性の高いユーザーはいない.
=ユーザーは突発的なイベントについてはあまりRetweet
しない
→ 情報伝播が発生しにくいイベント
![Page 60: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/60.jpg)
今日のアジェンダ
Twitterで分かる「今」と「どこ」
地震抽出システムについて
リアルタイムイベント抽出の仕組み
キーワード検索とSVMによるイベント抽出
Particle Filter による位置推定
Twitter上でのリアルタイム情報伝播の特徴
イベント種類による情報伝播の特性
リアルタイムイベント抽出 応用システム
にじったー/Toretter
電車遅延抽出/渋滞抽出
Celeb Paparazzi(仮)
![Page 61: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/61.jpg)
地震速報システム Toretter
![Page 62: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/62.jpg)
虹出現お知らせシステム Nijitter
![Page 63: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/63.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
![Page 64: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/64.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
今、新宿三丁目であの伝説の外人
チャックウィルソン発見!
![Page 65: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/65.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
今、新宿三丁目であの伝説の外人
チャックウィルソン発見!
いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇の
ちゃちゃちゃチャンスですよ!w 。
![Page 66: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/66.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
今、新宿三丁目であの伝説の外人
チャックウィルソン発見!
フジテレビ内のローソンでとんちゃんとフォンチーを見かけた
よ。いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇の
ちゃちゃちゃチャンスですよ!w 。
![Page 67: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/67.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
今、新宿三丁目であの伝説の外人
チャックウィルソン発見!
フジテレビ内のローソンでとんちゃんとフォンチーを見かけた
よ。いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇の
ちゃちゃちゃチャンスですよ!w 。
明治通りで美川憲一に遭遇なう。
めっちゃくねくねしてる。
![Page 68: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/68.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
今、新宿三丁目であの伝説の外人
チャックウィルソン発見!
フジテレビ内のローソンでとんちゃんとフォンチーを見かけた
よ。いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇の
ちゃちゃちゃチャンスですよ!w 。
明治通りで美川憲一に遭遇なう。
めっちゃくねくねしてる。
楳図かずおさん見かけた@吉祥寺。
赤と白のボーダーすごい似合って
た。 。
8月31日の16:00~20:00の間のTweet
![Page 69: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/69.jpg)
芸能人を目撃せよ Celeb Paparazzi(作成中)
実際の仕組み
「発見」「遭遇」などを含むTweetを収集
有名人の人名が含まれてるTweetを抽出
Wikipedia等から収集した人物名リストを使用
地名情報・位置情報を取得
→ リアルタイムに芸能人目撃情報を表示
![Page 70: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/70.jpg)
その他作りたいアプリ(計画&妄想)
計画中
電車遅延情報お知らせシステム(メールも配信)
渋滞情報表示システム
妄想
なんでもイベント判別器作成システム
正解データ/不正解データをユーザーがトゥギャる
イベント判別器を自動作成
天体情報表示&写真収集システム
![Page 71: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/71.jpg)
まとめ
ある程度の位置推定も可能
様々なイベント抽出サイトを作成
他のリアルタイムなイベントに応用可能
例:電車遅延、芸能人出現情報etc
高い精度でイベント検出可能
イベントごとの情報伝播の違いを検証
![Page 72: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/72.jpg)
おしまい@tksakaki
![Page 73: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/73.jpg)
![Page 74: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/74.jpg)
位置情報推定の精度
地震
平均値 - 5.47 3.62 3.85 3.01
Particle filters works better than other methods
日付 実際の中心 中間値 平均値 カルマンフィルタ 粒子フィルタ
緯度・経度の最小2乗誤差
![Page 75: Twitter研究会 榊 剛史 Takeshi Sakaki](https://reader033.vdocuments.site/reader033/viewer/2022052214/5597a5531a28ab2b618b45ba/html5/thumbnails/75.jpg)
位置情報推定の精度
台風
平均値 - 4.39 4.02 9.56 3.58
Particle Filters works better than other methods
日付 実際の中心 中間値 平均値 カルマンフィルタ 粒子フィルタ
緯度・経度の最小2乗誤差