第2回 nips+読み会・関西 発表資料 山本

46
1 2016-12-26 Yasuo Yamamoto Coevolutionary Latent Feature Processes for Continuous-Time User-Item Interactions NIPS+読み会・関西

Upload: yahoo

Post on 15-Apr-2017

309 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: 第2回 NIPS+読み会・関西 発表資料 山本

1

2016-12-26

Yasuo Yamamoto

Coevolutionary Latent Feature Processes

for Continuous-Time User-Item Interactions

NIPS+読み会・関西

Page 2: 第2回 NIPS+読み会・関西 発表資料 山本

自己紹介

山本 康生 (Yasuo Yamamoto)

所属:データ&サイエンス サイエンス本部@大阪オフィス

担当:広告サイエンス

経歴:

• 今年の8月からYahoo! JAPANに在籍

• 京阪奈地区で研究開発(NICT, ATRなど)

• KaggleでTop10%入賞とか Airbnb(143rd/1462)、HomeDept(85th/2125)

2

Page 3: 第2回 NIPS+読み会・関西 発表資料 山本

Table of Contents

Motivation

Experimental details

Highlight data

Summary

3

Page 4: 第2回 NIPS+読み会・関西 発表資料 山本

Motivation

Page 5: 第2回 NIPS+読み会・関西 発表資料 山本

著者についてAbout Authors

ジョージア工科大学のLe Songさん研究室

• Yichen Wangさん

• Nan Duさん

• Rakshit Trivediさん

5

Page 6: 第2回 NIPS+読み会・関西 発表資料 山本

レコメンデーションの課題for Recommendation

6

最適なサービス・アイテムを

最適なタイミングで

最適なユーザに提案する

Page 7: 第2回 NIPS+読み会・関西 発表資料 山本

今回のタイトルToday’s Title

Coevolutionary

Latent Feature Processes

for Continuous-Time User-Item Interactions

7

Page 8: 第2回 NIPS+読み会・関西 発表資料 山本

大事なところTopics

Coevolutionary

Latent Feature Processes

for Continuous-Time User-Item Interactions

8

Page 9: 第2回 NIPS+読み会・関西 発表資料 山本

共進化とは?Coevolution?

Coevolution

/ koh-ev-uh-loo-shuh/

意味:“共進化” (weblioより)

9

Page 10: 第2回 NIPS+読み会・関西 発表資料 山本

ユーザとアイテムが共進化する例Example

10

政治スレッド

教育について議論が活発化

教育に関心があるユーザが集まる

教育について議論する政治スレッド

スポーツ・スレッドなど

政治に関心がなくなったユーザが移動

1

2

3

4

5

Page 11: 第2回 NIPS+読み会・関西 発表資料 山本

本研究の課題Subjects

• 利用者とアイテムは共進化する

• 利用者の行動時間はぞれぞれに異なる

• 利用者の興味関心は行動に表れる

• 利用者・アイテム行列の最適化

11

Page 12: 第2回 NIPS+読み会・関西 発表資料 山本

本研究の提案Proposals

提案:Coevolutinary Latent Feature Process

• 利用者とアイテムは共進化する

• 利用者の行動時間はぞれぞれに異なる

• 利用者の興味関心は行動に表れる

提案:A novel low rank space sharing constrains

• 利用者・アイテム行列の最適化

12

Page 13: 第2回 NIPS+読み会・関西 発表資料 山本

Experimental Detail

Page 14: 第2回 NIPS+読み会・関西 発表資料 山本

イベントの定義Event Representation

14

Given 𝒖 users and 𝒊 items

All of user’s history events: 𝚻= {𝒆𝒌}

𝒆𝒌= (𝒖𝒌, 𝒊𝒌, 𝒕𝒌, 𝒒𝒌)

𝒖𝒌: user feature

𝒊𝒌: item feature

𝒕𝒌: time

𝒒𝒌: interaction feature

Page 15: 第2回 NIPS+読み会・関西 発表資料 山本

ユーザ潜在変数A user‘s latent feature

15

(item->user): どのアイテムとインタラクションしたかで決まる

Page 16: 第2回 NIPS+読み会・関西 発表資料 山本

アイテム潜在変数A item‘s latent feature

16

(user->item): どのユーザからインタラクションされたかで決まる

Page 17: 第2回 NIPS+読み会・関西 発表資料 山本

点過程についてBackground on Temporal Point Process

17

{𝒕𝒊} with 𝒕 ∈ 𝑹+ イベントの時間𝑵(𝒕): 𝒕までに観測したイベント件数𝝀(𝒕): 条件付き強度関数(intensity function)

これまでに起こったイベントによって決まる、次イベントの確率モデル 強度関数は興味関心のモデルとして使われる

𝒕, 𝒕 + 𝒅𝒕 :An event in small window 𝚻 𝐭 : The history𝝀 𝒕 𝒅𝒕 ≔ ℙ 𝒆𝒗𝒆𝒏𝒕 𝒊𝒏 𝒕, 𝒕 + 𝒅𝒕 𝚻(𝒕)} = 𝔼 {𝒅𝑵 𝒕 |𝚻 𝐭 }

In a small window of size dt, i.e., 𝒅𝑵 𝒕 ∈ {𝟎, 𝟏}

Page 18: 第2回 NIPS+読み会・関西 発表資料 山本

点過程モデルRepresentation of a simple point process

18Ioane Muni Toke, An Introduction to Hawkes Processes with Applications to Finance

Page 19: 第2回 NIPS+読み会・関西 発表資料 山本

強度関数Intensity Function

19

Hawkes Processを強度関数𝝀(𝒕)として使う

𝒆𝒙𝒑(−𝝎𝒕) : an exponential triggering kernel

𝝁: baseline intensity independent of the history (𝝁 ≥ 𝟎)

The kernel 𝓚𝝎 and the weight 𝜶 (𝜶 ≥ 𝟎) depend on the history

Page 20: 第2回 NIPS+読み会・関西 発表資料 山本

1次元ホークス型モデルHawkes Process: Sample path of 1D-Hawkes Process

20Ioane Muni Toke, An Introduction to Hawkes Processes with Applications to Finance

Page 21: 第2回 NIPS+読み会・関西 発表資料 山本

潜在変数過程Latent Feature Process

21

ユーザ潜在変数 𝑼𝒖(𝒕) ∈ 𝑹𝑲 𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂 𝒖𝒔𝒆𝒓 𝒖,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒏𝒕𝒔 𝑲

アイテム潜在変数 𝒊𝒊(𝒕) ∈ 𝑹𝑲 𝐰𝐢𝐭𝐡 𝐢𝐧 𝐚 𝐢𝐭𝐞𝐦 𝐢,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒕𝒏𝒔 𝑲

インタラクション強度の平均 アイテム強度の平均

ユーザ強度の平均インタラクション強度の平均

Page 22: 第2回 NIPS+読み会・関西 発表資料 山本

高次元パラメータThe high-dimensional feature A, B, C and D

22

ユーザ潜在変数 𝑼𝒖(𝒕) ∈ 𝑹𝑲 𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂 𝒖𝒔𝒆𝒓 𝒖,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒏𝒕𝒔 𝑲

アイテム潜在変数 𝒊𝒊(𝒕) ∈ 𝑹𝑲 𝐰𝐢𝐭𝐡 𝐢𝐧 𝐚 𝐢𝐭𝐞𝐦 𝐢,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒕𝒏𝒔 𝑲

未知のパラメータA, B

未知のパラメータC, D

𝐴, 𝐵, 𝐶, 𝐷 ∈ 𝑅𝐾×𝐷(𝑤𝑖𝑡ℎ 𝑖𝑛 𝑎 𝐷 𝑓𝑒𝑎𝑡𝑢𝑟𝑒𝑠)

Page 23: 第2回 NIPS+読み会・関西 発表資料 山本

ベース属性Drift of base features

23

ユーザ潜在変数 𝑼𝒖(𝒕) ∈ 𝑹𝑲 𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂 𝒖𝒔𝒆𝒓 𝒖,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒏𝒕𝒔 𝑲

アイテム潜在変数 𝒊𝒊(𝒕) ∈ 𝑹𝑲 𝐰𝐢𝐭𝐡 𝐢𝐧 𝐚 𝐢𝐭𝐞𝐦 𝐢,𝒘𝒊𝒕𝒉 𝒊𝒏 𝒂𝒏 𝒆𝒗𝒆𝒕𝒏𝒔 𝑲

𝜙𝑢(𝑡):ユーザの自己プロフィールなど

𝜙𝑖(𝑡):アイテムのカテゴリや説明など

Page 24: 第2回 NIPS+読み会・関西 発表資料 山本

ホークス型モデルの効果Evolution with Hawkes interaction feature averaging processes

24

User’s and item’s features can evolve and be

influenced by the characteristics of their interactions.

We choose the exponential kernel 𝓚𝝎 𝒕 = 𝒆𝒙𝒑(−𝝎𝒕)to reduce the influence of each past event. In other

words, only the most recent interaction events will

have bigger influences.

Page 25: 第2回 NIPS+読み会・関西 発表資料 山本

共進化とホースク型モデル平均Coevolution with Hawkes feature averaging process

25

ある時刻𝒕𝒌のユーザ潜在変数𝑼𝒖(𝒕𝒌) とアイテム潜在変数𝒊𝒊(𝒕𝒌)を、𝐈𝐈と定義して(1), (2)を展開する

Page 26: 第2回 NIPS+読み会・関西 発表資料 山本

共進化とホースク型モデル平均Coevolution with Hawkes feature averaging process

26

ある時刻𝒕𝒌のユーザ潜在変数𝑼𝒖(𝒕𝒌)とアイテム潜在変数𝒊𝒊(𝒕𝒌)を、 𝐈𝐈と定義して(1), (2)を展開する

ユーザ強度 * ユーザ base drift ユーザ強度 * インタラクション強度

ユーザ強度 * アイテム base drift ユーザ強度 * インタラクション強度あるユーザuのユーザ潜在変数

Page 27: 第2回 NIPS+読み会・関西 発表資料 山本

共進化とホースク型モデル平均Coevolution with Hawkes feature averaging process

27

外的要因と内的要因を一つのモデルとして定義

base driftに従った外的要因 インタラクションに従った内的要因

Page 28: 第2回 NIPS+読み会・関西 発表資料 山本

点過程ユーザ・アイテム・インタラクションUser-Item Interactions as Temporal Point Processes

28

ユーザ・アイテムの強度関数

𝜼 = (𝜼𝒖,𝒊): base preference matrix

何を使うべきか書かれていないが利点は、

• インタラクションの異質性を軽減する

• ユーザの長期的な趣向を確保する

• short-term preferenceが瞬間的な特徴に左右される

• 強度関数の正の値を保証する

ユーザ潜在変数とアイテム潜在変数の内積

Page 29: 第2回 NIPS+読み会・関西 発表資料 山本

パラメータ推定Parameter Estimation

29

イベントの集合𝚻、時間幅 [𝟎, 𝚻) のとき

最尤推定でパラメータを推定

負の対数尤度 ℓ

The objective function is non-convex in variables {A, B, C, D} due to the inner product term in (3)

Page 30: 第2回 NIPS+読み会・関西 発表資料 山本

凸目的関数Convex Objective Function

30

式(3)は、𝑼𝒖(𝒕) には𝑪,𝑫が含まれ、𝒊𝒊(𝒕)には𝑨,𝑩が含まれる

Page 31: 第2回 NIPS+読み会・関西 発表資料 山本

凸目的関数Convex Objective Function

31

式(3)を展開すると、内積項から𝓧が表れる

この𝓧を 𝑿𝒊として式(3)を強度関数𝚲 𝐭 = 𝝀𝒖,𝒊(𝒕) に 書き換える

𝑿𝒊の係数𝒙𝒊(𝒕) は算出が可能

強度関数𝚲は𝑿𝒊に対して凸

Page 32: 第2回 NIPS+読み会・関西 発表資料 山本

低ランク行列The row rank space sharing

32

𝑿を左右対象のブロック行列にする

𝑨⊺などが共通空間が存在するので低ランクにすることが可能

低ランクどうしの内積は低ランクとなる

𝑿の核型ノルム(nuclear norm)を最小限に抑えることで、すべての低ランクの空間共有の制約が保証される。

Page 33: 第2回 NIPS+読み会・関西 発表資料 山本

目的関数Objective function

33

新しい変数Xを用いた最小化すべき目的関数

ℓ:対数尤度関数(4)

∥・∥𝑭: フロベニウスノルム(Frobenius norm)

𝜶, 𝜷, 𝜸 :制約のトレード・オフを調整する

目的関数から求まったパラメータを用いて強度関数𝚲(𝐭)算出して予測問題を解く

Page 34: 第2回 NIPS+読み会・関西 発表資料 山本

最小化アルゴリムGeneralized Conditional Gradient Algorithm

34

• 最新の一般化された条件付き勾配アルゴリズム [9]

• 収束は𝑂(𝟏

𝒕+

𝟏

𝒕𝟐) を保証 (tはイテレーション回数)

• 核ノルム制約が存在しない場合、 𝑂(𝟏

𝒕𝟐)で収束

• 非負数制約が存在しない場合、 𝑂(𝟏

𝒕)で収束

• 1イテレーションは𝑂(𝒎𝒏𝒌) 𝐦ユーザ数、𝒏アイテム数、𝒌イベント

数/ユーザ・アイテム

[9] N. Du, Y. Wang, N. He, and L. Song. Time sensitive

recommendation from recurrent user activities. In NIPS, 2015.

Page 35: 第2回 NIPS+読み会・関西 発表資料 山本

Highlight Data

Page 36: 第2回 NIPS+読み会・関西 発表資料 山本

予測と評価Predictions and metrics

36

a. アイテム・レコメンデーション

• ある時刻tにおけるユーザの生存確率Sui(t)を算出

• Sui(t)を昇順に並べてアイテムをレコメンド

• 評価はMean Average Rank(MAR)

b. 時刻予測

• 次イベントの確率密度f(t)を算出

• 評価はMean Absolute Error(MAE)

Page 37: 第2回 NIPS+読み会・関西 発表資料 山本

比較competitors

37

• TimeSVD++: the classic matrix factoraization

• FIP: a static low rank latent factor model

• STIC: a semi-hidden markov model (時刻予測のみ)

• Poisson Tensor: Poisson Regression

• Dynamic Poisson: the Poisson factorization with a

Kalman filter(アイテム・レコメンドのみ)

• Low Rank Hawkes: a Hawkes Process based model

epockbased models

Page 38: 第2回 NIPS+読み会・関西 発表資料 山本

人工データでの性能評価と結果Experiments on Synthetic Data and Results

38

1,000ユーザ1,000アイテム

10,000イベントを生成

Page 39: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データでの性能評価Experiments on Real-World Data

39

• IPTV: TVストリーミング・サービス

• 7,100ユーザ視聴履歴、436プログラム、2,392,010イベント、

1,420映像属性

• Reddit: 掲示板サイト

• 2014年1月〜、1,000ユーザ、1,403グループ、10,000イベント

• Yelp:ローカルビジネスレビューサイト

• 2004年10月〜2015年12月、100ユーザ、17,213ビジネス、約

95,000レビュー

Page 40: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データの属性Features

40

Item base

feature

User base

feature

Interaction

feature

IPTV 1,420 movie

features

N/A N/A

Reddit N/A N/A Comment

(bag-of-words)

Yelp Business

description

N/A Review

(bag-of-words)

Page 41: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データでの結果Results - IPTV

41

Page 42: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データでの結果Results - Reddit

42

Page 43: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データでの結果Results - Yelp

43

LOW RANK HAWKES might be good at differentiating the rank of

intensity better than COEVOLVE . However, it may not be able to learn

the actual value of the intensity function accurately. Hence our method

has the order of magnitude improvement in the time prediction task.

Page 44: 第2回 NIPS+読み会・関西 発表資料 山本

実世界データでのユーザの時間的遷移Time-varying in IPTV and Reddit

44

AppleがSamsungに勝訴したとき

Page 45: 第2回 NIPS+読み会・関西 発表資料 山本

Summary

Page 46: 第2回 NIPS+読み会・関西 発表資料 山本

まとめConclusion

46

• ユーザ・アイテムの潜在変数の共進化を効率よくモデリング

• 大規模なデータセットに対しても優れた予測精度を達成

• 将来的にはソーシャル・グラフの動的モデリングやQ&Aサイトの

ユーザ行動の理解などに応用する