tori lab 輪読会 www 2014 - modeling and predicting the growth and death

Post on 06-Aug-2015

436 Views

Category:

Science

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Modeling and Predicting the Growth and Death of

Membership-based WebsitesWWW 2014 輪講会 発表者 :  浅谷 公威 Kimitaka Asatani

2014/05/31

ABSTRACT

• 様々な種類の22個の Website の DAU(Daily Active User) を調べる• Online social networks, grass root movements, online forums and

membership only Internet stores.

• Reaction diffusion decay プロセスを用いて、 DAU をフィッティング• 今後の DAU を予測• Classify Community

• Self-sustainable vs un-un sustainable• Classify Startup Process

• Marketing or word of month adoption

DAU(Daily Active User)

• これまでの研究は Number of members を使って Web サイトを評価• DAU は以下を示す指標として Number of members より優れてい

る• Social impact• Potential of revenue

• DAU のデータを入手し予測する• 生涯にわたって不変なダイナミクスを検出する• メンバー情報とかの特性をインプットとしない

Reaction diffusion decay equations

• Attention seeking interactions between • active members• In-active members• No Yet members

• Take into account • web サイトによるユーザーの興味を惹きつけようとする企画を実施• ユーザー間の相互作用で、ユーザーがアクティブになる

In an information-rich world our attention is bound to become one of our most scarce, important and vied-for resources. (Herbert. A. Simon 1971)

注 :近年では、インフォーメーションの欠乏ではなく注意の欠乏が問題情報のフィルターをシステムとして実現しなければならない (Herbert. A. Simon 1996)

目次• Sec. 2 presents the related work.• Sec. 3 presents our proposed model and the algorithm to fit its

parameters to the datasets. • Sec. 4 fits the parameters to the datasets and present the fit and

prediction results. • Sec. 5 presents our conclusions.

Related works

• Adoption model (ユーザーの状態遷移のモデル)1. Network effect adoption models

• Individual Rationality and adoption cost in game theoretic framework• E.g. K – core network analysis on Friendster network• They do not consider Role of user activity

2. Threshold adoption models• An individual adopts if enough of his or her friends are adopters.• E.g. Product adoption on network • Only local view of network is considered

Related works

• Adoption model (ユーザーの状態遷移のモデル)3. Diffusion of innovation models

• Influence others to adopt through word-of-mouth, marketing…• Demand forecasting at the aggregate level. • Various type of S –shaped curve of number of adopters.

4. Adoption models from influence and network structure• Considering the roles of edge on network.• E.g. the probability of non-member user joins the network increase linearly with the

number of invitations.  我々のモデルに有用

Related works

• 先行研究は total number of user について議論• DAU を議論する必要がある• そのためには、 attention-seeking interaction between active /

inactive users についてモデル化する必要がある• Facebook は他のユーザーのアクティビティを表示し、ユーザーを

incites→Active member の活動が in active member の active さへ影響を与えているといえる • また、 news サイト等は、他のメンバーがコンテンツに惹かれて

やってくる→Non member の活動も考慮する必要がある

Proposed Model

• Chemical Reaction Process• Molecules

• A: active user • I: in-active user• U: Non member

• Reaction• A + I → 2A    (α)• A → I       (β)• A + U → 2A   (γ)• U → A      (λ)

• Under the condition of• A(t) + I(t) + U(t) = C. • As C is the fraction of active Internet population

Long time evolution

After a certain – possibly large – time t, the website nearly exhausts its pool of non-members

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Long time evolution

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Signature of growth

Media and marketing intensive

Word-of-mouth intensive

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Signature of growth

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Fit the parameter to Dataset

• Dataset• 22 web sites from 2007 to 2013

• Online social networks, grass root movements, online forums and membership only Internet stores.

• Automatic parameter fit

局所最適解の集合  α, β, λ, γ, and C

初期パラメータ :   α, β, λ, γ, and C時系列データ

一番よい局所最適解  α, β, λ, γ, and C

k-medoids clustering Levenberg-Marquardtalgorithm

Levenberg-Marquardt algorithm

• 目的 : 非線形最小二乗法を解く• 与えられたモデル関数 y = f (x , β) が m 個のデータ点 {(xi , yi ); i =

1, ... , m } に最もよくフィットするような n 個のパラメータ β = (β1 , ... , βn ) を見つける

• Gauss-Newton 法の拡張• 初期推定値からの解の乖離や、非線形性による不安定性を回避

• 具体的な方法• モデル関数とデータ点の差異を二階微分した点が零になる場所を探す• ステップ

• (a) 二階微分を一回微分の二乗で近似する (Gauss-Newton 法 )• (b) 安定性の向上の工夫を入れる (Levenberg-Marquardt 法の独自 )

K-medoids によるクラスタリング • K-medoids• クラスタリング手法• K-means に比べ、ロバスト、ノイ

ズの影響を受けない• 今回は• K-medoids を用いてクラスタリン

グ• 3つ以上の要素を含むクラスタの

中で、最も高いフィッティング精度を持っているものを抽出

K-medoidsクラスタ内のデータ点で,その点以外のクラスタ内の点でまでの非類似度の総和が最小になる点

K-means1. 各点にランダムにクラスタを割当2. クラスタの重心の点を計算3. 点のクラスタを、一番近い重心のクラスタに変

更4. 変化がなければ終了。あれば 2. に戻る

Long-term DAU sustainability• Self-Sustaining

• Huffingtonpost• Facebook 等は意外とこの傾向が強くない

• Unsustainable• Party website• Fads (12second.tv)• Dating(true.com)

• 中間• (Immoral dating)MarriedSecrets,

AshleyMadison

• 一般的な認識と一致

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Signatures of growth• Media and campaign

• Ebay, theblaze(保守系ニュース )

• Word of mouth• Others

• 基本的には口コミによって広がっていくと言える• Theblaze がメディア・キャンペーンなのに、 Huffingtonpostと Daily News が口コミであることが不明

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Predicting future trends

• First Few Years のみのデータをインプットして、パラメータをフィッティング• その後の DAU の時系列をシミュレートし、実際のデータと比較

する

Predicting future trendsUnsustainable

• フィッティング出来たと著者は主張

• Inaccurate• True.com Adaptu.com.

• strong competitor• Brandstack.com

• Change the policy

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Predicting future trendsSelf - sustainable

• Good result• Facebook.com

• Changing the growth strategy during the period• TheHuffingtonPost.com

• Unpredictable spike• TheBlaze.com

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Conclusion

• Through reaction – decay - diffusion process, we model the dynamics of websites.• Predict the trend

• DAU signatures of growth• media & marketing versus word-of-mouth

• DAU signatures of long term stability • self-sustaining versus unsustainable

• Future work • tailor the above reaction-diffusion-decay dynamics to specific types of websites and

changing environments (e.g., new technologies and competition)• Modeling a broad range of dynamics of societal movements

感想• モデルについて

• モデルは単純なので他に応用可能• 問題点

• パラメータは時系列で変化するのでは?• 反応方程式のように各状態のユーザーの量に比例した確率でいいの?• β>>α でないと最終的に収束する過程は観測できない• Exogenous な効果はあつかえない

• Sir モデルとの対比• ネットワークが存在しない• I -> A が繰り返し起き、現実に近い• パラメータ数が多くフィッティングしやすい

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

何に使えるか• 局所最適解の集合をクラスタリングし最適解を導出する手法は勉強になった• 今後つかうとしたら• Nifty のデータに適応可能• Self-sustaining / unsustainable と  word-to-mouth / media-and-campaign

という分類をつかう

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

top related