recsys challenge 2014 “user...

38
José Miguel Herrera RecSys Challenge 2014 “User Engagement” José Miguel Herrera

Upload: others

Post on 29-May-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

José Miguel Herrera

RecSys Challenge 2014“User Engagement”

José Miguel Herrera

Page 2: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

RecSys Challenge 2014• Se centra en evaluación.

• Dataset de Twitter.

• En vez de predecir ratings y recomendación, predicen que ítems generarán mayor user engagement (favs + RTs).

• Optimiza recomendaciones.

• nDCG@10

RecSys Challenge 2014“User Engagement”

Page 3: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Twitter

Page 4: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

(Twitter)

Max. 140 caracteres.

Usuario

One-way following connections:

* Following * Followers

Page 5: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

MovieTweetings Dataset*

* S. Dooms and T. De Pessemier, “Movietweetings: a Movie Rating Dataset Collected From Twitter,” presented at the RecSys'13: Recommendation System Conference, 2013.

RecSys Challenge 2014“User Engagement”

Page 6: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

MovieTweetings Dataset*

Usuario / Ítem / Rating

* S. Dooms and T. De Pessemier, “Movietweetings: a Movie Rating Dataset Collected From Twitter,” presented at the RecSys'13: Recommendation System Conference, 2013.

RecSys Challenge 2014“User Engagement”

Page 7: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

MovieTweetings Dataset*RecSys Challenge 2014

“User Engagement”

+ Metadata

* S. Dooms and T. De Pessemier, “Movietweetings: a Movie Rating Dataset Collected From Twitter,” presented at the RecSys'13: Recommendation System Conference, 2013.

Usuario / Ítem / Rating

Page 8: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Paper 1

Usan features de Twitter (dataset extendido)

Learning to rank.

5to lugar

Page 9: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR) Técnica ML para resolver problemas de ranking.

Típicamente supervisado

Usado: IR, NLP, RecSys.

Se entrena un modelo usando una lista de elementos con algún orden especial.

Page 10: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)q1

{doc3, doc1, doc2}{doc1, doc2, doc3}

1: q1, f(doc3) 2: q1, f(doc1) 3: q1, f(doc2)

Page 11: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)q1

{doc3, doc1, doc2}{doc1, doc2, doc3}

1: q1, f(doc3) 2: q1, f(doc1) 3: q1, f(doc2)

q2

{doc5, doc4}{doc4, doc5}

1: q2, f(doc5) 2: q2, f(doc4)

Page 12: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)

Función de Ranking(model)

q1

{doc3, doc1, doc2}{doc1, doc2, doc3}

1: q1, f(doc3) 2: q1, f(doc1) 3: q1, f(doc2)

Train

qn

{docsorted}{doc1..z}

1: qn, f(docx1) 2: qn, f(docx2) 3: qn, f(docx3) 4: qn, f(docx4) 5: qn, f(docx5) 6: qn, f(docx6)

….

q2

{doc5, doc4}{doc4, doc5}

1: q2, f(doc5) 2: q2, f(doc4)

Page 13: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)

Función de Ranking(model)

q1

{doc3, doc1, doc2}{doc1, doc2, doc3}

1: q1, f(doc3) 2: q1, f(doc1) 3: q1, f(doc2)

qn

{docsorted}{doc1..z}

….

q2

{doc5, doc4}{doc4, doc5}

Testing

1: qn, f(docx1) 2: qn, f(docx2) 3: qn, f(docx3) 4: qn, f(docx4) 5: qn, f(docx5) 6: qn, f(docx6)

1: q2, f(doc5) 2: q2, f(doc4)

Train

qw

Page 14: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)

q : usuarios feat.: tweets

* F.Objetivo: Loss* no detalle point, pair, listNo usado porque hay que capturar features. En Cambio knn, matriz fact, son más rápidos cuando están disponibles. Acá query: usuarios, documentos: tweets.

T.-Y. Liu, Learning to Rank for Information Retrieval, vol. 3, no. 3. Springer Science & Business Media, 2011, pp. 312–331.

Page 15: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)

q : usuarios feat.: tweets F.objetivo

Loss function

Page 16: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Learning to Rank (LTR)No es muy utilizado

(vs KNN, MF)

q : usuarios feat.: tweets F.objetivo

Loss function

Page 17: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Approach• User engagement prediction en Twitter como un

problema de LTR.

• Representar un ranking de tweets por usuario.

• Medida de relevancia de un tweet con respecto a los otros tweets (training).

• Objetivo: Construir un modelo de ranking para optimizar nDCG@10.

Page 18: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

User engagement

Page 19: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

User engagementvector de features Label: (u, i, d)

Ranking function

Scoring function Free Parameters to be learned

Page 20: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Features Extraction

Page 21: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Experimentos• MART: gradient boosted regression.

• Técn ica para p rob lemas de regres ión y clasificación. Produce un modelo de predicción en base a clasificadores débiles (árboles).

• LambdaMART:

• Optimiza métricas de IR usando λ-gradientes.

• Problemas similares optimiza con buen performance nDCG@10.

Page 22: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Experimentos

Page 23: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

BaselinesFM: Factorization Machine (libFM)

✤ Método de factorización: Markov Chain Monte Carlo.

recRating: rating asociado (u,i,d) en base a user engagement.

recHEI: promedio de user engagement de un item en el pasado.

recRandom: valor random user engagement.

Page 24: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Resultados

(rating, engagement): frecuencia

Altos ratings tienden a recibir alto engagement.

Histórico user engagement que recibe un item es un buen predictor del futuro.

Page 25: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Paper 2

Learning to rank (+) regresión.

Usan otras features (agrupan).

Lugar 4 // 1ros sin usar recursos externos.

Page 26: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Extracted features

Actividad del usuario en Twitter

Popularidad del ítem

Tweet y Contexto

Page 27: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Extracted features

Feature selection

Actividad del usuario en Twitter

Popularidad del ítem

Tweet y Contexto

Page 28: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Regresión• Extremely Randomized Trees (Extra-trees)

• Bayesian Ridge Regression

• Stochastic Gradient Descent Regression (SGDR)

• Modelo RL, trata de poner un modelo lineal minimizando una función de pérdida usando la técnica Descenso del Gradiente.

Page 29: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

LTRListNet Método probabilistico - computa dif permutaciones

Ranking SVM Usa SVM para computar de a pares.

AdaRank Construir clasificadores débiles y combinarlos.

RankNet NN de 3 capas, compara de a pares.

LambdaRank Usa Gradient descent (similar a RankNet)

ListMLE Maximizar función de pérdida logarítmica (similar a ListNet)

Page 30: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Resultados (2)

Feature selection no ayudó.

Importancia de hacer Feature selection para LTR.

Page 31: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Resultados (2)

Agregación de todos los métodos (supervised Kemeny Approach).

asume que cada ranker tiene un peso.

Agregación mejoró los resultados.

Feature selection no ayudó.

Importancia de hacer Feature selection para LTR.

Page 32: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Comentarios• No hay estudio de features.

• LTR es una buena opción para hacer recomendación*.

• + info

• 2do paper considera user-based.

* A. Karatzoglou, L. Baltrunas, and Y. Shi, “Learning to Rank for Recommender Systems,” presented at the RecSys'13: Recommender System Conference 2013, New York, New York, USA, 2013, pp. 493–494.

Page 33: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Preguntas[1] H. Zamani, A. Shakery, and P. Moradi, “Regression and Learning to Rank Aggregation for User Engagement Evaluation” presented at the the 2014 Recommender Systems Challenge, New York, New York, USA, 2014, pp. 29–34.

[2] E. Diaz-Aviles, H. T. Lam, F. Pinelli, S. Braghin, Y. Gkoufas, M. Berlingerio, and F. Calabrese, “Predicting User Engagement in Twitter with Collaborative Ranking” presented at the the 2014 Recommender Systems Challenge, New York, New York, USA, 2014, pp. 41–46.

[3] H. Li, “A Short Introduction to Learning to Rank” IEICET, vol. 94, no. 10, pp. 1854–1862, 2011.

[4] T.-Y. Liu, Learning to Rank for Information Retrieval, vol. 3, no. 3. Springer Science & Business Media, 2011, pp. 312–331.

[5] A. Karatzoglou, L. Baltrunas, and Y. Shi, “Learning to Rank for Recommender Systems” presented at the RecSys'13: Recommender System Conference 2013, New York, New York, USA, 2013, pp. 493–494.

Page 34: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

Notas adicionalesRemover outliers ayudó (usuarios con pocos ratings).

Z-Score ayudó a mejorar el desempeño del ranking.

Bajaron más datos de IMDb (no lo publicaron), pero obtuvieron mejores resultados.

Probaron CF (KNN, MF) sin buenos resultados.

Page 35: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

LTRListNet Listwise Método probabilistico - computa dif permutaciones

Ranking SVM Pairwise Usa SVM para computar de a pares.

AdaRank Listwise Construir clasificadores débiles y combinarlos.

RankNet Pairwise NN de 3 capas, compara de a pares.

LambdaRank Pairwise / Listwise Usa Gradient descent (similar a RankNet)

ListMLE Listwise Maximizar función de pérdida logarítmica (similar a ListNet)

1: q1, f(doc3) 2: q1, f(doc5) 3: q1, f(doc2) 1: q2, f(doc1) 2: q2, f(doc3) 1: q3, f(doc2) 2: q3, f(doc3) 3: q3, f(doc6)

Page 36: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

LTRListNet Listwise Método probabilistico - computa dif permutaciones

Ranking SVM Pairwise Usa SVM para computar de a pares.

AdaRank Listwise Construir clasificadores débiles y combinarlos.

RankNet Pairwise NN de 3 capas, compara de a pares.

LambdaRank Pairwise / Listwise Usa Gradient descent (similar a RankNet)

ListMLE Listwise Maximizar función de pérdida logarítmica (similar a ListNet)

Pointwise1: q1, f(doc3) 2: q1, f(doc5) 3: q1, f(doc2) 1: q2, f(doc1) 2: q2, f(doc3) 1: q3, f(doc2) 2: q3, f(doc3) 3: q3, f(doc6)

Page 37: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

LTRListNet Listwise Método probabilistico - computa dif permutaciones

Ranking SVM Pairwise Usa SVM para computar de a pares.

AdaRank Listwise Construir clasificadores débiles y combinarlos.

RankNet Pairwise NN de 3 capas, compara de a pares.

LambdaRank Pairwise / Listwise Usa Gradient descent (similar a RankNet)

ListMLE Listwise Maximizar función de pérdida logarítmica (similar a ListNet)

Pairwise

Pointwise1: q1, f(doc3) 2: q1, f(doc5) 3: q1, f(doc2) 1: q2, f(doc1) 2: q2, f(doc3) 1: q3, f(doc2) 2: q3, f(doc3) 3: q3, f(doc6)

Page 38: RecSys Challenge 2014 “User Engagement”dparra.sitios.ing.uc.cl/classes/recsys-2016-2/students/recsysch14_herrera.pdf · RecSys Challenge 2014 • Se centra en evaluación. •

LTRListNet Listwise Método probabilistico - computa dif permutaciones

Ranking SVM Pairwise Usa SVM para computar de a pares.

AdaRank Listwise Construir clasificadores débiles y combinarlos.

RankNet Pairwise NN de 3 capas, compara de a pares.

LambdaRank Pairwise / Listwise Usa Gradient descent (similar a RankNet)

ListMLE Listwise Maximizar función de pérdida logarítmica (similar a ListNet)

Listwise

Pairwise

Pointwise1: q1, f(doc3) 2: q1, f(doc5) 3: q1, f(doc2) 1: q2, f(doc1) 2: q2, f(doc3) 1: q3, f(doc2) 2: q3, f(doc3) 3: q3, f(doc6)