Clase 1: Sistemas de Recomendación_Introducción

  • Introducción a los sistemas de recomendación, poniendo como ejemplo el caso de Netflix y Amazon que resolvieron los problemas de recomendación basados en sistemas RecSys (Recommender Systems)
  • Algunos sistemas de recomendación
    • En 1992 Xerox PARC Tapestry
    • MovieLens
    • NetFlix Prize (2007-2009)
    • Netflix en 2012
    • Netflix en 2017

  • Revisión de modelos de clasificación del vecino cercano (Knn), revisando pros y contras del modelo, también se revisó el modelo K-means


  • Ranking no personalizado. Varias opciones. Si consideramos que los ítems a rankear tienen valoraciones positivas y negativas, el ranking ideal debería considerar la proporción de valoraciones positivas y la cantidad de muestras consideradas: una opción sería el límite inferior del Intervalo de Confianza del Wilson Score, para un parámetro Bernoulli.


  • Filtrado  colaborativo (basado en el usuario) Buscamos los K usuarios más parecidos a nuestro "active" o "center" user (K-NN). Luego,hacemos predicción de items que los vecinos han consumido, pero que el "active user" no ha consumido aún. Basado en:

  • Vecinos Cercanos
  • Predicciones


  • Pros y Contras del Filtrado Colaborativo User-Based (KNN)
Pros
Contras
Fácil de implementar
Sparsity (Escasez)
Independiente del contexto
Cold-start (es un problema potencial de los equipos basado en sistemas de información, que implican un grado de automatizado de datos de modelos. En concreto, se refiere a la cuestión donde el sistema no puede extraer inferencias para los usuarios o temas sobre los que aún no ha reunido suficiente información)
Comparado con otras técnicas, como basado en contenidos, más precisa
New Item

o   En otras opciones al Filtrado Colaborativo
o   Model-based methods
o   Clustering
o   Graph-based methods
o   Item-Base recommendation

  • Correlación de Pearson: índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

  • Revisión de métodos de evaluación de recomendación gracias a los siguientes métodos estadísticos: RMSE (root-mean-square error), MSE (mean squared error) y MAE (mean absolute error).
   

  • Alternativa UB-CF con Cluestering. Creación de usuarios de cluster con la ayuda de K.means, donde K-means, es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.
     
  • Data Smoothing, técnica utilizada para eliminación de ruido en los datos


  •        Flujo de selección



          Donde:
o   Pre-Selección de Vecindario, Comparación de características de vecinos considerando solo los clusters más promisorios.
o   Selección de vecinos, Después de la pre-selección, recalculamos similaridad considerando rating original y rating del grupo, usando un factor de balance, luego se calculan los K usuario más cercanos
o   Selección con ayuda de la fórmula adjunta.



Comentarios

Entradas populares de este blog

Clase 4 - METRICAS DE EVALUACIÓN DE SISTEMAS DE RECOMENDACIÓN.

Clase 5: Recomendación Basada en contexto