Clase 1: Sistemas de Recomendación

Introducción a los sistemas de recomendación, poniendo como ejemplo el caso de Netflix y Amazon que resolvieron los problemas de recomendación basados en sistemas RecSys (Recommender Systems)

Algunos sistemas de recomendación

En 1992 Xerox PARC Tapestry
MovieLens
NetFlix Prize (2007-2009)
Netflix en 2012
Netflix en 2017

Revisión de modelos de clasificación del vecino cercano (Knn), revisando pros y contras del modelo, también se revisó el modelo K-means

Ranking no personalizado. Varias opciones. Si consideramos que los ítems a rankear tienen valoraciones positivas y negativas, el ranking ideal debería considerar la proporción de valoraciones positivas y la cantidad de muestras consideradas: una opción sería el límite inferior del Intervalo de Confianza del Wilson Score, para un parámetro Bernoulli.

Filtrado colaborativo (basado en el usuario) Buscamos los K usuarios más parecidos a nuestro "active" o "center" user (K-NN). Luego,hacemos predicción de items que los vecinos han consumido, pero que el "active user" no ha consumido aún. Basado en:

Vecinos Cercanos

Predicciones

Pros y Contras del Filtrado Colaborativo User-Based (KNN)

Pros	Contras
Fácil de implementar	Sparsity (Escasez)
Independiente del contexto	Cold-start (es un problema potencial de los equipos basado en sistemas de información, que implican un grado de automatizado de datos de modelos. En concreto, se refiere a la cuestión donde el sistema no puede extraer inferencias para los usuarios o temas sobre los que aún no ha reunido suficiente información)
Comparado con otras técnicas, como basado en contenidos, más precisa	New Item

o En otras opciones al Filtrado Colaborativo

o Model-based methods

o Clustering

o Graph-based methods
o Item-Base recommendation

Correlación de Pearson: índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Revisión de métodos de evaluación de recomendación gracias a los siguientes métodos estadísticos: RMSE (root-mean-square error), MSE (mean squared error) y MAE (mean absolute error).

Alternativa UB-CF con Cluestering. Creación de usuarios de cluster con la ayuda de K.means, donde K-means, es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Data Smoothing, técnica utilizada para eliminación de ruido en los datos

Flujo de selección

Donde:

o Pre-Selección de Vecindario, Comparación de características de vecinos considerando solo los clusters más promisorios.

o Selección de vecinos, Después de la pre-selección, recalculamos similaridad considerando rating original y rating del grupo, usando un factor de balance, luego se calculan los K usuario más cercanos
o Selección con ayuda de la fórmula adjunta.

Buscar este blog

Grupo9SistemasRecomendación

Clase 1: Sistemas de Recomendación_Introducción

Comentarios

Publicar un comentario

Entradas populares de este blog

Clase 4 - METRICAS DE EVALUACIÓN DE SISTEMAS DE RECOMENDACIÓN.

Clase 5: Recomendación Basada en contexto