Clase 1: Sistemas de Recomendación_Introducción
- Introducción a los sistemas de recomendación, poniendo como ejemplo el caso de Netflix y Amazon que resolvieron los problemas de recomendación basados en sistemas RecSys (Recommender Systems)
- Algunos sistemas de recomendación
- En 1992 Xerox PARC Tapestry
- MovieLens
- NetFlix Prize (2007-2009)
- Netflix en 2012
- Netflix en 2017
- Revisión de modelos de clasificación del vecino cercano (Knn), revisando pros y contras del modelo, también se revisó el modelo K-means
- Ranking no personalizado. Varias opciones. Si consideramos que los ítems a rankear tienen valoraciones positivas y negativas, el ranking ideal debería considerar la proporción de valoraciones positivas y la cantidad de muestras consideradas: una opción sería el límite inferior del Intervalo de Confianza del Wilson Score, para un parámetro Bernoulli.
- Filtrado colaborativo (basado en el usuario) Buscamos los K usuarios más parecidos a nuestro "active" o "center" user (K-NN). Luego,hacemos predicción de items que los vecinos han consumido, pero que el "active user" no ha consumido aún. Basado en:
- Vecinos Cercanos
- Predicciones
- Pros y Contras del Filtrado Colaborativo User-Based (KNN)
Pros
|
Contras
|
Fácil de implementar
|
Sparsity (Escasez)
|
Independiente del contexto
|
Cold-start (es un problema potencial de los equipos basado en sistemas de información, que implican un grado de automatizado de datos de modelos. En concreto, se refiere a la cuestión donde el sistema no puede extraer inferencias para los usuarios o temas sobre los que aún no ha reunido suficiente información)
|
Comparado con otras técnicas, como basado en contenidos, más precisa
|
New Item
|
o En otras opciones al Filtrado Colaborativo
o Model-based methods
o Clustering
o Graph-based methods
o Item-Base recommendation
o Item-Base recommendation
- Correlación de Pearson: índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
- Revisión de métodos de evaluación de recomendación gracias a los siguientes métodos estadísticos: RMSE (root-mean-square error), MSE (mean squared error) y MAE (mean absolute error).
- Alternativa UB-CF con Cluestering. Creación de usuarios de cluster con la ayuda de K.means, donde K-means, es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.
- Data Smoothing, técnica utilizada para eliminación de ruido en los datos
- Flujo de selección

Donde:
o Pre-Selección de Vecindario, Comparación de características de vecinos considerando solo los clusters más promisorios.
o Selección de vecinos, Después de la pre-selección, recalculamos similaridad considerando rating original y rating del grupo, usando un factor de balance, luego se calculan los K usuario más cercanos
o Selección con ayuda de la fórmula adjunta.
o Selección con ayuda de la fórmula adjunta.
Comentarios
Publicar un comentario