Entradas

Clase 5: Recomendación Basada en contexto

Imagen
-         Contexto, responde a las preguntas: Donde estas, Con quien Estas, Que recursos hay alrededor. Un contexto considerado como relevante varía según el área. -         Obtención de Información Contextual: o    Explicito (Encuestas) o    Implicitamente (información de dispositivos, por ejemplo hora, ubicación) o    Infiriendo (ver comportamientos de distintos usuarios que ven películas con una misma cuenta) -         Contexto en sistemas de recomendación o    Observable / Parcialmente / No Observable o    Estático / Dinámico -         Paradigmas para incorporar contexto: Pre – Filtrado, Post – Filtrado, Modelado Contextual -         Se analizan los casos o    Pre-filtrado, para recomendaciones dependientes basado...

Clase 4 - METRICAS DE EVALUACIÓN DE SISTEMAS DE RECOMENDACIÓN.

Imagen
MÉTRICAS DE EVALUACIÓN DE SISTEMAS DE RECOMENDACIÓN. Estas métricas nos permite determinar de qué forma los métodos de evaluación propuestos cumplen con el objetivo que se persigue.                 La evaluación se ve influida por algunos indicadores: -           Dependiendo de las características del Set de datos, dependerá el funcionamiento del algoritmo. -           Cuando evaluamos un sistema de recomendación queremos determinar qué tan cerca está la predicción de las elecciones reales de un usuario. No obstante lo anterior, el real objetivo debiera ser ayudar al “usuario” a tomar decisiones correctas. Para realizar predicciones, tenemos: Evaluación tradicional. Predicción de rating Error Absoluto Medio (MAE).              ...

Big data y política: una realidad de la cual Chile aún está lejos

Imagen
Big Data y política en Chile, buen artículo de el Mostrador, les dejo el link http://m.elmostrador.cl/noticias/pais/2017/05/07/big-data-y-politica-una-realidad-de-la-cual-chile-aun-esta-lejos/

Clase 3: Apache Solr + CDH Hue

Imagen
Solr es una herramienta para operaciones Hadoop mediante indexación a través de XML, JSON, CSV o Binario sobre plataforma HTTP. Los usuarios pueden realizar consultas de grandes volúmenes de información  ya que Apache Solr está configurado para trafico web de alto volumen. Apache Solr permite:     - Búsqueda avanzada de texto completo - I ndexación en tiempo real - Estándares Basados en Interfaces abiertas como XML, JSON y HTTP - Interfaces completas de administración HTML - Estadísticas de servidor expuestas a través de JMX para monitoreo - Replicación de índices automáticos escalable de forma lineal y recuperación     automática de fallos - Flexible y adaptable, con configuración XML. Solr es altamente fiable, escalable y tolerante a fallos. Tanto los analistas de datos como los desarrolladores de la comunidad de código abierto confían en las capacidades distribuidas de indexación, replicación y carga equilibrada de Solr. El panel...

Clase 2: Filtrado Colaborativo Basado en Items (Item-Based CF)

Imagen
Item- Based Collaborative Filtering Los sistemas de recomendación aplican técnicas de análisis de datos con el objetivo de ayudar a los usuarios a encontrar los artículos que les gustaría comprar en sitios de comercio electrónico, produciendo una puntuación de probabilidad predicha o una lista de recomendaciones para un usuario determinado. Las recomendaciones se pueden hacer utilizando diferentes métodos. Las recomendaciones pueden basarse en datos demográficos de los usuarios, en los artículos más vendidos en general o en el hábito de compra entre otros. ·      Si bien este método podría considerarse memory-based, los autores de Sarwar et al. lo consideran model-based, donde el parámetro  principal del modelo es K (número de ítems similares a considerar).  Los autores usan MAE (Mean Absolute Error) para evaluar métodos. ·      Resultados importantes para considerar en el análisis: o    Efecto de ...

Clase 1: Sistemas de Recomendación_Introducción

Imagen
Introducción a los sistemas de recomendación, poniendo como ejemplo el caso de Netflix y Amazon que resolvieron los problemas de recomendación basados en sistemas RecSys (Recommender Systems) Algunos sistemas de recomendación En 1992 Xerox PARC Tapestry MovieLens NetFlix Prize (2007-2009) Netflix en 2012 Netflix en 2017 Revisión de modelos de clasificación del vecino cercano (Knn), revisando pros y contras del modelo, también se revisó el modelo K-means Ranking no personalizado. Varias opciones. Si consideramos que los ítems a rankear tienen valoraciones positivas y negativas, el ranking ideal debería considerar la proporción de valoraciones positivas y la cantidad de muestras consideradas: una opción sería el límite inferior del Intervalo de Confianza del Wilson Score, para un parámetro Bernoulli. Filtrado  colaborativo (basado en el usuario) Buscamos los K usuarios más parecidos a nuestro "active" o "center" user (K-NN). Luego,hacemos pr...