Upgrade to Pro — share decks privately, control downloads, hide ads and more …

How to create the perfect recommendation

Summit
September 05, 2018

How to create the perfect recommendation

¿Cómo crear la recomendación perfecta?

Summit

September 05, 2018
Tweet

More Decks by Summit

Other Decks in Technology

Transcript

  1. Cómo crear la recomendación perfecta Josep Curto CEO, Delfos Research

    | Director Académico, Master Big Data y BI, UOC @josepcurto, 2018
  2. 2 Me presento • CEO, Delfos Research • Director Académico,

    Master Big Data y BI, UOC • Advisor, Institute of Passion • Autor de multiples artículos y libros @josepcurto, 2018
  3. Un Sistema de Recomendación (RS) es una colección de software

    y ténicas que permite proporcionar recomendaciones útiles a un usuario. 5 @josepcurto, 2018
  4. 6 Tenemos dos tipos de recomendación Cada usuario recibe una

    recomendación diferente Personalizadas Basadas en reglas simples. Por ejemplo, artículos más leídos No personalizadas @josepcurto, 2018
  5. 7 El problema a resolver Estimar una función de utilidad

    que automaticamente haga una predicción respecto las preferencias de los usuarios La meta • Comportamiento pasado • Relaciones otros usuarios • Atributos productos/servicios • Similitud productos/servicios • Contexto Fundamentado en @josepcurto, 2018
  6. 8 Dos pasos Datos Offline Online Modelo De usuario De

    productos Contextuales Contexto & Interacción usuario → Recomendaciones @josepcurto, 2018
  7. 9 Técnicas Collaboration- filtering Content-based Group-based Context- awareness based Computational

    intelligence- based Knowledge- based Hybrid Social network- based @josepcurto, 2018
  8. 10 Content-based (I) • Basado en item-content • Uso de

    atributos/características de producto • Las recomendaciones descritas mediante keywords • Uso de similitud basado en keywords para generar recomendacions @josepcurto, 2018
  9. 11 Content-based (II) Ventajas • No necesita datos de usuario

    • No cold-start o sparsity • Posible recomendar novedad, popularidad o unicidad • Proporciona explicaciones Inconvenientes • Requiere atributos por producto codificados de forma adecuada • La extracción de atributos puedes ser complicada • No vinculada a los gustos reales • Overfitting @josepcurto, 2018
  10. 12 Collaboration-filtering (I) • Basados en la opinión explicita o

    implícita de los usuarios respecto los productos • Se define una métrica para medir la similitud entre usuarios • Permite definir un subconjunto de vecinos • Dos tipos: user-based, item-based @josepcurto, 2018
  11. 13 Collaboration-filtering (II) Ventajas • Usuarios y productos son símbolos

    sin estructura interna • Produce en la mayoría de casos resultados suficientemente buenos Inconvenientes • Es necesaria una cantidad importante de opiniones (cold start) • Requiere que los productos estén estandarizados • Asume que el comportamiento previo define el actual @josepcurto, 2018
  12. 14 Knowledge-based • Fundamentado en el conocimiento de usuarios, productos

    o relaciones • Domain-knowledge/ontology Aproximaciones: case-based reasoning y instance-based • Ventajas: no cold start • Inconvenientes: knowledge acquisition @josepcurto, 2018
  13. 15 Hybrid • Combina las mejores características de dos o

    más RS • Siete mecanismos de combinación: weighted, mixed, switching, feature combination, feature augmentation, cascade y meta-level • Enfoque tradicional: combinar CF con otros para evitar problemas de cold-start, sparseness y scalability @josepcurto, 2018
  14. 16 Computational intelligence-based • Basado en Machine Learning • Puede

    usar: Bayesian techniques, artificial neural networks, clustering techniques, genetic algorithms y fuzzy set techniques @josepcurto, 2018
  15. 17 Social-network based • Surge de las redes sociales •

    Basado en la confianza de las personas • Usa índice de confianza (similarity score) • Necesita: contenido de usuarios, identificar temas, ponderar votos, detectar comunidades,… @josepcurto, 2018
  16. 19 Group–based @josepcurto, 2018 Inspirado en la elección social: ¿cómo

    escoger la mejor elección para el grupo? • Dos estrategias: Profiles aggregation, Recommendations aggregation • Teorema de Arrows: there is no fair voting system • Uso frequente de Kemeny- Optimal aggregation/heuristics: Borda count, Spearman footrule distance, Average, Least misery, Random
  17. 20 Qué ha funcionado tradicionalmente mejor • En general, CF

    es la major opción independiente • Depende del dominio y del problema • Hybrid se está imponiendo para mejorar CF, CB y KB • Lo importante: data processing, outliers, denoising, borrar resultados obvios, reducción de dimensionalidad,… @josepcurto, 2018