Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Données connectées et recommandations

Données connectées et recommandations

Présentation 9ème meetup graph-database neo4j France
http://www.meetup.com/graphdb-france/events/125411682/

"Avec les bases relationnelles, nous avons été habitués à penser les données et les applications de façon cloisonnée. Maintenant que les graphes sont accessibles à tous, il est temps de changer de vision, et d’aller au-delà des limitations artificielles auxquelles nous nous sommes accoutumées.

Quand on parle de graphe, on pense d’abord aux réseaux sociaux, et à la recommandation d’amis, avant de se rendre compte que le graphe fournit un moteur de recommandation beaucoup plus général.

Lors de ce meetup, on va encore aller plus loin, et essayer de comprendre ce que la phrase “everything is a graph” signifie vraiment pour vos données."

bendaizer

July 11, 2013
Tweet

Other Decks in Technology

Transcript

  1. Kernix 12 ans d’existence 35 collaborateurs 10 livres publiés Dev

    web et mobile Hébergement SEO Kernix Lab : agréé CIR Lauréat de 3 AAP nationaux Lauréat 5ième call Eurostars Lauréat 3ième Dataconnexions (Etalab) Avec Nous faisons :
  2. Kernix Lab Graphe Vecteurs Sémantiques Tracking « Ces technologies ont

    pour objectifs de permettre le suivi, l’optimisation et l’amélioration des performances des sites de nos clients (notamment avec la recommandation) » Nos axes de recherches principaux : Le Kernix Lab recrute (CDI, alternances, stages)
  3. Pas un tutoriel sur neo4j ni cypher … pas le

    temps L Sinon « neo4j » sur google groups
  4. item 1 item 2 item 3 item 4 item 5

    A 1 1 1 B 1 1 1 C 1 1 . . . . . . Matrice Utilisateurs - Produits Algèbre Linéaire
  5. item 1 item 2 item 3 item 4 item 5

    A 1 1 1 B 1 1 1 C 1 1 . . . . . . Matrice Utilisateurs - Produits Algèbre Linéaire Pas ce soir !
  6. A 1 1 1 0 0 B 0 1 1

    1 0 1 1 = 2 Produit scalaire = Nombre de produits en commun Personnes aux goûts similaires
  7. Traverser le graphe, explorer le « voisinage » « user

    based » Que me recommandent les utilisateurs qui ont mes goûts « item based » Quels produits reviennent souvent ensemble dans les paniers
  8. Un système par cas d’usage Limite technique : calcul matriciel

    avec trop de dimensions Approche globale Je dois passer par tout le monde pour chacun Pourtant matrice creuse très souvent !
  9. Approche ensembliste, je compte les objets en communs Mesurer la

    similarité Suffisant ? Normaliser par les degrés Jaccard Adamic-Adar Prendre en compte popularité Même nombre de liens en communs Pas nécessairement la même valeur
  10. Je combine différentes prédictions Je ne cherche pas à prédire

    de scores Je ne m’intéresse pas à l’ordre des résultats Quelle est la meilleure combinaison ? Test Modèle Données +
  11. Absents des résultats Résultats Résultats « incorrects » Validation Précision

    = Résultats corrects Résultats Rappel = Résultats corrects Validation
  12. Le graphe derrière la matrice matrice user-item = graphe d’interaction

    matrice similarité = graphe de similarité Moduler les similarités avec des Kernels K(x,y) = 1 pour Sim(x,y) > Seuil K(x,y) = 0 sinon
  13. Existe-t-il d’autres mesures locales? Il faut parcourir tout le graphe.

    On perd l’avantage de l’approche locale Centralités n’évoluent pas vite généralement
  14. deg(k) 4 3 3 2 . . . k 1

    2 3 4 . . . Classement par ordre décroissant Lobby Index Profondeur de 2
  15. CRM