Upgrade to Pro — share decks privately, control downloads, hide ads and more …

La data au coeur du produit

La data au coeur du produit

Presented at Paris Product Meetup with Julie Seguela and Thomas Neau.

C677be423ca7354bac7947406598c68c?s=128

Eugen Cepoi

October 01, 2013
Tweet

More Decks by Eugen Cepoi

Other Decks in Technology

Transcript

  1. La data au cœur des produits Viadeo Expérimentations, intégration, utilisations

  2. Anticiper les différents use-cases •15000 nouvelles skills ajoutées par jour

    •X millions de membres •Profils atypiques : jeunes diplômés, Créateurs d’entreprise… •Pertinence des données dans différentes langues
  3. Augmenter l’engagem ent de l’utilisateur Améliorer la complétion de profil

    Développer les contacts entre les membres Optimiser les fonctionnalité s du produit Viadeo & objectifs long terme
  4. Jobs Skills Contacts Ecoles Entreprises Viadeo

  5. d’emploi Quels algorithmes ? « Recommander un job identique à

    celui occupé » « Recommander une offre identique à celles auxquelles le membre a candidaté par le passé » Je cherche un « développeur web » Je suis « développeur web »
  6. Ce dont on a besoin Extraire le métier et les

    compétences à partir d’un profil membre Extraire le métier et les compétences à partir d’une offre d’emploi
  7. Mais Nous sommes rapidement confrontés à des problèmes…

  8. Des profils incomplets… Membre 1 Skills Job Schools Companies Web

    developer Viadeo, IBM
  9. … et hétérogènes Membre 1 Membre 2 Skills Job Schools

    Companies Web developer Viadeo, IBM Java, php, C++ EPITA
  10. Développ eur Web Web Developer Dev Web Analyste programmeur Dvpt

    Web Web development Développement web Développeur web Développeur PHP Des contenus hétérogènes
  11. Suggestions propres Traitement / nettoyage des données Le cercle vertueux

    de la Data Utilisation pour le targeting: -Talent Bank -Mailings -Premium targeting Ajout de données par le membre Jobs Skills Contacts Ecoles Entreprises Viadeo
  12. SKILLS PROJECT

  13. Stratégie pour améliorer les recommandations d'offres d'emploi  Identifier les

    données clés -Compétences, Intitulés de postes & offres d'emploi, Localisation, Entreprises, Formations  Nettoyer ces données  Creer des referentiels avec ces données  Encourager l'utilisation de ces référentiels (autocomplete)
  14. Stratégie pour améliorer les recommandations d'offres d'emploi  Parler des

    bénéfices que l'on va en tirer (cad comment on va pouvoir l'utiliser pour améliorer la reco?) Si on parle de certains bénéfices ici ce n'est pe plus la peine d'en parler à la fin de la partie skills ?
  15. L'idée  Nettoyer notre référentiel de skills (saisi libre par

    l'utilisateur)  Lier les skills saisies à des skills normalisés  Remplacer l'autocomplete existant par un mix d'autocomplete/suggestion de skill  Utiliser ce référentiel de skills pour faire de la recommandation de skills
  16. Gestion de projet L'idée

  17. Skill Frequence Java 10 Java EE 5 Java SE 7

    Ruby 7 Ruby on Rails 5 J2ee 5 Java/XML 3 Nettoyage automatique Algorithmes de clustering - Calculer la distance entre skills (texte) - Grouper les skills en clusters basé sur ces distances - Elire la skill préféré du cluster (skill néttoyé) ex : la plus fréquente
  18. Nettoyage automatique Algorithmes de clustering Ruby Ruby on Rails Java

    Java EE Java SE Java/XML J2ee Skill Frequence Java 10 Java EE 5 Java SE 7 Ruby 7 Ruby on Rails 5 J2ee 5 Java/XML 3
  19. Nettoyage automatique Les limites  Skills composés (rattachés à un

    seul cluster ou un nouveau)  Ex : Java/XML = deux skills, Java et XML Impossible d'associer certaines skills au bon cluster  Ex : J2ee = Java EE = Java  Considérer deux skills identiques à tort
  20. Nettoyage manuel Ou l'esclavage moderne...  Crowdsourcing avec Amazon mechanical

    turk  Peu adapté aux exercices nécessitant une « expertise »  Collaborer avec ceux qui connaissent le mieux le métier : les cabinets de recrutement  Ou le faire soi même...  On s'y colle !
  21. Implémentation du « smart autocomplete » Dictionnaire de skills Composant

    d'indexation Composant d'interrogation & optimisation du top Indexer search
  22. En résumé Skills originelles Algorithmes Nettoyage manuel Indexation dans un

    moteur de recherche Dictionnaire de skills Valorisation de la Data
  23. Demo de l'autocomplete

  24. Etapes suivantes ?  Plus de liens entre skills (java

    = java ee) => plus de liens entre membres (l'espace des skills existantes est réduit)  Tirer bénéfice de ces données pour améliorer les recommandations existantes  Implémenter un système de recommandation de skills (ex : basé sur des algorithmes de filtrage collaboratif)  Utiliser la même solution pour construire les dictionnaires des intitulés de postes, formations...
  25. Appliquer la méthode aux Skills

  26. SCHEMA FONCTIONNEMENT

  27. PRE PROCESSING

  28. NETTOYAGE MANUEL

  29. APPLICATION DANS L’AUTOCOMPLETE

  30. ALGORITHME SKILLS YOU MAY HAVE

  31. Recommandations and Data through Viadeo Products

  32. Etendre la démarche sur les autres produits Mise à disposition

    de services transverses pour les produits Viadeo •Recommander des membres : People You May Know
 •Recommander des offres d‘emploi : Jobs You May Want •Recommander des compétences : Skills You May Have
  33. Dashboard Recos

  34. Viadeo for iPad

  35. Traiter tous les feedbacks Toutes les actions de l’utilisateur doivent

    enrichir le processus :
  36. Anticiper les différents use-cases •Nouveaux membres •Powers users •Profils atypiques

    : jeunes diplômés, Créateurs d’entreprise… •Pertinence des données dans différentes langues
  37. Faut-il exposer les raisons d’une recommandation ? Humaniser la relation

    « algorithme / utilisateur » (il me connaît) Donner des raisons supplémentaires d’accepter une suggestion «From here on out we’ll be exploring other songs and artists that have musical qualities similar to Led Zeppelin. This track, “Come Together” by The Beatles, has similar blues influences, great lyrics, repetitive melodic phrasing, extensive vamping and minor key tonality.»
  38. En résumé •