Upgrade to Pro — share decks privately, control downloads, hide ads and more …

La data au coeur du produit

La data au coeur du produit

Presented at Paris Product Meetup with Julie Seguela and Thomas Neau.

Eugen Cepoi

October 01, 2013
Tweet

More Decks by Eugen Cepoi

Other Decks in Technology

Transcript

  1. Anticiper les différents use-cases •15000 nouvelles skills ajoutées par jour

    •X millions de membres •Profils atypiques : jeunes diplômés, Créateurs d’entreprise… •Pertinence des données dans différentes langues
  2. Augmenter l’engagem ent de l’utilisateur Améliorer la complétion de profil

    Développer les contacts entre les membres Optimiser les fonctionnalité s du produit Viadeo & objectifs long terme
  3. d’emploi Quels algorithmes ? « Recommander un job identique à

    celui occupé » « Recommander une offre identique à celles auxquelles le membre a candidaté par le passé » Je cherche un « développeur web » Je suis « développeur web »
  4. Ce dont on a besoin Extraire le métier et les

    compétences à partir d’un profil membre Extraire le métier et les compétences à partir d’une offre d’emploi
  5. … et hétérogènes Membre 1 Membre 2 Skills Job Schools

    Companies Web developer Viadeo, IBM Java, php, C++ EPITA
  6. Développ eur Web Web Developer Dev Web Analyste programmeur Dvpt

    Web Web development Développement web Développeur web Développeur PHP Des contenus hétérogènes
  7. Suggestions propres Traitement / nettoyage des données Le cercle vertueux

    de la Data Utilisation pour le targeting: -Talent Bank -Mailings -Premium targeting Ajout de données par le membre Jobs Skills Contacts Ecoles Entreprises Viadeo
  8. Stratégie pour améliorer les recommandations d'offres d'emploi  Identifier les

    données clés -Compétences, Intitulés de postes & offres d'emploi, Localisation, Entreprises, Formations  Nettoyer ces données  Creer des referentiels avec ces données  Encourager l'utilisation de ces référentiels (autocomplete)
  9. Stratégie pour améliorer les recommandations d'offres d'emploi  Parler des

    bénéfices que l'on va en tirer (cad comment on va pouvoir l'utiliser pour améliorer la reco?) Si on parle de certains bénéfices ici ce n'est pe plus la peine d'en parler à la fin de la partie skills ?
  10. L'idée  Nettoyer notre référentiel de skills (saisi libre par

    l'utilisateur)  Lier les skills saisies à des skills normalisés  Remplacer l'autocomplete existant par un mix d'autocomplete/suggestion de skill  Utiliser ce référentiel de skills pour faire de la recommandation de skills
  11. Skill Frequence Java 10 Java EE 5 Java SE 7

    Ruby 7 Ruby on Rails 5 J2ee 5 Java/XML 3 Nettoyage automatique Algorithmes de clustering - Calculer la distance entre skills (texte) - Grouper les skills en clusters basé sur ces distances - Elire la skill préféré du cluster (skill néttoyé) ex : la plus fréquente
  12. Nettoyage automatique Algorithmes de clustering Ruby Ruby on Rails Java

    Java EE Java SE Java/XML J2ee Skill Frequence Java 10 Java EE 5 Java SE 7 Ruby 7 Ruby on Rails 5 J2ee 5 Java/XML 3
  13. Nettoyage automatique Les limites  Skills composés (rattachés à un

    seul cluster ou un nouveau)  Ex : Java/XML = deux skills, Java et XML Impossible d'associer certaines skills au bon cluster  Ex : J2ee = Java EE = Java  Considérer deux skills identiques à tort
  14. Nettoyage manuel Ou l'esclavage moderne...  Crowdsourcing avec Amazon mechanical

    turk  Peu adapté aux exercices nécessitant une « expertise »  Collaborer avec ceux qui connaissent le mieux le métier : les cabinets de recrutement  Ou le faire soi même...  On s'y colle !
  15. Implémentation du « smart autocomplete » Dictionnaire de skills Composant

    d'indexation Composant d'interrogation & optimisation du top Indexer search
  16. En résumé Skills originelles Algorithmes Nettoyage manuel Indexation dans un

    moteur de recherche Dictionnaire de skills Valorisation de la Data
  17. Etapes suivantes ?  Plus de liens entre skills (java

    = java ee) => plus de liens entre membres (l'espace des skills existantes est réduit)  Tirer bénéfice de ces données pour améliorer les recommandations existantes  Implémenter un système de recommandation de skills (ex : basé sur des algorithmes de filtrage collaboratif)  Utiliser la même solution pour construire les dictionnaires des intitulés de postes, formations...
  18. Etendre la démarche sur les autres produits Mise à disposition

    de services transverses pour les produits Viadeo •Recommander des membres : People You May Know
 •Recommander des offres d‘emploi : Jobs You May Want •Recommander des compétences : Skills You May Have
  19. Anticiper les différents use-cases •Nouveaux membres •Powers users •Profils atypiques

    : jeunes diplômés, Créateurs d’entreprise… •Pertinence des données dans différentes langues
  20. Faut-il exposer les raisons d’une recommandation ? Humaniser la relation

    « algorithme / utilisateur » (il me connaît) Donner des raisons supplémentaires d’accepter une suggestion «From here on out we’ll be exploring other songs and artists that have musical qualities similar to Led Zeppelin. This track, “Come Together” by The Beatles, has similar blues influences, great lyrics, repetitive melodic phrasing, extensive vamping and minor key tonality.»