Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mettez de la DATA dans votre SEO - SEO Camp Day Bruxelles 2018

Mettez de la DATA dans votre SEO - SEO Camp Day Bruxelles 2018

Des exemples simples et concrets pour intégrer des techniques de Data Science dans vos process SEO.

Au programme : catégorisation et clustering d'URLs, calcul de PageRank interne, corrélations et arbres de décision.

Conférence lors du SEO Camp Day Bruxelles 2018

Julien Deneuville

September 14, 2018
Tweet

More Decks by Julien Deneuville

Other Decks in Marketing & SEO

Transcript

  1. Qui suis-je ? Julien Deneuville • SEO // Data //

    Python • Databulle // Crowl.tech • @diije // databulle.com/blog ©2018 – Tous droits réservés Databulle – www.databulle.com 2
  2. Crawler le site Un classique ;-) > Guide de référence

    : Seer Interactive ©2018 – Tous droits réservés Databulle – www.databulle.com 16
  3. Catégoriser les URLs Le principe : détecter des motifs dans

    l’URL pour l’associer à une catégorie • Par type de page • Par thématique > Un script gratuit ici. ©2018 – Tous droits réservés Databulle – www.databulle.com 17
  4. Catégoriser les URLs Comportement des utilisateurs différent Comportement des moteurs

    différent ©2018 – Tous droits réservés Databulle – www.databulle.com 19
  5. Catégoriser les URLs ©2018 – Tous droits réservés Databulle –

    www.databulle.com 20 Catégories home posts tags pagination other
  6. Efficacité des catégories ©2018 – Tous droits réservés Databulle –

    www.databulle.com 21 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% pages links sessions Efficacité des catégories homepage categories news archives images
  7. Clustériser les URLs Le principe : utiliser le maillage interne

    pour regrouper les pages similaires > Les bases de Gephi chez SeoMix. ©2018 – Tous droits réservés Databulle – www.databulle.com 23
  8. Clustériser les URLs Une fois le graphe créé : ©2018

    – Tous droits réservés Databulle – www.databulle.com 24
  9. Calculer le PageRank interne Très simple dans Gephi : >

    Pour de gros volumes, utilisez d’autres méthodes. ©2018 – Tous droits réservés Databulle – www.databulle.com 26
  10. Nombre de liens vs PageRank ©2018 – Tous droits réservés

    Databulle – www.databulle.com 27 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% links pagerank Efficacité des catégories homepage categories news archives images
  11. Compléter les données Données on-site Autres sources de données ©2018

    – Tous droits réservés Databulle – www.databulle.com 29
  12. Scraper ses propres données Exemple : compter le nombre d’images

    et de vidéos dans une liste de news. > Un script gratuit ici. ©2018 – Tous droits réservés Databulle – www.databulle.com 30
  13. Détecter des corrélations ©2018 – Tous droits réservés Databulle –

    www.databulle.com 32 =RANG(A2;A:A) =RANG(B2;B:B) =COEFFICIENT.CORRELATION(C:C;D:D)
  14. Aller plus loin : arbres de décision ©2018 – Tous

    droits réservés Databulle – www.databulle.com 35
  15. Deux utilisations 1. Je crée une nouvelle page : à

    quels critères faire attention ? 2. Une de mes pages sous-performe : quels sont les KPI prioritaires à travailler ? ©2018 – Tous droits réservés Databulle – www.databulle.com 36
  16. Comment se former ? MOOC / formations en ligne Livres

    Blogs Conférences Formations présentielles Auto-formation ... ©2018 – Tous droits réservés Databulle – www.databulle.com 39
  17. Mais alors, pourquoi Python ? Syntaxe claire et simple Langage

    complet Communauté et librairies disponibles