Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mettez de la DATA dans votre SEO - SEO Camp Day Bruxelles 2018

Mettez de la DATA dans votre SEO - SEO Camp Day Bruxelles 2018

Des exemples simples et concrets pour intégrer des techniques de Data Science dans vos process SEO.

Au programme : catégorisation et clustering d'URLs, calcul de PageRank interne, corrélations et arbres de décision.

Conférence lors du SEO Camp Day Bruxelles 2018

Julien Deneuville
PRO

September 14, 2018
Tweet

More Decks by Julien Deneuville

Other Decks in Marketing & SEO

Transcript

  1. Mettez de la DATA
    dans votre SEO

    View Slide

  2. Qui suis-je ?
    Julien Deneuville
    • SEO // Data // Python
    • Databulle // Crowl.tech
    • @diije // databulle.com/blog
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    2

    View Slide

  3. Data Science & SEO

    View Slide

  4. View Slide

  5. View Slide

  6. View Slide

  7. View Slide

  8. Image pas si rare d’un SEO
    se noyant dans la donnée

    View Slide

  9. Position #0, PAA, AMP, …
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    9

    View Slide

  10. View Slide

  11. View Slide

  12. View Slide

  13. Tirer parti de la Data Science ?

    View Slide

  14. Restons objectifs
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    14

    View Slide

  15. SEO technique avancé

    View Slide

  16. Crawler le site
    Un classique ;-)
    > Guide de référence : Seer Interactive
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    16

    View Slide

  17. Catégoriser les URLs
    Le principe : détecter des motifs dans l’URL
    pour l’associer à une catégorie
    • Par type de page
    • Par thématique
    > Un script gratuit ici.
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    17

    View Slide

  18. Une étape
    INDISPENSABLE
    dans vos
    analyses.

    View Slide

  19. Catégoriser les URLs
    Comportement des utilisateurs différent
    Comportement des moteurs différent
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    19

    View Slide

  20. Catégoriser les URLs
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    20
    Catégories
    home posts tags pagination other

    View Slide

  21. Efficacité des catégories
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    21
    0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
    pages
    links
    sessions
    Efficacité des catégories
    homepage categories news archives images

    View Slide

  22. Répartition des liens internes
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    22

    View Slide

  23. Clustériser les URLs
    Le principe : utiliser le maillage interne pour
    regrouper les pages similaires
    > Les bases de Gephi chez SeoMix.
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    23

    View Slide

  24. Clustériser les URLs
    Une fois le graphe créé :
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    24

    View Slide

  25. Une vision
    algorithmique
    de la
    structure

    View Slide

  26. Calculer le PageRank interne
    Très simple dans Gephi :
    > Pour de gros volumes, utilisez d’autres méthodes.
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    26

    View Slide

  27. Nombre de liens vs PageRank
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    27
    0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
    links
    pagerank
    Efficacité des catégories
    homepage categories news archives images

    View Slide

  28. View Slide

  29. Compléter les données
    Données on-site
    Autres sources de données
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    29

    View Slide

  30. Scraper ses propres données
    Exemple : compter le nombre d’images et de
    vidéos dans une liste de news.
    > Un script gratuit ici.
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    30

    View Slide

  31. Interroger des API
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    31

    View Slide

  32. Détecter des corrélations
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    32
    =RANG(A2;A:A)
    =RANG(B2;B:B)
    =COEFFICIENT.CORRELATION(C:C;D:D)

    View Slide

  33. Corrgrams
    > Exemple en Python
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    33

    View Slide

  34. Corrélation, causalité

    View Slide

  35. Aller plus loin : arbres de décision
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    35

    View Slide

  36. Deux utilisations
    1. Je crée une nouvelle page : à quels critères
    faire attention ?
    2. Une de mes pages sous-performe : quels
    sont les KPI prioritaires à travailler ?
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    36

    View Slide

  37. Pour conclure

    View Slide

  38. Formez-vous !

    View Slide

  39. Comment se former ?
    MOOC / formations en ligne
    Livres
    Blogs
    Conférences
    Formations présentielles
    Auto-formation
    ...
    ©2018 – Tous droits réservés
    Databulle – www.databulle.com
    39

    View Slide

  40. Apprenez
    à coder !

    View Slide

  41. Python, R, PHP, JavaScript, … ?

    View Slide

  42. Qu’importe le flacon,
    pourvu qu’on ait l’ivresse.

    View Slide

  43. Mais alors, pourquoi Python ?
    Syntaxe claire et simple
    Langage complet
    Communauté et librairies disponibles

    View Slide

  44. Rien ne remplace la pratique

    View Slide

  45. Merci !

    View Slide