Upgrade to Pro — share decks privately, control downloads, hide ads and more …

En route vers le Data+SEO - SEO Camp'us Paris 2019

En route vers le Data+SEO - SEO Camp'us Paris 2019

Conférence au SEO Camp'US Paris 2019 : des exemples concrets pour débuter en Data+SEO.

Au programme : prédiction de trafic avec les régressions linéaires, catégorisation automatique avec le clustering, et calcul des critères de rankings avec les corrélations.

Julien Deneuville
PRO

April 02, 2019
Tweet

More Decks by Julien Deneuville

Other Decks in Marketing & SEO

Transcript

  1. #seocamp
    En route vers le Data+SEO
    1

    View Slide

  2. #seocamp
    Qui suis-je ?
    Julien Deneuville
    • SEO // Data // Python
    • Databulle // Crowl.tech
    • @diije // databulle.com/blog
    • Web In Reims – 27 septembre 2019
    2

    View Slide

  3. #seocamp 3

    View Slide

  4. #seocamp 4

    View Slide

  5. #seocamp 5

    View Slide

  6. #seocamp 6

    View Slide

  7. #seocamp 7

    View Slide

  8. #seocamp
    Objectifs
    8

    View Slide

  9. #seocamp
    Des exemples concrets
    9

    View Slide

  10. #seocamp
    Un minimum de code
    10

    View Slide

  11. #seocamp
    Des résultats rapides
    11

    View Slide

  12. #seocamp 12

    View Slide

  13. #seocamp 13

    View Slide

  14. #seocamp
    Statistiques &
    Machine Learning
    14

    View Slide

  15. #seocamp
    Trois exemples
    1. Prédiction de trafic
    2. Keyword Clustering
    3. Critères de ranking
    15

    View Slide

  16. Prédiction

    View Slide

  17. #seocamp
    Outils nécessaires
    Google Spreadsheets

    17

    View Slide

  18. #seocamp
    Apprendre du passé
    pour prévoir le futur.
    18

    View Slide

  19. #seocamp
    Régression linéaire
    19
    =FORECAST.LINEAR(
    CLÉ_CHERCHÉE;
    PLAGE_VALEURS;
    PLAGE_CLÉS)

    View Slide

  20. #seocamp
    Prévision
    20

    View Slide

  21. #seocamp
    Résultats
    21

    View Slide

  22. #seocamp
    Résultats
    22

    View Slide

  23. #seocamp
    Usages
    Anticiper la saisonnalité
    Prévoir un budget
    Approvisionner les stocks

    23

    View Slide

  24. Clustering

    View Slide

  25. #seocamp
    Outils nécessaires
    Un tableur
    Gephi
    Un outil pour scrapper Google
    25

    View Slide

  26. #seocamp
    Gephi
    Un logiciel open-source et gratuit de
    visualisation et de traitement des graphes.
    > Les bases de Gephi chez SeoMix.
    26

    View Slide

  27. #seocamp
    #1: Liste de mots-clés
    27

    View Slide

  28. #seocamp
    Exemple : Google Search Console
    28

    View Slide

  29. #seocamp
    Autre option : les concurrents
    Sur quels mots-clés
    mes concurrents
    sont-ils positionnés ?
    29

    View Slide

  30. #seocamp 30

    View Slide

  31. #seocamp
    Après nettoyage
    1847 mots-clés
    Univers des chaussures
    Langue anglaise
    31

    View Slide

  32. #seocamp
    #2: Positions
    32

    View Slide

  33. #seocamp
    Aka scrapper Google
    33

    View Slide

  34. #seocamp
    #3: Format
    34

    View Slide

  35. #seocamp
    CSV #1 : mots-clés
    35
    1. Insérer :
    • Une colonne « Label » avec les mots-clés
    • Une colonne « Search Volume »
    2. Ajouter les URLs à la suite des mots-clés,
    avec un volume de 1
    3. Donner un ID à chaque item
    4. Exporter en CSV

    View Slide

  36. #seocamp 36

    View Slide

  37. #seocamp
    CSV #2 : liens
    1. Reprendre l’export des positions
    2. Ajouter deux colonnes :
    • Source : l’ID attribué à l’URL
    • Target : l’ID attribué au mot-clé
    3. Exporter les deux colonnes en CSV
    37

    View Slide

  38. #seocamp 38

    View Slide

  39. #seocamp
    #4: Gephi
    39

    View Slide

  40. #seocamp
    Projet
    1. Nouveau projet
    2. Laboratoire de données
    3. Importer feuille de calcul
    40

    View Slide

  41. #seocamp
    Import des nœuds
    41

    View Slide

  42. #seocamp
    Import des liens
    42

    View Slide

  43. #seocamp
    Clustering
    Une fois le graphe
    créé :
    43

    View Slide

  44. #seocamp
    Si des URLs apparaissent
    sur les mêmes requêtes,
    alors ces requêtes
    sont similaires.
    44

    View Slide

  45. #seocamp
    #5: Profit
    45

    View Slide

  46. #seocamp
    Exemples
    Label Search Volume
    clogs 49500
    mules shoes 27100
    clogs for women 27100
    clog shoes 9900
    womens mules 6600
    women's mule shoes 2400
    mule sneakers 2400
    black clogs 1900
    mule clogs 880
    womens leather clogs 720
    sneaker clogs 590
    Label Search Volume
    vans 1830000
    vans mens shoes 22200
    vans womens shoes 22200
    mens vans 22200
    black high top vans 18100
    vans shoes sale 18100
    burgundy vans 14800
    van shoes 12100
    cheap vans 12100
    red high top vans 12100
    womens vans on sale 3600
    46
    Label Search Volume
    toddler converse 14800
    kids converse shoes 9900
    boys converse 5400
    converse toddler shoes 3600
    toddler girl converse 2900
    toddler converse high tops 2400
    kids chuck taylors 2400
    toddler converse velcro 1900
    girls white converse 1900
    youth converse 1600
    girls black converse 1600

    View Slide

  47. #seocamp
    Attention
    Clusters trop gros / trop petits
    Sujets qui paraissent mélangés
    Mots-clés hors univers sémantique
    47

    View Slide

  48. Corrélation

    View Slide

  49. #seocamp
    Outils nécessaires
    Un tableur

    49

    View Slide

  50. #seocamp
    Si A varie,
    est-ce que B varie aussi ?
    50

    View Slide

  51. #seocamp
    Comparaison visuelle
    51
    0
    20000
    40000
    60000
    80000
    100000
    120000
    140000
    160000
    0 50000 100000 150000 200000 250000 300000 350000
    Hits / Sessions

    View Slide

  52. #seocamp
    =RANG(A2;A:A)
    =RANG(B2;B:B)
    =COEFFICIENT.CORRELATION(C:C;D:D)
    52
    Coefficient de Spearman

    View Slide

  53. #seocamp
    En pratique
    53

    View Slide

  54. #seocamp 54

    View Slide

  55. #seocamp
    #1: Dataset
    55

    View Slide

  56. #seocamp
    Positions
    • Mot-clé
    • URL
    • Position
    56

    View Slide

  57. #seocamp
    Crawl
    • Title
    • Nombre de mots
    • Images & vidéos
    • Balisage sémantique
    • Liens sortants
    > Script Python <
    57

    View Slide

  58. #seocamp
    Sémantique
    • Présence du mot-clé
    dans le title, dans
    l’URL, …
    • Score d’optimisation
    58
    yourtext.guru
    =CHERCHE(
    mot-clé;texte)

    View Slide

  59. #seocamp
    Liens externes
    • Nombre de liens
    • Domaines référents
    • Citation Flow
    • Trust Flow
    59

    View Slide

  60. #seocamp
    #2: Nettoyage
    60

    View Slide

  61. #seocamp
    #2: Nettoyage
    • Valeurs incohérentes
    • Valeurs manquantes
    • Valeurs non-numériques
    • …
    61

    View Slide

  62. #seocamp
    Avant / Après
    1 847 mots-clés
    9 304 URLs
    17 620 items
    1 176 mots-clés
    2 297 URLs
    4 319 items
    62

    View Slide

  63. #seocamp
    Dataset
    63
    19 critères à comparer

    View Slide

  64. #seocamp
    #3: Rangs
    64

    View Slide

  65. #seocamp
    #3 : Rangs
    65

    View Slide

  66. #seocamp
    #4: Corrélations
    66

    View Slide

  67. #seocamp
    #4 : Corrélations
    67

    View Slide

  68. #seocamp
    #5: Conclusion
    68

    View Slide

  69. #seocamp
    #5 : Conclusion
    Travaillez votre netlinking
    et la qualité de votre contenu
    69

    View Slide

  70. #seocamp 70

    View Slide

  71. Et ensuite ?

    View Slide

  72. #seocamp
    Formez-vous !
    72

    View Slide

  73. #seocamp
    Apprenez
    à coder !
    73

    View Slide

  74. #seocamp
    Travaillez
    la DataViz
    74

    View Slide

  75. #seocamp
    Merci !
    75

    View Slide

  76. #seocamp 76
    Question Mug
    Quel coefficient
    de corrélation
    a-t-on utilisé ?

    View Slide

  77. #seocamp
    MERCI AUX SPONSORS
    77

    View Slide