Slide 1

Slide 1 text

Mettez de la DATA dans votre SEO

Slide 2

Slide 2 text

Qui suis-je ? Julien Deneuville • SEO // Data // Python • Databulle // Crowl.tech • @diije // databulle.com/blog ©2018 – Tous droits réservés Databulle – www.databulle.com 2

Slide 3

Slide 3 text

Data Science & SEO

Slide 4

Slide 4 text

No content

Slide 5

Slide 5 text

No content

Slide 6

Slide 6 text

No content

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

Image pas si rare d’un SEO se noyant dans la donnée

Slide 9

Slide 9 text

Position #0, PAA, AMP, … ©2018 – Tous droits réservés Databulle – www.databulle.com 9

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

Tirer parti de la Data Science ?

Slide 14

Slide 14 text

Restons objectifs ©2018 – Tous droits réservés Databulle – www.databulle.com 14

Slide 15

Slide 15 text

SEO technique avancé

Slide 16

Slide 16 text

Crawler le site Un classique ;-) > Guide de référence : Seer Interactive ©2018 – Tous droits réservés Databulle – www.databulle.com 16

Slide 17

Slide 17 text

Catégoriser les URLs Le principe : détecter des motifs dans l’URL pour l’associer à une catégorie • Par type de page • Par thématique > Un script gratuit ici. ©2018 – Tous droits réservés Databulle – www.databulle.com 17

Slide 18

Slide 18 text

Une étape INDISPENSABLE dans vos analyses.

Slide 19

Slide 19 text

Catégoriser les URLs Comportement des utilisateurs différent Comportement des moteurs différent ©2018 – Tous droits réservés Databulle – www.databulle.com 19

Slide 20

Slide 20 text

Catégoriser les URLs ©2018 – Tous droits réservés Databulle – www.databulle.com 20 Catégories home posts tags pagination other

Slide 21

Slide 21 text

Efficacité des catégories ©2018 – Tous droits réservés Databulle – www.databulle.com 21 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% pages links sessions Efficacité des catégories homepage categories news archives images

Slide 22

Slide 22 text

Répartition des liens internes ©2018 – Tous droits réservés Databulle – www.databulle.com 22

Slide 23

Slide 23 text

Clustériser les URLs Le principe : utiliser le maillage interne pour regrouper les pages similaires > Les bases de Gephi chez SeoMix. ©2018 – Tous droits réservés Databulle – www.databulle.com 23

Slide 24

Slide 24 text

Clustériser les URLs Une fois le graphe créé : ©2018 – Tous droits réservés Databulle – www.databulle.com 24

Slide 25

Slide 25 text

Une vision algorithmique de la structure

Slide 26

Slide 26 text

Calculer le PageRank interne Très simple dans Gephi : > Pour de gros volumes, utilisez d’autres méthodes. ©2018 – Tous droits réservés Databulle – www.databulle.com 26

Slide 27

Slide 27 text

Nombre de liens vs PageRank ©2018 – Tous droits réservés Databulle – www.databulle.com 27 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% links pagerank Efficacité des catégories homepage categories news archives images

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

Compléter les données Données on-site Autres sources de données ©2018 – Tous droits réservés Databulle – www.databulle.com 29

Slide 30

Slide 30 text

Scraper ses propres données Exemple : compter le nombre d’images et de vidéos dans une liste de news. > Un script gratuit ici. ©2018 – Tous droits réservés Databulle – www.databulle.com 30

Slide 31

Slide 31 text

Interroger des API ©2018 – Tous droits réservés Databulle – www.databulle.com 31

Slide 32

Slide 32 text

Détecter des corrélations ©2018 – Tous droits réservés Databulle – www.databulle.com 32 =RANG(A2;A:A) =RANG(B2;B:B) =COEFFICIENT.CORRELATION(C:C;D:D)

Slide 33

Slide 33 text

Corrgrams > Exemple en Python ©2018 – Tous droits réservés Databulle – www.databulle.com 33

Slide 34

Slide 34 text

Corrélation, causalité

Slide 35

Slide 35 text

Aller plus loin : arbres de décision ©2018 – Tous droits réservés Databulle – www.databulle.com 35

Slide 36

Slide 36 text

Deux utilisations 1. Je crée une nouvelle page : à quels critères faire attention ? 2. Une de mes pages sous-performe : quels sont les KPI prioritaires à travailler ? ©2018 – Tous droits réservés Databulle – www.databulle.com 36

Slide 37

Slide 37 text

Pour conclure

Slide 38

Slide 38 text

Formez-vous !

Slide 39

Slide 39 text

Comment se former ? MOOC / formations en ligne Livres Blogs Conférences Formations présentielles Auto-formation ... ©2018 – Tous droits réservés Databulle – www.databulle.com 39

Slide 40

Slide 40 text

Apprenez à coder !

Slide 41

Slide 41 text

Python, R, PHP, JavaScript, … ?

Slide 42

Slide 42 text

Qu’importe le flacon, pourvu qu’on ait l’ivresse.

Slide 43

Slide 43 text

Mais alors, pourquoi Python ? Syntaxe claire et simple Langage complet Communauté et librairies disponibles

Slide 44

Slide 44 text

Rien ne remplace la pratique

Slide 45

Slide 45 text

Merci !