communication en ligne « Comment lire des statistiques de visites de sites ? » Stéphane Gully <[email protected]> Dominique Lechaudel <[email protected]>
2010 UPS076 du CNRS : 300 personnes Collecter, analyser et diffuser l’IST Unité de production 6 000 clients 600 000 nouvelles références bibliographiques chaque année Bases de Données Pascal : 15 millions de références en science, technologie et médecine Francis : 3 millions de références en sciences humaines, sociales et économie Services en ligne : cat.inist.fr (catalogue) : 3 millions visites / mois, 100 000 visites / jours www.refdoc.fr (VPC de documents) : 250 000 visites / mois, 7800 visites / jours Portails Biblios (accès réservé aux documents numériques) Sites de Veille (sites thématiques spécialisés) INIST : INstitut de l’Information Scientifique et Technique
2010 Mesurer l'impact de la communication en ligne à quoi cela sert-il ? • Evaluer le succès du site • Estimer le succès d'une opération marketing • Réussir à cibler l'intérêt des utilisateurs • Suivre l'évolution de la fréquentation du site
2010 Mesurer l'impact de la communication en ligne Pourquoi ? Mieux connaître ses utilisateurs • que consultent-ils ? • d'où viennent-ils ? • quand ? Optimiser les ressources • mettre les moyens aux bons endroits • anticiper les besoins matériels
2010 Techniques de mesure d'audience Source des informations Fichiers de log du serveur Web Tracker : javascripts insérés dans les pages Estimations : barre d'outils échantillons ou panel choisi d'utilisateurs ?
2010 Comment choisir les outils de mesure d'audience Critères Usage : interne / externe • Comment accéder aux rapports de statistiques • Production régulière (rapports PDF) ou en ligne Ressources • Possibilité de modifier les pages • Machine hébergeant les statistiques Trafic intense : puissance de la machine • Tracker • Géolocalisation Qui sera le lecteur des statistiques • Définir le type de public => marketing, webmaster ≠ administrateur système
2010 Conseils Pensez aux statistiques dès la conception • Tracker à insérer dans le HTML : dès la conception des pages • Verbosité des log : optimisée pour un compromis volume ⇔ richesse des informations statistiques • Structure des URL : lecture facilitée des comptes-rendu d'accès aux pages • Serveur de statistiques • Externaliser si traffic > 100 000 visites par jour • Automatiser les déploiements et la maintenance
2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête
2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée
2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée Code retour HTTP
2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée Code retour HTTP Taille de la requête Référent Version de navigateur
2010 Affluents / Référents Site A Site B A est le référent de B ⇔ A est le « referer » de B ⇔ A est l'affluent de B Accès direct ➔ Url saisie ➔ Favoris
2010 Comparatif Principales fonctionnalités Pages Rebonds Mots clés Plugin Hit Page d'entrée Page de sortie Durée de session Fonction supl Geo Auth HTTP Widget Heat Map AdSense
2010 Comparatif Mise en oeuvre Maintenance Facultatif Statistiques « a posteriori » Statistiques « a priori » Tracker Peu d'évolution Maintenance de sécurité Dépendant de la politique de Google