Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mesurer l'impact de la communication en ligne

Mesurer l'impact de la communication en ligne

Comment lire des statistiques de visites de sites ?

Stéphane Gully

June 16, 2010
Tweet

More Decks by Stéphane Gully

Other Decks in Technology

Transcript

  1. Journée Plume-Cléo Communication Scientifique en ligne Mesurer l'impact de la

    communication en ligne « Comment lire des statistiques de visites de sites ? » Stéphane Gully <[email protected]> Dominique Lechaudel <[email protected]>
  2. Mesurer l'impact de la communication en ligne 2 16 juin

    2010 UPS076 du CNRS : 300 personnes Collecter, analyser et diffuser l’IST Unité de production 6 000 clients 600 000 nouvelles références bibliographiques chaque année Bases de Données Pascal : 15 millions de références en science, technologie et médecine Francis : 3 millions de références en sciences humaines, sociales et économie Services en ligne : cat.inist.fr (catalogue) : 3 millions visites / mois, 100 000 visites / jours www.refdoc.fr (VPC de documents) : 250 000 visites / mois, 7800 visites / jours Portails Biblios (accès réservé aux documents numériques) Sites de Veille (sites thématiques spécialisés) INIST : INstitut de l’Information Scientifique et Technique
  3. Mesurer l'impact de la communication en ligne 3 16 juin

    2010 INIST : INstitut de l’Information Scientifique et Technique Situation sur internet Google (30 à 40%)
  4. Mesurer l'impact de la communication en ligne 4 16 juin

    2010 Contexte statistiques INIST-CNRS 200 sites hébergés • 50 sous phpMyVisite • 10 sous AWStats • < 20 sous Google Analytics
  5. Mesurer l'impact de la communication en ligne 5 16 juin

    2010 Mesurer l'impact de la communication en ligne à quoi cela sert-il ? • Evaluer le succès du site • Estimer le succès d'une opération marketing • Réussir à cibler l'intérêt des utilisateurs • Suivre l'évolution de la fréquentation du site
  6. Mesurer l'impact de la communication en ligne 6 16 juin

    2010 Mesurer l'impact de la communication en ligne Pourquoi ? Mieux connaître ses utilisateurs • que consultent-ils ? • d'où viennent-ils ? • quand ? Optimiser les ressources • mettre les moyens aux bons endroits • anticiper les besoins matériels
  7. Mesurer l'impact de la communication en ligne 7 16 juin

    2010 Pour qui ? • Administrateur système • Webmaster • Marketing • Décideur • Utilisateur Mesurer l'impact de la communication en ligne
  8. Mesurer l'impact de la communication en ligne 8 16 juin

    2010 Techniques de mesure d'audience Source des informations Fichiers de log du serveur Web Tracker : javascripts insérés dans les pages Estimations : barre d'outils échantillons ou panel choisi d'utilisateurs ?
  9. Mesurer l'impact de la communication en ligne 9 16 juin

    2010 Comment choisir les outils de mesure d'audience Critères Usage : interne / externe • Comment accéder aux rapports de statistiques • Production régulière (rapports PDF) ou en ligne Ressources • Possibilité de modifier les pages • Machine hébergeant les statistiques Trafic intense : puissance de la machine • Tracker • Géolocalisation Qui sera le lecteur des statistiques • Définir le type de public => marketing, webmaster ≠ administrateur système
  10. Mesurer l'impact de la communication en ligne 10 16 juin

    2010 Conseils Pensez aux statistiques dès la conception • Tracker à insérer dans le HTML : dès la conception des pages • Verbosité des log : optimisée pour un compromis volume ⇔ richesse des informations statistiques • Structure des URL : lecture facilitée des comptes-rendu d'accès aux pages • Serveur de statistiques • Externaliser si traffic > 100 000 visites par jour • Automatiser les déploiements et la maintenance
  11. Mesurer l'impact de la communication en ligne 11 16 juin

    2010 Consommation CPU à l'utilisation < <
  12. Mesurer l'impact de la communication en ligne 15 16 juin

    2010 page1.html page2.html 1 page chargée = 1 ligne de log Collecte des logs
  13. Mesurer l'impact de la communication en ligne 16 16 juin

    2010 145.130.77.81 - toto [10/Jun/2010:03:00:55 +0200] "GET /data/page1.html HTTP/1.1" 200 1689 "http://www.google.fr/?q=logiciel+libre" "IE6" 66.130.77.181 - username [10/Jun/2010:03:01:15 +0200] "GET /data/page3.html HTTP/1.1" 200 1993 "http://monsite.domaine.fr/data/page2.html" "Mozilla/5.0" Contenu d'une ligne de log 126.10.7.11 - bob [10/Jun/2010:03:01:01 +0200] "GET /data/page3_.html HTTP/1.1" 404 0 "http://monsite.domaine.fr/data/page1.html" "Chrome" 45.78.89.1 - titi [10/Jun/2010:03:01:14 +0200] "GET /data/page3.html HTTP/1.1" 200 1993 "http://monsite.domaine.fr/data/page2.html" "Safari/3.0" 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0"
  14. Mesurer l'impact de la communication en ligne 17 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur
  15. Mesurer l'impact de la communication en ligne 18 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur
  16. Mesurer l'impact de la communication en ligne 19 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête
  17. Mesurer l'impact de la communication en ligne 20 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée
  18. Mesurer l'impact de la communication en ligne 21 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée Code retour HTTP
  19. Mesurer l'impact de la communication en ligne 22 16 juin

    2010 Contenu d'une ligne de log 66.130.77.181 - username [10/Jun/2010:03:01:05 +0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée Code retour HTTP Taille de la requête Référent Version de navigateur
  20. Mesurer l'impact de la communication en ligne 23 16 juin

    2010 Données compilées Préparation des statistiques awstats.pl -update Logs brutes compilées périodiquement par crontab
  21. Mesurer l'impact de la communication en ligne 24 16 juin

    2010 Visualisation des statistiques Données compilées + mod_cgi jawstats awstats
  22. Mesurer l'impact de la communication en ligne 26 16 juin

    2010 Méthode du « tracker » js Site Web Serveur de statistique
  23. Mesurer l'impact de la communication en ligne 27 16 juin

    2010 Méthode du « tracker » js js Site Web Serveur de statistique
  24. Mesurer l'impact de la communication en ligne 28 16 juin

    2010 Méthode du « tracker » js js Site Web Serveur de statistique
  25. Mesurer l'impact de la communication en ligne 32 16 juin

    2010 Informations tracées = ➔ Identifiant anonyme ➔ Page visitée ➔ Heure de la visite ➔ Navigateur / OS ➔ Taille de l'écran ➔ Pays, ville ➔ Affluents ?
  26. Mesurer l'impact de la communication en ligne 33 16 juin

    2010 Pages vues + = 2 pages visitées
  27. Mesurer l'impact de la communication en ligne 37 16 juin

    2010 Page d'entrée, sortie Page d'entrée Page de sortie
  28. Mesurer l'impact de la communication en ligne 41 16 juin

    2010 Non rebond Rebond Taux de rebond = Taux de visites à une page = Σ rebonds Σ visites Taux de rebond
  29. Mesurer l'impact de la communication en ligne 43 16 juin

    2010 Affluents / Référents Site A Site B A est le référent de B ⇔ A est le « referer » de B ⇔ A est l'affluent de B Accès direct ➔ Url saisie ➔ Favoris
  30. Mesurer l'impact de la communication en ligne 45 16 juin

    2010 Moteur de recherche Google est le référent de B Site B
  31. Mesurer l'impact de la communication en ligne 47 16 juin

    2010 Mots clés http://www.google.fr/?q=logiciel+libre Mots clés
  32. Mesurer l'impact de la communication en ligne 49 16 juin

    2010 Visites t5 – t4 < 30 minutes mercredi mardi jeudi t4 t6 t5 t1 t2 t3 5 visites
  33. Mesurer l'impact de la communication en ligne 51 16 juin

    2010 Visiteurs uniques mercredi mardi jeudi t4 t6 t5 t1 t2 t3 2 visiteurs
  34. Mesurer l'impact de la communication en ligne 53 16 juin

    2010 Comparatif Principales fonctionnalités Pages Rebonds Mots clés Plugin Hit Page d'entrée Page de sortie Durée de session Fonction supl Geo Auth HTTP Widget Heat Map AdSense
  35. Mesurer l'impact de la communication en ligne 54 16 juin

    2010 Comparatif Mise en oeuvre Maintenance Facultatif Statistiques « a posteriori » Statistiques « a priori » Tracker Peu d'évolution Maintenance de sécurité Dépendant de la politique de Google
  36. Mesurer l'impact de la communication en ligne 55 16 juin

    2010 ➔ http://awstats.sourceforge.net/ ➔ http://www.jawstats.com/ ➔ http://www.projet-plume.org/fiche/awstats ➔ http://www.phpmyvisites.net ➔ http://www.projet-plume.org/fr/fiche/phpmyvisites ➔ http://piwik.org/ ➔ Fiche plume ? ➔ http://www.google.com/intl/fr/analytics ➔ http://www.pkgi.net/ ➔ http://www.projet-plume.org/fiche/pkgi Références