diffuser l’IST Unité de production 6 000 clients 600 000 nouvelles références bibliographiques chaque année Bases de Données Pascal : 15 millions de références en science, technologie et médecine Francis : 3 millions de références en sciences humaines, sociales et économie Services en ligne : cat.inist.fr (catalogue) : 3 millions visites / mois, 100 000 visites / jours www.refdoc.fr (VPC de documents) : 250 000 visites / mois, 7800 visites / jours Portails Biblios (accès réservé aux documents numériques) Sites de Veille (sites thématiques spécialisés) INIST : INstitut de l’Information Scientifique et Technique
s'exécute dans une page Web • Javascript peut analyser le contenu de la page Web • Un fichier PDF ≠ page Web Technique du tracker ne peut pas compter les consultations de PDF
+0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête
+0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée
+0200] "GET /data/page2.html HTTP/1.1" 200 1473 "http://monsite.domaine.fr/data/page1.html" "Mozilla/5.0" IP machine utilisateur Login utilisateur Date de la requête Page consultée Code retour HTTP Taille de la requête Référent Version de navigateur
</a> Réécriture des liens dans la page HTML retournée par l'éditeur. <a href="http://sciencedirect.com.gate1.inist.fr/00014575/01.pdf"> Télécharger la version PDF </a>
permet de : • Compter les consultations par éditeurs • Compter les consultations par revues • Compter les consultations par articles • Chiffres utiles pour : • Évaluation des campagnes de tests d'abonnements • Choix des abonnements pour le CNRS • Négocier les tarifs avec les éditeurs Par individu Par laboratoire Par « groupe »
cnrsDS Administrateur des portails INIST fedeadmin 1. Mémorisation des attributs. 2. Récupération de l'attribut « communauté » (bibliovie, biblioshs …) Référentiel utilisateurs 1. Réglages manuels des droits. 2. Enrichissement de la base de connaissances (SI Labo, infos de gestion)
• Fournisseur de service côté éditeurs • Analyse fine des logs EZProxy en local • Donc conflit d'intérêts … Alternatives : • Récupération des statistiques chez les éditeurs (SUSHI) • Demander aux éditeurs d'ajouter des systèmes de tracker sur leurs plate-formes
une structure d'URL • Cairn = une structure d'URL • … • Chaque plate-forme possède sa structure d'URL • Un système de reconnaissance d'URL par plate-forme • Écriture d'un : parseur / module / plugin
http://www.springerlink.com/content/j5q872410p5 10m63/fulltext.pdf Exemple chez Cairn : http://www.cairn.info/load_pdf.php? ID_ARTICLE=RFG_218_0009 • URL opaques (session, cryptages) • Bases de connaissances à compléter manuellement
logs au niveau ESR • Mutualisation des bases de connaissances (référentiels id éditeurs) • Interopérabilité avec les référentiels des SI • Reconnaissances jusqu'aux articles • Consolidation avec récupération des stats éditeurs (SUSHI) • Prototypage de systèmes de tracker sur les sites des éditeurs (à contractualiser ?)