Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Web Sémantique & Bibliothèque

Web Sémantique & Bibliothèque

Présentation de Frédérique Schlosser & Florian Strzelecki sur le Web Sémantique et les Bibliothèques.

Florian Strzelecki

June 11, 2014
Tweet

More Decks by Florian Strzelecki

Other Decks in Technology

Transcript

  1. Bonjour ! Je m'appelle Florian Strzelecki. Je suis ingénieur et

    développeur Web. Membre du Collectif Open-Data Rennes. J'aime la Lecture, les APIs, et les Lego. – @exirel
  2. Le Web Sémantique • Un peu de web... • …

    et un peu de sémantique. • Oui mais...
  3. Web • Protocole de communication sur Internet • Connexion entre

    les objets – Avec les liens hypertexte – HTTP – Document hypermedia – URL – Etc...
  4. Internet vs Web • Internet – TCP – Paquet UDP

    – IP:PORT – DHCP – DNS – Port forwarding – Switch – Routeur – Etc... • Web – HTTP – Request & Response – GET /resource – <HTML /> – .css { color: #000;} – function javascript() {}
  5. Sémantique • « Qui a du sens » • Partager

    : – Le même vocabulaire – Les mêmes définitions – Les mêmes concepts • Tout ça, c'est de la com-mu-ni-ca-tion.
  6. L'art et la manière... • Comment décrire un état ?

    • Comment le transmettre ? • Vous avez... – des oeuvres – des auteurs – Et même des données... – … mais des états ?
  7. “je suis” est un état. • “Je suis un livre.”

    • “Je suis un auteur.” • “J'ai écrit ce livre.” • “Je suis le livre érotique tiré de la fan- fiction tirée du film tiré du livre tiré de la fan-fiction tirée du film tiré du livre d'une auteur du 20ème siècle qui n'a rien à voir avec le riz.” (vous avez 10s)
  8. Et faire, aussi. • L'art de la programmation, c'est de

    savoir réagir à un état, pour adopter le bon comportement. • “Si tu es un auteur, alors tu dois avoir des livres...” • “Si tu as des livres, je peux les trouver quelque part !”
  9. Pour se comprendre... • Il faut : – Savoir lui

    parler (c'est mon job !) – Connaître votre métier (et devinez quoi...)
  10. Une vision « métier » : les catalogues de bibliothèques

    ou l’enjeu de la description des documents
  11. • Bonjour ! Je m’appelle Frédérique Schlosser • Je suis

    conservateur de bibliothèques aux Champs Libres => responsable du numérique et de la communication • J’aime ce qui change en bibliothèque, essayer de comprendre l’informatique et les salades fromagères.
  12. Ça fonctionne comment un catalogue de Bibliothèque ??? Base de

    données pour chaque bibliothèque (SIGB) qui contient 3 grands types de notices descriptives des documents, rédigées au format MARC : - Bibliographiques (édition d’une œuvre) liées à des notices… - Exemplaires (ceux que j’ai dans ma bibliothèque) - Autorités (auteur, sujet, titre) = c’est celui-là et pas un autre
  13. Quelques protocoles d’échanges entre bibliothèques toutefois : Mais c’est toujours

    du web caché et les protocoles sont spécifiques aux métiers de la documentation, pas au web
  14. Enjeux liés aux pratiques des utilisateurs L’utilisateur : « Je

    veux tout, tout de suite, sans effort. » VS Catalogues dans le « Web profond » il faut y aller exprès Les catalogues : « Votre requête [charles darwin] ramène 614 réponses »
  15. Enjeux liés aux pratiques des utilisateurs La recherche d’informations, aujourd’hui,

    pour beaucoup de gens, c’est le Web… Le Web ne parle pas MARC Le Web a ses propres normes Le Web ne fréquente pas les fournisseurs de SIGB Le Web concerne tout le monde Le Web suit son évolution propre… vers le Web sémantique
  16. Les mots-clés de la sémantique • Ontologie • Des formats

    (XML, RDF, HTML) • Liens, URL, et identifiant • Autorité de références • Fournisseur de confiance • La qualité, l'organisation, etc.
  17. Ontologie • Analogie avec la philosophie • Ce qui donne

    du sens... • Modèle de données • Beaucoup de meta-données • Chaque domaine doit définir son ontologie
  18. Exemple (version simple) • Un “auteur” a un “nom”. •

    Un “auteur” a écrit des “livres”. • Un “livre” peut avoir plusieurs “auteurs”. • Un “livre” a une “date de publication”. • Un “livre” peut avoir un “éditeur”.
  19. Formats • La syntaxe est la mise en forme. •

    Elle doit permettre la lecture d'un état. • Permet à deux programmes d'échanger des données sémantiques sans avoir à se connaître.
  20. Format : RDF • Resource Description Framework • Triplets –

    Sujet : ce qui est décrit – Prédicat : la propriété décrite – Objet : la valeur de la propriété • Notion de graphe, d'ensembles, et de tout un tas de choses très pratiques.
  21. Exemple avec RDF/XML • <book> <title>Candide</title> </book> • Sujet :

    <book> • Prédicat : <title> • Objet : “Candide”
  22. Liens, URLs, identifiant... • Les liens sont la base du

    web • Les liens décrivent les relations entre les ressources, les objets • “À partir de son auteur je peux suivre les liens vers ses oeuvres.”
  23. Liens • Liens hypertexte • Relation entre les objets •

    Peuvent être suivis par les machines • Permettent d'augmenter le “sens” des choses sans tout savoir à l'avance
  24. URLs et identifiant • Problématique d'identification des ressources • ISBN,

    UUID, etc... • Qui contrôle les identifiants ? • Sont-ils pérennes ? Uniques ?
  25. Autorité de référence • Responsable – Ontologie (par ex. FRBR)

    – Syntaxe (par ex. RDF/XML) – Identifiant (par ex. ISBN, Code postal) • Tout le monde peut devenir une référence – Administration (BNF) – Association ou collectif (W3C, IDPF) – Entreprise (SNCF)
  26. Fournisseur de confiance • Sans humain, la technique n'est rien.

    – Oui, cela fait proverbe idiot pour poster à chaton... – … n'empêche que c'est vrai. • Doit fournir des données de qualité – Format – Contenu – Liens
  27. Rôle du fournisseur de confiance • Fournir des données de

    qualité – Données à jour – Données dans le bon format – Données cohérentes • Rôle technique & humain – Format et sémantique respectés – Contenu pertinent et complet
  28. L’avenir des bibliothèques c’est d’adopter les standards du Web sémantique

    Pour être visibles sur le web Pour enrichir les réponses aux requêtes des usagers Pour adapter les catalogues aux besoins des utilisateurs et à leurs nouvelles pratiques de recherche Pour mieux structurer les résultats d’une recherche simple
  29. Les premières réalisations en bibliothèques • Évolution des SIGB :

    intégration de RDA comme nouveau format de catalogage, ouverture… • Ouverture des catalogues : open data, enrichissements extérieurs (API) • FRBRisation et description RDF
  30. http://www.flickr.com/photos/40308183@N05/5553709149/ Catalogues des bibliothèques Aujourd’hui les catalogues de bibliothèques se

    trouvent dans le web invisible ou web profond Les solutions pour sortir les catalogues de bibliothèques des oubliettes : un modèle conceptuel : FRBR (Fonctionnalités requises des notices bibliographiques) des nouvelles règles de catalogage : RDA (Resource Description and Access ) une syntaxe : RDF (Resource Description Framework ) et l’entrée des catalogues dans le web de données.
  31. Œuvre : Notre-Dame de Paris Expressions : le roman ou

    la comédie musicale Manifestations : édition de 1958 ou DVD sorti en 2000 Items : les exemplaires dans ma bibliothèque réalisée dans matérialisée dans exemplifiée par FRBR :un modèle d’organisation
  32. data.bnf.fr • La Bibliothèque nationale de France regroupe toutes les

    informations issues de ses différents catalogues, ainsi que de sa bibliothèque numérique Gallica. • Le projet utilise les outils du Web sémantique et s'inscrit dans une démarche d'ouverture des données. • Modèle FRBR : pages auteurs, œuvres, sujets, lieux, spectacles Les principaux objectifs du service data.bnf.fr sont : • accroître la visibilité des données de la BnF, par une meilleure exposition sur le Web, • contribuer à l’échange de métadonnées par la création de liens entre des ressources structurées et de confiance, • faciliter la réutilisation des métadonnées (sous Licence ouverte) par des tiers.