Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Web Sémantique & Bibliothèque

Web Sémantique & Bibliothèque

Présentation de Frédérique Schlosser & Florian Strzelecki sur le Web Sémantique et les Bibliothèques.

Florian Strzelecki

June 11, 2014
Tweet

More Decks by Florian Strzelecki

Other Decks in Technology

Transcript

  1. Web Sémantique
    –– & ––
    Bibliothèques

    View full-size slide

  2. Bonjour !
    Je m'appelle Florian Strzelecki.
    Je suis ingénieur et développeur Web.
    Membre du Collectif Open-Data Rennes.
    J'aime la Lecture, les APIs, et les Lego.
    – @exirel

    View full-size slide

  3. Le Web Sémantique

    Un peu de web...

    … et un peu de sémantique.

    Oui mais...

    View full-size slide

  4. Web

    Protocole de communication sur Internet

    Connexion entre les objets
    – Avec les liens hypertexte
    – HTTP
    – Document hypermedia
    – URL
    – Etc...

    View full-size slide

  5. Internet vs Web

    Internet
    – TCP
    – Paquet UDP
    – IP:PORT
    – DHCP
    – DNS
    – Port forwarding
    – Switch
    – Routeur
    – Etc...

    Web
    – HTTP
    – Request & Response
    – GET /resource

    View full-size slide

  6. Sémantique

    « Qui a du sens »

    Partager :
    – Le même vocabulaire
    – Les mêmes définitions
    – Les mêmes concepts

    Tout ça, c'est de la com-mu-ni-ca-tion.

    View full-size slide

  7. Problème
    Ce qui a du sens pour vous...
    … n'en a pas pour lui !

    View full-size slide

  8. Etat +
    Comportement
    ==
    Programme

    View full-size slide

  9. Etat + Comportement...
    … oui mais ?

    View full-size slide

  10. L'art et la manière...

    Comment décrire un état ?

    Comment le transmettre ?

    Vous avez...
    – des oeuvres
    – des auteurs
    – Et même des données...
    – … mais des états ?

    View full-size slide

  11. “je suis” est un état.

    “Je suis un livre.”

    “Je suis un auteur.”

    “J'ai écrit ce livre.”

    “Je suis le livre érotique tiré de la fan-
    fiction tirée du film tiré du livre tiré de la
    fan-fiction tirée du film tiré du livre d'une
    auteur du 20ème siècle qui n'a rien à voir
    avec le riz.” (vous avez 10s)

    View full-size slide

  12. Et faire, aussi.

    L'art de la programmation, c'est de
    savoir réagir à un état, pour adopter le
    bon comportement.

    “Si tu es un auteur, alors tu dois avoir
    des livres...”

    “Si tu as des livres, je peux les trouver
    quelque part !”

    View full-size slide

  13. Pour se comprendre...

    Il faut :
    – Savoir lui parler (c'est mon job !)
    – Connaître votre métier (et devinez quoi...)

    View full-size slide

  14. Une vision « métier » : les
    catalogues de bibliothèques ou
    l’enjeu de la description des
    documents

    View full-size slide

  15. • Bonjour ! Je m’appelle Frédérique Schlosser
    • Je suis conservateur de bibliothèques aux
    Champs Libres => responsable du
    numérique et de la communication
    • J’aime ce qui change en bibliothèque,
    essayer de comprendre l’informatique et
    les salades fromagères.

    View full-size slide

  16. Ça fonctionne comment un
    catalogue de Bibliothèque ???
    Base de données pour chaque bibliothèque
    (SIGB) qui contient 3 grands types de notices
    descriptives des documents, rédigées au format
    MARC :
    - Bibliographiques (édition d’une œuvre) liées à
    des notices…
    - Exemplaires (ceux que j’ai dans ma
    bibliothèque)
    - Autorités (auteur, sujet, titre) = c’est celui-là
    et pas un autre

    View full-size slide

  17. Ce qui donne un
    fonctionnement comme
    celui-ci :

    View full-size slide

  18. Quelques protocoles d’échanges
    entre bibliothèques toutefois :
    Mais c’est toujours du web caché et les protocoles sont
    spécifiques aux métiers de la documentation, pas au web

    View full-size slide

  19. Enjeux liés aux pratiques des utilisateurs
    L’utilisateur : « Je veux tout, tout de suite, sans
    effort. »
    VS
    Catalogues dans le « Web profond »
    il faut y aller exprès
    Les catalogues : « Votre requête
    [charles darwin] ramène 614 réponses »

    View full-size slide

  20. Recherche : « Charles Darwin »
    Aurez-vous le courage d’aller jusqu’à
    la 62e page ?

    View full-size slide

  21. A priori,
    le même
    contenu

    View full-size slide

  22. Enjeux liés aux pratiques des utilisateurs
    La recherche d’informations, aujourd’hui, pour
    beaucoup de gens, c’est le Web…
    Le Web ne parle pas MARC
    Le Web a ses propres normes
    Le Web ne fréquente pas les fournisseurs de SIGB
    Le Web concerne tout le monde
    Le Web suit son évolution propre… vers le Web
    sémantique

    View full-size slide

  23. •Alors, Florian, comment on
    peut faire ????

    View full-size slide

  24. Les mots-clés de la
    sémantique

    Ontologie

    Des formats (XML, RDF, HTML)

    Liens, URL, et identifiant

    Autorité de références

    Fournisseur de confiance

    La qualité, l'organisation, etc.

    View full-size slide

  25. Ontologie

    Analogie avec la philosophie

    Ce qui donne du sens...

    Modèle de données

    Beaucoup de meta-données

    Chaque domaine doit définir son
    ontologie

    View full-size slide

  26. Exemple (version simple)

    Un “auteur” a un “nom”.

    Un “auteur” a écrit des “livres”.

    Un “livre” peut avoir plusieurs
    “auteurs”.

    Un “livre” a une “date de publication”.

    Un “livre” peut avoir un “éditeur”.

    View full-size slide

  27. Formats

    La syntaxe est la mise en forme.

    Elle doit permettre la lecture d'un état.

    Permet à deux programmes d'échanger
    des données sémantiques sans avoir à se
    connaître.

    View full-size slide

  28. Format : RDF

    Resource Description Framework

    Triplets
    – Sujet : ce qui est décrit
    – Prédicat : la propriété décrite
    – Objet : la valeur de la propriété

    Notion de graphe, d'ensembles, et de tout
    un tas de choses très pratiques.

    View full-size slide

  29. Exemple avec RDF/XML


    Candide


    Sujet :

    Prédicat :

    Objet : “Candide”

    View full-size slide

  30. Liens, URLs, identifiant...

    Les liens sont la base du web

    Les liens décrivent les relations entre les
    ressources, les objets

    “À partir de son auteur je peux suivre les
    liens vers ses oeuvres.”

    View full-size slide

  31. Liens

    Liens hypertexte

    Relation entre les objets

    Peuvent être suivis par les machines

    Permettent d'augmenter le “sens” des
    choses sans tout savoir à l'avance

    View full-size slide

  32. URLs et identifiant

    Problématique d'identification des
    ressources

    ISBN, UUID, etc...

    Qui contrôle les identifiants ?

    Sont-ils pérennes ? Uniques ?

    View full-size slide

  33. Autorité de référence

    Responsable
    – Ontologie (par ex. FRBR)
    – Syntaxe (par ex. RDF/XML)
    – Identifiant (par ex. ISBN, Code postal)

    Tout le monde peut devenir une référence
    – Administration (BNF)
    – Association ou collectif (W3C, IDPF)
    – Entreprise (SNCF)

    View full-size slide

  34. Fournisseur de confiance

    Sans humain, la technique n'est rien.
    – Oui, cela fait proverbe idiot pour poster à
    chaton...
    – … n'empêche que c'est vrai.

    Doit fournir des données de qualité
    – Format
    – Contenu
    – Liens

    View full-size slide

  35. Rôle du fournisseur de
    confiance

    Fournir des données de qualité
    – Données à jour
    – Données dans le bon format
    – Données cohérentes

    Rôle technique & humain
    – Format et sémantique respectés
    – Contenu pertinent et complet

    View full-size slide

  36. Et donc, on fait quoi ?

    On s'organise !

    View full-size slide

  37. L’avenir des bibliothèques c’est
    d’adopter les standards du Web
    sémantique
    Pour être visibles sur le web
    Pour enrichir les réponses aux requêtes des
    usagers
    Pour adapter les catalogues aux besoins des
    utilisateurs et à leurs nouvelles pratiques de
    recherche
    Pour mieux structurer les résultats d’une
    recherche simple

    View full-size slide

  38. Les premières réalisations en
    bibliothèques
    • Évolution des SIGB : intégration de RDA
    comme nouveau format de catalogage,
    ouverture…
    • Ouverture des catalogues : open data,
    enrichissements extérieurs (API)
    • FRBRisation et description RDF

    View full-size slide

  39. http://www.flickr.com/photos/40308183@N05/5553709149/
    Catalogues
    des
    bibliothèques
    Aujourd’hui les
    catalogues de
    bibliothèques se
    trouvent dans le web
    invisible ou web
    profond
    Les solutions pour sortir les catalogues de bibliothèques des
    oubliettes :
    un modèle conceptuel : FRBR (Fonctionnalités requises des
    notices bibliographiques)
    des nouvelles règles de catalogage : RDA (Resource
    Description and Access )
    une syntaxe : RDF (Resource Description Framework ) et
    l’entrée des catalogues dans le web de données.

    View full-size slide

  40. Œuvre : Notre-Dame de Paris
    Expressions : le roman ou la comédie musicale
    Manifestations : édition de 1958 ou DVD sorti en 2000
    Items : les exemplaires dans ma bibliothèque
    réalisée dans
    matérialisée
    dans
    exemplifiée par
    FRBR :un modèle d’organisation

    View full-size slide

  41. FRBR : un modèle d’organisation
    adapté au web sémantique

    View full-size slide

  42. Les tablettes rennaises
    • Open data
    • Description des œuvres en RDF

    View full-size slide

  43. Exemple d’enrichissement de notre catalogue avec
    des données extérieures : Wikipédia

    View full-size slide

  44. data.bnf.fr
    • La Bibliothèque nationale de France regroupe
    toutes les informations issues de ses différents
    catalogues, ainsi que de sa bibliothèque numérique Gallica.
    • Le projet utilise les outils du Web sémantique et s'inscrit dans une
    démarche d'ouverture des données.
    • Modèle FRBR : pages auteurs, œuvres, sujets, lieux, spectacles
    Les principaux objectifs du service data.bnf.fr sont :
    • accroître la visibilité des données de la BnF, par une meilleure exposition
    sur le Web,
    • contribuer à l’échange de métadonnées par la création de liens entre des
    ressources structurées et de confiance,
    • faciliter la réutilisation des métadonnées (sous Licence ouverte) par des
    tiers.

    View full-size slide

  45. Data.bnf.fr
    Exemple d’une page
    « auteur »

    View full-size slide

  46. Exemple d’une page
    « œuvre »

    View full-size slide

  47. Data.bnf +
    Catalogue d’une autre bibliothèque =

    View full-size slide

  48. Et voilà c’est
    fini !

    View full-size slide