Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Kataloganreicherung à la Linked Open Data

lobid
September 27, 2012

Kataloganreicherung à la Linked Open Data

lobid

September 27, 2012
Tweet

More Decks by lobid

Other Decks in Technology

Transcript

  1. Kataloganreicherung à la Linked Open Data VdB, Landesverband Bayern, München,

    2012-09-27 Jenseits der Verbundkataloge. Die Zukunft der Recherche Pascal Christoph
  2. Christoph - Kataloganreicherung à la Linked Open Data Lizenz 2

    2012-09-27 Dieser Vortrag – inklusive der durch den Autor erstellten Grafiken auf den Folien 7, 8, 11, 13, 15, 16, 17, 18, 20, 21, 33, 62, 63 und 67 – steht unter der CC0 Lizenz : https://creativecommons.org/about/cc0 Davon ausgenommen sind die übrigen verwendeten Grafiken, Bilder und Screenshots, deren individuelle Rechte und Lizenzbedingungen fortgelten. Insbesondere stehen die http://www.istockphoto.com/ Grafiken auf den Folien 47, 49, 50 und 83 unter einer CC-BY-ND Lizenz : http://creativecommons.org/licenses/by-nd/3.0/de/ Die Graphiken auf den Folien 22-26 entstammen dem “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
  3. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 3 2012-09-27
  4. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 4 2012-09-27
  5. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 5

    2012-09-27 Werden Sie in 15 Minuten ein LOD Experte
  6. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 6

    2012-09-27 Besser: z.B. einen Workshop besuchen ! z.B. auf der SWIB12
  7. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: HTTP-URI 7 2012-09-27 Jede Ressource erhält einen HTTP-URI http://example.de/12345
  8. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: HTTP-URI 9 2012-09-27 HTTP-URIs sind z. B. einer URN-URI überlegen: sie können z. B. einfach im Browser nachgeschlagen werden.
  9. Christoph - Kataloganreicherung à la Linked Open Data LOD–Basics: HTTP-URI

    derefenzieren 10 2012-09-27 Wird die Ressource nachgeschlagen, so wird die Ressource geliefert. Geht dies nicht, z.B. weil es sich um einen physischen Gegenstand handelt, werden Daten über die Ressource geliefert (aka Metadaten).
  10. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: RDF Triple 12 2012-09-27 Datenbeschreibung mittels RDF => Triple: Subjekt Prädikat Objekt . (Ein Triple ist die kleinste Informationseinheit.)
  11. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: RDF Triple 13 2012-09-27 Der obige Graph als NTriples in RDF ausgedrückt: <http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/title> "With reference to reference" . <http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/issued> "1983" . <http://lobid.org/resource/HT002948556> <http://purl.org/ontology/bibo/isbn13> "9780915145539" . <http://lobid.org/resource/HT002948556> <http://purl.org/dc/elements/1.1/creator> "Elgin, Catherine" .
  12. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: RDF Triple 14 2012-09-27 Ein Objekt kann Text sein: „Elgin, Catherine“ Ein Objekt kann ein URI sein: <http://d-nb.info/gnd/135539897> => Ressourcen in Ressourcen (aka „linked“)
  13. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: linked 17 2012-09-27 ... <http://lobid.org/resource/HT002948556> <http://purl.org/dc/elements/1.1/creator> <http://d-nb.info/gnd/135539897> . ...
  14. Christoph - Kataloganreicherung à la Linked Open Data LOD -

    Definition „linked“ 21 2012-09-27
  15. Christoph - Kataloganreicherung à la Linked Open Data LOD -

    Definition „linked“ 27 2012-09-27 Ad astra ? Ad astra ? Ad data ! Ad data ! To boldly go where no data has gone before. Ad astra ? Ad astra ? Ad data ! Ad data ! To boldly go where no data has gone before To boldly go where no data has gone before. . Bildquelle:http://hubblesite.org/gallery/album/star/pr2006050d
  16. Christoph - Kataloganreicherung à la Linked Open Data LOD –

    Basics: Resümee „linked“ 28 2012-09-27 • Ein RDF Triple besteht aus Subjekt, Prädikat und Objekt • Ein RDF Triple ist die kleinstmögliche Aussage über etwas • RDF Triple können URIs enthalten, und somit wiederum Triple • Mehrere RDF Triple ergeben RDF Graphen • HTTP-URIs, und damit Daten, sind institutsübergreifend • Maschinen „verstehen“ Daten • Einfache Schnittstelle: z.B. Webseiten (RDFa in HTML) => globales Datennetz („Web of Data“)
  17. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 29 2012-09-27
  18. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“

    30 2012-09-27 http://opendefinition.org/ Wissen ist offen, wenn dessen Verwendung Wiederverwendung Wiederverwertung erlaubt ist. („A piece of knowledge is open if you are free to use, reuse and redistribute it.“)
  19. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 31 2012-09-27 Wozu Open Data ? Um die Daten nutzbar zu machen ! Jeder kann, ohne zu fragen, die Daten nutzen, nach eigenem Gutdünken
  20. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 32 2012-09-27 Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
  21. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 33 2012-09-27 Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
  22. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 34 2012-09-27 Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
  23. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 35 2012-09-27 Das Ganze ist mehr als die Summe seiner Teile .
  24. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“-wozu

    ? 36 2012-09-27 Bildquelle: https://github.com/jakobib/ticer2012 to be copied and modified under CC-BY-SA license. Data vs. Application „Data matures like Wine, Applications like Fish“ (James Governor)
  25. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: „open“

    38 2012-09-27 Open Data - eine Frage von: • Lizenzen • Zugänglichkeit • Formate
  26. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: Lizenzen

    39 2012-09-27 • Attribution (ODC-BY) • Attribution-Share-Alike (OdbL) • Public Domain (CC0, PDDL) Keine Non-Commercial Lizenz
  27. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: Daten

    öffnen 41 2012-09-27 Interessierte Akteure zusammenbringen Bildquelle: http://www.flickr.com/photos/johnspooner/2199685678/
  28. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: Daten

    öffnen 42 2012-09-27 Mögliche rechtliche Probleme klären • Fremddaten im Katalog • Nutzungsbedingungen in den Verträgen prüfen - KiM: Empfehlungen zur Öffnung bibliothekarischer Daten - Till Kreutzer: Open Data – Freigabe von Daten aus Bibliothekskatalogen - Adrian Pohl: Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. 2010
  29. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: Daten

    öffnen 43 2012-09-27 • Daten exportieren • Daten veröffentlichen • Daten lizensieren • Daten verzeichnen (http://thedatahub.org/) • Bekanntgeben
  30. Christoph - Kataloganreicherung à la Linked Open Data LOD-Basics: five

    stars 44 2012-09-27 Sir Tim Berners Lee: Bildquelle: http://www.w3.org/DesignIssues/LinkedData.html
  31. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 46 2012-09-27
  32. Christoph - Kataloganreicherung à la Linked Open Data Kataloganreicherung: Definition

     Jegliche Ergänzung vorhandener Datensätze um zusätzliche Informationen  Links zum Volltext im WWW  Schlagwörter  Umschlagbilder  ...  Herkunft egal (Benutzer, Bibliotheken, Firmen...)  Neue Funktionen: nur mittelbar 48 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  33. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 51 2012-09-27
  34. Christoph - Kataloganreicherung à la Linked Open Data Kataloganreicherung: Methoden

    24.05.2012 Datenbank vs. Mashup Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 52 Bildquelle: http://findicons.com/about
  35. Christoph - Kataloganreicherung à la Linked Open Data 53 24.05.2012

    Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Lokale DB: + Aufwendigere Zusammenführungen möglich + Daten nutzbar für Recherche und weitere Funktionen - Hoher kontinuierlicher Aufwand für jede Quelle Kataloganreicherung: Methoden Dynamisches Mashup: + Aktuell + Relativ geringer Aufwand je Quelle - Benötigt (performante) API - Keine Recherche über die Daten
  36. Christoph - Kataloganreicherung à la Linked Open Data Kataloganreicherung: Infrastruktur

    RDF-basierte Speicherung mit SPARQL Endpoint:  Einfaches Hinzufügen neuer Daten  Nachnutzbar  „Selbst-beschreibender“ Dump  „API“ inbegriffen 54 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  37. Christoph - Kataloganreicherung à la Linked Open Data Ausgangslage in

    lobid.org  RDF Store mit SPARQL Endpoint: 4store  Open Data aus dem Verbundkatalog „hbz01“  16 M Titeldatensätze <=> 700 M Triple  Verknüpfungen: 56 24.05.2012 • 5.500 Projekt Gutenberg • 12.000 DBpedia • 70.000 b3kat • 200.000 Dewey Decimal Class. • 270.000 DNB Nationalbiografie • 420.000 OCLC • 1.250.000 Open Library • 700.000 ZDB • 800.000 LOC Iso-639-2 • 22.000.000 gnd Normdatei • 32.000.000 lobid-organisations Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  38. Christoph - Kataloganreicherung à la Linked Open Data Praxisbeispiel: LODUM

    57 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  39. Christoph - Kataloganreicherung à la Linked Open Data ÜBERSICHT 

    Linked Open Data (LOD):  Basics  linked  open  Kataloganreicherung  Definition  Technik  Matching  Verlinkung  Fazit & Anwendungsbeispiel 58 2012-09-27
  40. Jansen / Christoph - Kataloganreicherung mit LOD Verlinkungssoftware  Silk

     Culturegraph  Google-refine  ... 59 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  41. Jansen / Christoph - Kataloganreicherung mit LOD Matchingalgorithmen  Abhängig

    von Daten  Spannende Daten liegen „woanders“  => andere Regelwerke  Beispiel DBpedia:  Autor, ISBN usw. fehlt meistens => bleibt Titel  Eingrenzungen:  deutsche DBpedia  category:Literarisches_Werk , category:Lexikon,_Enzyklopädie 60 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  42. Jansen / Christoph - Kataloganreicherung mit LOD Problem: Disambiguierung 

    Matching zu ungenau  Postprozessierung: nur Bündel mit gleichem Autor zulassen 61 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  43. Jansen / Christoph - Kataloganreicherung mit LOD Bündel mit gleichem

    Autor 62 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  44. Jansen / Christoph - Kataloganreicherung mit LOD Bündel mit verschiedenen

    Autoren 63 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  45. Jansen / Christoph - Kataloganreicherung mit LOD Triplifizierung  Prädikate

    finden oder selber prägen  rdrel:workManifested  => Triple: <lobid-resource> <rdrel:workManifested> <dbpedia-resource> 65 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  46. Jansen / Christoph - Kataloganreicherung mit LOD Indexierung  Lizenzfragen

    klären  Triples importieren in SPARQL-Endpoint Eigener „named Graph“ bietet Vorteile:  Leicht löschbar/veränderbar  Provenienz verfolgbar  Eingrenzung von Abfragen auf Named Graphs 66 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  47. Jansen / Christoph - Kataloganreicherung mit LOD Named Graphs 67

    24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  48. Jansen / Christoph - Kataloganreicherung mit LOD Was wurde erreicht?

     12.000 „sichere“ Links zu 4.000 DBpedia Ressourcen => 4.000 neue „Work“-Ebenen (21.000 verworfene Links)  Durchschnittliche Bündelgröße: 3  Links nach freebase: 3.000  0.1 % Anreicherung 68 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  49. Jansen / Christoph - Kataloganreicherung mit LOD  5.500 Links

    zu 400 Project Gutenberg Ressourcen (Volltexte in mehreren Formaten) => 0.05% Anreicherung  1.200.000 Links zur Work-Ebene der Open Library => 12.5% Anreicherung 69 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
  50. Jansen / Christoph - Kataloganreicherung mit LOD DBpedia Beispiel: „Die

    Heilige Johanna der Schlachthöfe“ 71 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
  51. Jansen / Christoph - Kataloganreicherung mit LOD Open Library Beispiel:

    „With reference to reference“ 75 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
  52. Jansen / Christoph - Kataloganreicherung mit LOD Integration in Kataloge

     Was darf übernommen werden, was nicht?  Was sollte übernommen werden, was nicht?  Menschen-lesbare Anzeige der Links/URIs  (Manche) Daten sollten lokal indexiert werden (zur Recherche)  ... 77 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  53. Jansen / Christoph - Kataloganreicherung mit LOD Warum Linked Open

    Data?  Richtig ist: „Warum nicht LOD?“  Linked Data impliziert kontrolliertes Vokabular, Identifier, weitere Links … <= ideal!  Linked Open Data: Daten lassen sich nachnutzen/zwischenspeichern/verändern <= ideal! 78 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  54. Jansen / Christoph - Kataloganreicherung mit LOD Anwendungsbeispiel 81 24.05.2012

    Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  55. Jansen / Christoph - Kataloganreicherung mit LOD Anwendungsbeispiel 82 24.05.2012

    Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
  56. Jansen / Christoph - Kataloganreicherung mit LOD FAZIT 84 24.05.2012

    Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Alles, was mit LOD erreicht werden kann, kann auch anders erreicht werden. Mit LOD ist es nur viel einfacher.
  57. Quellenverzeichnis 86 - KiM: Empfehlungen zur Öffnung bibliothekarischer Daten https://wiki.d-nb.de/pages/viewpage.action?pageId=45419980

    - Till Kreutzer (2010): Open Data – Freigabe von Daten aus Bibliothekskatalogen http://www.hbz-nrw.de/dokumentencenter/veroeffentlichungen/open-data-leitfaden.pdf - Adrian Pohl (2010): Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. Preprint: http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2010_open-data.pdf - Tim Berners Lee zu Open Data (2010): http://www.youtube.com/watch?v=3YcZ3Zqk0a8 - Jansen / Christoph: Dynamische Kataloganreicherung auf Basis von Linked Open Data http://de.slideshare.net/h_jansen/dynamische-kataloganreicherung-auf-basis-von-linked-open-data - Blog post: First results using SILK to link to DBpedia https://wiki1.hbz-nrw.de/display/SEM/2012/05/03/First+results+using+SILK+to+link+to+DBpedia - Blog post: 1.2 M links to Open Library https://wiki1.hbz-nrw.de/display/SEM/2012/05/23/1.2+M+links+to+Open+Library - Oliver Flimm (2010): LOD und die Open Library http://de.slideshare.net/flimm/lod-openlibrary20100512 - Datenverzeichnis „thedatahub“ aka CKAN: http://www.thedatahub.org/ - 49 bibliographische Datenquellen als LODhttp://thedatahub.org/group/bibliographic?tags=lod - Workshop SWIB12: http://swib.org/swib12/programme.php