2012-09-27 Dieser Vortrag – inklusive der durch den Autor erstellten Grafiken auf den Folien 7, 8, 11, 13, 15, 16, 17, 18, 20, 21, 33, 62, 63 und 67 – steht unter der CC0 Lizenz : https://creativecommons.org/about/cc0 Davon ausgenommen sind die übrigen verwendeten Grafiken, Bilder und Screenshots, deren individuelle Rechte und Lizenzbedingungen fortgelten. Insbesondere stehen die http://www.istockphoto.com/ Grafiken auf den Folien 47, 49, 50 und 83 unter einer CC-BY-ND Lizenz : http://creativecommons.org/licenses/by-nd/3.0/de/ Die Graphiken auf den Folien 22-26 entstammen dem “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
derefenzieren 10 2012-09-27 Wird die Ressource nachgeschlagen, so wird die Ressource geliefert. Geht dies nicht, z.B. weil es sich um einen physischen Gegenstand handelt, werden Daten über die Ressource geliefert (aka Metadaten).
Basics: RDF Triple 14 2012-09-27 Ein Objekt kann Text sein: „Elgin, Catherine“ Ein Objekt kann ein URI sein: <http://d-nb.info/gnd/135539897> => Ressourcen in Ressourcen (aka „linked“)
Definition „linked“ 27 2012-09-27 Ad astra ? Ad astra ? Ad data ! Ad data ! To boldly go where no data has gone before. Ad astra ? Ad astra ? Ad data ! Ad data ! To boldly go where no data has gone before To boldly go where no data has gone before. . Bildquelle:http://hubblesite.org/gallery/album/star/pr2006050d
Basics: Resümee „linked“ 28 2012-09-27 • Ein RDF Triple besteht aus Subjekt, Prädikat und Objekt • Ein RDF Triple ist die kleinstmögliche Aussage über etwas • RDF Triple können URIs enthalten, und somit wiederum Triple • Mehrere RDF Triple ergeben RDF Graphen • HTTP-URIs, und damit Daten, sind institutsübergreifend • Maschinen „verstehen“ Daten • Einfache Schnittstelle: z.B. Webseiten (RDFa in HTML) => globales Datennetz („Web of Data“)
30 2012-09-27 http://opendefinition.org/ Wissen ist offen, wenn dessen Verwendung Wiederverwendung Wiederverwertung erlaubt ist. („A piece of knowledge is open if you are free to use, reuse and redistribute it.“)
? 36 2012-09-27 Bildquelle: https://github.com/jakobib/ticer2012 to be copied and modified under CC-BY-SA license. Data vs. Application „Data matures like Wine, Applications like Fish“ (James Governor)
öffnen 42 2012-09-27 Mögliche rechtliche Probleme klären • Fremddaten im Katalog • Nutzungsbedingungen in den Verträgen prüfen - KiM: Empfehlungen zur Öffnung bibliothekarischer Daten - Till Kreutzer: Open Data – Freigabe von Daten aus Bibliothekskatalogen - Adrian Pohl: Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. 2010
Jegliche Ergänzung vorhandener Datensätze um zusätzliche Informationen Links zum Volltext im WWW Schlagwörter Umschlagbilder ... Herkunft egal (Benutzer, Bibliotheken, Firmen...) Neue Funktionen: nur mittelbar 48 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Lokale DB: + Aufwendigere Zusammenführungen möglich + Daten nutzbar für Recherche und weitere Funktionen - Hoher kontinuierlicher Aufwand für jede Quelle Kataloganreicherung: Methoden Dynamisches Mashup: + Aktuell + Relativ geringer Aufwand je Quelle - Benötigt (performante) API - Keine Recherche über die Daten
RDF-basierte Speicherung mit SPARQL Endpoint: Einfaches Hinzufügen neuer Daten Nachnutzbar „Selbst-beschreibender“ Dump „API“ inbegriffen 54 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
lobid.org RDF Store mit SPARQL Endpoint: 4store Open Data aus dem Verbundkatalog „hbz01“ 16 M Titeldatensätze <=> 700 M Triple Verknüpfungen: 56 24.05.2012 • 5.500 Projekt Gutenberg • 12.000 DBpedia • 70.000 b3kat • 200.000 Dewey Decimal Class. • 270.000 DNB Nationalbiografie • 420.000 OCLC • 1.250.000 Open Library • 700.000 ZDB • 800.000 LOC Iso-639-2 • 22.000.000 gnd Normdatei • 32.000.000 lobid-organisations Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
von Daten Spannende Daten liegen „woanders“ => andere Regelwerke Beispiel DBpedia: Autor, ISBN usw. fehlt meistens => bleibt Titel Eingrenzungen: deutsche DBpedia category:Literarisches_Werk , category:Lexikon,_Enzyklopädie 60 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
Matching zu ungenau Postprozessierung: nur Bündel mit gleichem Autor zulassen 61 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
finden oder selber prägen rdrel:workManifested => Triple: <lobid-resource> <rdrel:workManifested> <dbpedia-resource> 65 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
klären Triples importieren in SPARQL-Endpoint Eigener „named Graph“ bietet Vorteile: Leicht löschbar/veränderbar Provenienz verfolgbar Eingrenzung von Abfragen auf Named Graphs 66 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
12.000 „sichere“ Links zu 4.000 DBpedia Ressourcen => 4.000 neue „Work“-Ebenen (21.000 verworfene Links) Durchschnittliche Bündelgröße: 3 Links nach freebase: 3.000 0.1 % Anreicherung 68 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
zu 400 Project Gutenberg Ressourcen (Volltexte in mehreren Formaten) => 0.05% Anreicherung 1.200.000 Links zur Work-Ebene der Open Library => 12.5% Anreicherung 69 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
Heilige Johanna der Schlachthöfe“ 71 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
„With reference to reference“ 75 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Was wurde erreicht?
Was darf übernommen werden, was nicht? Was sollte übernommen werden, was nicht? Menschen-lesbare Anzeige der Links/URIs (Manche) Daten sollten lokal indexiert werden (zur Recherche) ... 77 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
Data? Richtig ist: „Warum nicht LOD?“ Linked Data impliziert kontrolliertes Vokabular, Identifier, weitere Links … <= ideal! Linked Open Data: Daten lassen sich nachnutzen/zwischenspeichern/verändern <= ideal! 78 24.05.2012 Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012 Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27 Alles, was mit LOD erreicht werden kann, kann auch anders erreicht werden. Mit LOD ist es nur viel einfacher.
- Till Kreutzer (2010): Open Data – Freigabe von Daten aus Bibliothekskatalogen http://www.hbz-nrw.de/dokumentencenter/veroeffentlichungen/open-data-leitfaden.pdf - Adrian Pohl (2010): Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. Preprint: http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2010_open-data.pdf - Tim Berners Lee zu Open Data (2010): http://www.youtube.com/watch?v=3YcZ3Zqk0a8 - Jansen / Christoph: Dynamische Kataloganreicherung auf Basis von Linked Open Data http://de.slideshare.net/h_jansen/dynamische-kataloganreicherung-auf-basis-von-linked-open-data - Blog post: First results using SILK to link to DBpedia https://wiki1.hbz-nrw.de/display/SEM/2012/05/03/First+results+using+SILK+to+link+to+DBpedia - Blog post: 1.2 M links to Open Library https://wiki1.hbz-nrw.de/display/SEM/2012/05/23/1.2+M+links+to+Open+Library - Oliver Flimm (2010): LOD und die Open Library http://de.slideshare.net/flimm/lod-openlibrary20100512 - Datenverzeichnis „thedatahub“ aka CKAN: http://www.thedatahub.org/ - 49 bibliographische Datenquellen als LODhttp://thedatahub.org/group/bibliographic?tags=lod - Workshop SWIB12: http://swib.org/swib12/programme.php