Slide 1

Slide 1 text

Bibliotheken: Wir öffnen Daten Bibliothekartag. Bremen, 04.06.2014. Adrian Pohl Zum Stand der Entwicklung einer offenen Dateninfrastruktur

Slide 2

Slide 2 text

Struktur 2 „Bibliotheken: Wir öffnen Daten“, Pohl I. Eröffnung: Ziele II. Elemente einer (offenen) Dateninfrastruktur III. Open Discovery? IV. Konkrete Schritte

Slide 3

Slide 3 text

I. Eröffnung: Ziele

Slide 4

Slide 4 text

(Discovery) Services, die... 4 nützlich, einfach, stabil, kostengünstig und zukunftssicher sind. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 5

Slide 5 text

Nutzer/innen, die... 5 zahlreich und zufrieden sind. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 6

Slide 6 text

Mitarbeiter/innen, die... 6 motiviert, neugierig, innovativ, freundlich und hilfsbereit sind. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 7

Slide 7 text

Bibliotheken, die... 7 relevant, vielbesucht, innovativ sind und fortbestehen. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 8

Slide 8 text

Aber... 8 Diese Ziele werden nie abschließend erreicht. An ihnen muss immer wieder gearbeitet werden: Dafür gibt es gute und schlechte Umgebungen. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 9

Slide 9 text

Offene Umgebungen 9 Offene Umgebungen laden ein zum Experimentieren, zum Teilen und zur Zusammenarbeit. Sie fördern langfristig: Effizienz, Transparenz, Innovation, Zukunftssicherheit. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 10

Slide 10 text

“Offen” 10 Etwas ist offen, wenn es selbst bzw. seine Spezifikation/Baupläne (a) frei zugänglich sind, (b) in öffentlich dokumentierten Formaten vorliegen und (c) es jedem erlaubt ist, es zu benutzen, weiterzuverwenden und -zuverbreiten. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 11

Slide 11 text

II. Elemente einer (offenen) Dateninfrastruktur

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

Hardware 13 Physische Netze Server Clients „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 14

Slide 14 text

Daten 14 Titeldaten (Monographien & Periodika vs. Zeitschriftenartikel) Kontrollierte Vokabulare Bestandsdaten Verfügbarkeitsdaten Bibliographien Statistische Daten (Ausleihdaten, Zugriffsstatistiken etc. ) Forschungsdaten „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 15

Slide 15 text

Software 15 Bibliothekssysteme Discovery-Lösungen Verbundsysteme Repositories Software zur Datentransformation „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 16

Slide 16 text

(Meta)datenstandards 16 Spezifikationen von Datenmodellen, Vokabularen/ Schemas, Erfassungsregeln, Serialisierungen, Encodings. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 17

Slide 17 text

Protokolle & APIs 17 Spezifikationen von Protokollen für Datenabfrage, Lesen/Schreiben, Datensynchronisierung. Konkrete Schnittstellen/APIs Zugriff Dokumentation „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 18

Slide 18 text

Dokumentation 18 Tutorials Mailinglisten und -archive Ticketsysteme Metadatenmappings Anwendungsprofile Projektanträge, -pläne, -berichte, Lessons Learned Konfigurationsdateien für Datentransformation... „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 19

Slide 19 text

Akteure 19 Bibliotheken & Verbundzentralen Non-Profit-Organisationen For-Profit-Unternehmen Verlage Universitäten und Wissenschaftler Förderinstitutionen Sonstige „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 20

Slide 20 text

Status Quo: Beispiele 20 „Bibliotheken: Wir öffnen Daten“, Pohl offen nicht offen Hardware - ● Physikalische Netze & Server ● Tendenz: Zentralisierung Daten ● hbz, b3kat, HeBIS ● BNB, DNB, BnF, BNE ● GND, VIAF, LCSH ● DBLP ● Journalartikelmetadaten ● ViFa-/FID-Daten ● Fachbibliographien ● Discovery Indizes Dokumentation Mailinglisten(archive), Mappings ● Projektanträge und -berichte Protokolle & APIs ● Protokolle meist offen (W3C-, NISO-Standards) ● lobid-API, Nature-API ● SLNP Metadaten- standards ● Spezifikationen von Vokabularen, Serialisierungen & Encodings meist offen ● AACR, RDA Software ● Koha, Evergreen, vufind ● OPUS, DSpace, E-Prints, Fedora ● Refine, Metafacture, Catmandu Alma, WMS, EDS, Summon, Primo, CONTENTdm, DigiTool

Slide 21

Slide 21 text

III. Open Discovery? 21

Slide 22

Slide 22 text

Derzeitige Discovery-Ansätze 22 „Bibliotheken: Wir öffnen Daten“, Pohl Nützlich? Einfach? Stabil? Kostengünstig? Effizient? Transparent? Innovativ? Zukunftssicher? Nachnutzbar? Kooperativ?

Slide 23

Slide 23 text

Probleme derzeitiger Ansätze 23 Daten und Software nicht offen/nachnutzbar Kostenintensiv Intransparent (z. B. Ranking) Zugriff auf Daten lizenzierter Inhalte nicht gesichert ... „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 24

Slide 24 text

Lösungsansätze 24 a) Offene Daten: Rechtliche Hürden beseitigen, um allen (Bibliotheken, Wissenschaftlern etc.) den Aufbau eigener Suchindizes zu ermöglichen. b) Linked Data: Die Publikation strukturierter Metadaten im Web (RDF+schema.org) vorantreiben, so dass Internetsuchmaschinen sie indexieren können. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 25

Slide 25 text

a) Offene Daten einsammeln 25 „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 26

Slide 26 text

b) Linked Data sammeln lassen 26 „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 27

Slide 27 text

schema.org & Google 27 Erste Erfahrungen & Experimente: Duke University Libraries, Schema.org and Google for Local Discovery schema.org-basierter union catalog (proof of concept) von Dan Scott „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 28

Slide 28 text

IV. Konkrete Schritte

Slide 29

Slide 29 text

1. “Eigene” Daten freigeben 29 Fachbibliographien Virtuelle Fachbibliotheken / SSG / Fachinformationsdienste Kataloge von Spezialbibliotheken Bibliographien von WissenschaftlerInnen Hochschulschriftenserver (Egal, ob PDF, Word-Datei, XML, MAB.) „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 30

Slide 30 text

2. LOD veröffentlichen 30 Persistente URLs RDF-Daten mittels JSON-LD oder RDFa einbetten Nutzung von schema.org Hilfreich: Empfehlungen der W3C Schema Bib Extend Community Group „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 31

Slide 31 text

3. (Linked) Open Data einfordern 31 Bei der Lizenzierung von Inhalten (Journals, eBooks etc.) die freie Nutzbarkeit der zugehörigen Metadaten in den Vertrag aufnehmen. Entsprechende Musterklauseln entwerfen. Zusätzlich von Inhalteanbietern die Publikation strukturierter Metadaten im Web in Verbindung mit den eigentlichen (kostenpflichtigen) Inhalten verlangen. „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 32

Slide 32 text

4. Index aufbauen 32 Daten einsammeln & aktuell halten Daten normalisieren Daten indexieren Alternativ: Google indexieren lassen und Custom Search aufsetzen Recherche und mehr ermöglichen (fachspezifisch oder -übergreifend) Freie Software nutzen, Ansatz und Erfahrungen dokumentieren, Skripte teilen „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 33

Slide 33 text

Danke. Fragen? Gerne jetzt oder auch später an [email protected] oder @acka47. Diese Folien stehen – soweit nicht anders angegeben – unter der Creative Commons Public Domain Dedication (CC0): http://creativecommons.org/publicdomain/zero/1.0/.

Slide 34

Slide 34 text

Weiterführende Informationen 34 Aery, Shawn (2014): Schema.org and Google for Local Discovery: Some Key Takeaways. URL: http://blogs.library.duke.edu/bitstreams/2014/03/27/schema-org-and-google-for-local-dis covery-some-key-takeaways/ Gruppe „Lizenzen“ der DINI AG KIM (2011): Empfehlungen zur Öffnung bibliothekarischer Daten: https://wiki.dnb.de/x/zA21Ag Christoph, Pascal / Pohl, Adrian (2014): Dezentral, offen, vernetzt – Überlegungen zum Aufbau eines LOD-basierten FID-Fachinformationssystems. In: Bibliothek Forschung und Praxis, Band 38, Heft 1, Seiten 114–123. ISSN (Online) 1865-7648, ISSN (Print) 0341- 4183, DOI: 10.1515/bfp-2014-0005. Preprint unter https://wiki1.hbz-nrw.de/x/EYOf. Libraries Empowerment Manifesto: http://etherpad.lobid.org/p/LEM Pohl, Adrian (2013): Discovery silos vs. The open web. In: Open Bibliography and Open Bibliographic Data [Blog], 23.6.2013. URL: http://openbiblio.net/2013/06/23/discovery-silos-vs-the-open-web/ „Bibliotheken: Wir öffnen Daten“, Pohl

Slide 35

Slide 35 text

35 „Discovery-Wurst“ (Folie 25) erstellt unter Verwendung von ● Configuration, data icon von Visual Pharm ( https://www.iconfinder.com/icons/175662/configuration_data_icon), ● Lock, open icon von Stephen Hutchings, https://www.iconfinder.com/icons/216292/lock_open_icon, lizensiert unter CC-SA 3.0, ● Fleischwolf, https://de.wikipedia.org/wiki/Datei:Fleischwolf.ganz.jpg, Foto von de:user:Kku, modifiziert von de:user:Rainer Zenz, lizensiert unter CC BY-SA 3.0, ● Sausage von mcol, http://openclipart.org/detail/6165/sausage-by-mcol, Public Domain. „RDF-Ernte“ (Folie 26) erstellt unter Nutzung von weizen weizenfeld weizenähren ähren getreide korn von spinheike, lizenziert unter CC0. „Bibliotheken: Wir öffnen Daten“, Pohl Credits