WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Metadatenstandards im Kontext digitaler Bibliotheken

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Metadatenstandards im Kontext digitaler Bibliotheken

45498a716669c6ac165af19c34525ece?s=128

Jan G. Wieners

January 09, 2013
Tweet

Transcript

  1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de

    Daten- und Metadatenstandards Wintersemester 2012 / 2013 09. Januar 2013 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.
  2.  „BAM“-Sektor: Bibliotheken, Archive, Museen  Digitale Bibliotheken, Digitale Archive,

    Digitale Museen  Bibliographische Metadaten  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema (MODS)  Digitale Objekte  Metadata Encoding and Transmission Standard (METS)  Gruppierung digitaler Objekte  Open Archives Initiative (OAI)  OAI-PMH  (Eingebettete) Metadaten für Multimedia  Bild: (GIF, PNG, JPEG), TIFF, EXIF  Audio: ID3 / ID3v2 Sitzungsüberblick
  3. Digitale Bibliothek

  4. Bibliothek  Digitale Bibliothek

  5. Vannevar Bush (1890-1974)  1954: „As we may think“ 

    „Memex“ (Memory Extender) Digitale Bibliothek
  6. “A focused collection of digital objects, including text, video, and

    audio [and beyond: 3D objects, simulations, dynamic visualizations, and virtual reality], along with methods for access and retrieval, and for selection, organization, and maintenance of the collection.” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] Digitale Bibliothek
  7. Sammlung digitaler Objekte  Text  Video  Audio 

    3D Objekte  Simulationen, VR, etc. Bereitstellung von Zugriffsmöglichkeiten:  Benutzerseite:  Zugriff (access)  Abfrage (retrieval) von digitalen Objekten  Bibliothekarinnen-/Bibliothekarseite:  Selection  Organization  Maintenance Metadaten  Kritisch für alle Formen organisierter digitaler Inhalte Digitale Bibliothek
  8. Grundfrage: Woher stammen die Metadaten? Metadaten

  9. Grundfrage: Woher stammen die Metadaten? Option I: Ein Mensch hat

    festgelegt, dass x  Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu. Option II: Ein Computerprogramm hat x analysiert und bestimmt  Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus. Metadaten
  10. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
  11. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten
  12.  MARC  MAB  MARCXML  Dublin Core (DC)

     Metadata Object Description Schema: MODS Bibliographische Metadaten: Standards
  13. MARC

  14. MARC: MAchine Readable Cataloging  Vorgestellt in den späten 1960er

    Jahren von Henriette Avram (Library of Congress)  !Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)  MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“ [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]  “Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R  final revised 2nd edition).” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] MARC
  15. Beispiel: http://catalog.loc.gov MARC

  16.  Variable Control Fields (00x)  Variable Data Fields 

    Numbers and Codes (0xx)  Main Entries (1xx)  Titles (2xx)  Edition, Imprint, etc. (2xx)  Physical Description, etc. (3xx)  Series Statements (4xx)  Notes (5xx)  […]  Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html MARC Tags (die Spitze des Eisbergs)
  17. MARC Tags (die Spitze des Eisbergs)

  18. MARC Übung  http://www.loc.gov/marc/bibliographic/ecbdhome.html

  19. MARCXML-Darstellung MARCXML Vorteile?

  20. MARCXML  Dublin Core http://lccn.loc.gov/79459272/dc

  21. Maschinelles Austauschformat für Bibliotheken (MAB),  MAB  1970er, Deutsche

    Nationalbibliothek  MAB2  1990er  Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung) Kleiner Exkurs: MAB und VD18
  22. Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke

    des 18. Jahrhunderts Kontext VD18 VD 16 VD 17 VD 18 ~100 000 erfasste Titel ~255 000 Titel Ziel: Mehr als 600 000 Titel Förderzeitraum: 1969- 1999 Förderzeitraum: Seit Juli 1996 Förderzeitraum: Ab 2009
  23. VD18 – Arbeitsaufteilung / Workflow SWB KoordinierungsDB

  24. VD18: Daten

  25. MAB Übung

  26. Dublin Core

  27.  Benannt nach Dublin, Ohio, wo 1995 das erste Treffen

    der Gruppe / Initiative veranstaltet wurde.  Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für  Nutzung durch Nicht-Spezialisten  die Beschreibung digitaler Ressourcen (i.e. Websites), die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden  Verglichen mit MARC: Sehr einfach  Designziel: Allgemeinheit, Einfachheit Dublin Core
  28. Satz von 15 Elementen zur Beschreibung von Ressourcen:  Title

     Creator  Subject  Description  Publisher  Contributor  Date  Type  Format  Identifier  Source  Language  Relation  Coverage  Rights  Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig Dublin Core
  29. Beitrag auf heise.de Dublin Core – Beispiel 2

  30. Dublin Core – Beispiel 2

  31. Elementübersicht: http://de.wikipedia.org/wiki/Dublin_Core Vgl. auch: http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core Übungsaufgabe: Geben Sie die wesentlichen

    Charakteristika des Werkes „Die Jungfrau züchtigt den Jesusknaben vor drei Zeugen“ (Max Ernst, 1926) mit Dublin Core wieder. Dublin Core Übung
  32.  Stärke und Schwäche von Dublin Core: Einfachheit  Genügen

    15 Elemente, um (digitale) Objekte adäquat zu beschreiben? Dublin Core
  33. Digitale Objekte: METS / MODS

  34. Problemstellung

  35.  Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten

    und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS) :  Metadata Encoding and Transmission Standard (METS)  Metadata Object Description Schema (MODS)  Heimat von METS: http://www.loc.gov/standards/mets/  METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.” METS / MODS
  36. Sieben Hauptabschnitte:  Kopfteil (METS Header)  Erschließungsangaben (Descriptive Metadata)

     Verwaltungsangaben (Administrative Metadata)  Dateienabschnitt (File Section)  Strukturbeschreibung (Structural Map)  Strukturverknüpfungen (Structural Links)  Verhalten (Behavior) Ein Beispiel:  http://vd18-proto.bibliothek.uni-halle.de/de-slub- vd18/oai/?verb=GetRecord&metadataPrefix=mets&mode =view&identifier=5270690 METS / MODS
  37. OAI: Open Archives Initiative

  38. OAI: Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über

    das Internet Konzepte & Co.:  Data Provider  Systeme, die Metadaten über OAI-PMH zugänglich machen  OAI-PMH  OAI Protocol for Metadata Harvesting  Service Provider  Sammelt Metadaten von Datenprovidern, bietet Suchinterface für Archive, von denen Metadaten gesammelt wurden OAI: Begrifflichkeiten, Konzepte
  39.  Datenkommunikation über http-Request  Basisadresse + Script (+ Verb

    (+ Argument)?)*  Sechs "Verben" zur Kommunikation  Identify [wer bist du?]  ListMetadataFormats [was sprichst du?]  ListSets [was hast du für Sammlungen?]  ListIdentifiers [gib mir deine Identifier]  ListRecords [gib mir Datensätze]  GetRecords [gib mir Datensätze]  Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken OAI: Kommunikation
  40. Beispielanwendung CEEC  Handschrift Dom 213  Bild: http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/pagesma/%22kn28-

    0213_001.jpg%22/segment/%22body%22  Beschreibung: http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/katl/%22kn28-0213%22  XML (TEI-like): http://www.ceec.uni- koeln.de/projekte/CEEC/database/descriptions/kn28- 0213.xml  OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec- oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&i dentifier=kn28-0213 OAI: CEEC
  41.  http://de.wikipedia.org/wiki/Open_Archives_Initiative  http://en.wikipedia.org/wiki/Open_Archives_Initiative  http://www.openarchives.org/  http://www.openarchives.org/OAI/openarchivesprotocol.h tml Weiterführende

    Informationen
  42. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
  43. /