Upgrade to Pro — share decks privately, control downloads, hide ads and more …

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Metadatenstandards im Kontext digitaler Bibliotheken

Jan Wieners
January 09, 2013

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Metadatenstandards im Kontext digitaler Bibliotheken

Jan Wieners

January 09, 2013
Tweet

More Decks by Jan Wieners

Other Decks in Education

Transcript

  1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // [email protected]

    Daten- und Metadatenstandards Wintersemester 2012 / 2013 09. Januar 2013 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.
  2.  „BAM“-Sektor: Bibliotheken, Archive, Museen  Digitale Bibliotheken, Digitale Archive,

    Digitale Museen  Bibliographische Metadaten  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema (MODS)  Digitale Objekte  Metadata Encoding and Transmission Standard (METS)  Gruppierung digitaler Objekte  Open Archives Initiative (OAI)  OAI-PMH  (Eingebettete) Metadaten für Multimedia  Bild: (GIF, PNG, JPEG), TIFF, EXIF  Audio: ID3 / ID3v2 Sitzungsüberblick
  3. Vannevar Bush (1890-1974)  1954: „As we may think“ 

    „Memex“ (Memory Extender) Digitale Bibliothek
  4. “A focused collection of digital objects, including text, video, and

    audio [and beyond: 3D objects, simulations, dynamic visualizations, and virtual reality], along with methods for access and retrieval, and for selection, organization, and maintenance of the collection.” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] Digitale Bibliothek
  5. Sammlung digitaler Objekte  Text  Video  Audio 

    3D Objekte  Simulationen, VR, etc. Bereitstellung von Zugriffsmöglichkeiten:  Benutzerseite:  Zugriff (access)  Abfrage (retrieval) von digitalen Objekten  Bibliothekarinnen-/Bibliothekarseite:  Selection  Organization  Maintenance Metadaten  Kritisch für alle Formen organisierter digitaler Inhalte Digitale Bibliothek
  6. Grundfrage: Woher stammen die Metadaten? Option I: Ein Mensch hat

    festgelegt, dass x  Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu. Option II: Ein Computerprogramm hat x analysiert und bestimmt  Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus. Metadaten
  7. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
  8. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten
  9.  MARC  MAB  MARCXML  Dublin Core (DC)

     Metadata Object Description Schema: MODS Bibliographische Metadaten: Standards
  10. MARC: MAchine Readable Cataloging  Vorgestellt in den späten 1960er

    Jahren von Henriette Avram (Library of Congress)  !Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)  MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“ [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]  “Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R  final revised 2nd edition).” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] MARC
  11.  Variable Control Fields (00x)  Variable Data Fields 

    Numbers and Codes (0xx)  Main Entries (1xx)  Titles (2xx)  Edition, Imprint, etc. (2xx)  Physical Description, etc. (3xx)  Series Statements (4xx)  Notes (5xx)  […]  Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html MARC Tags (die Spitze des Eisbergs)
  12. Maschinelles Austauschformat für Bibliotheken (MAB),  MAB  1970er, Deutsche

    Nationalbibliothek  MAB2  1990er  Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung) Kleiner Exkurs: MAB und VD18
  13. Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke

    des 18. Jahrhunderts Kontext VD18 VD 16 VD 17 VD 18 ~100 000 erfasste Titel ~255 000 Titel Ziel: Mehr als 600 000 Titel Förderzeitraum: 1969- 1999 Förderzeitraum: Seit Juli 1996 Förderzeitraum: Ab 2009
  14.  Benannt nach Dublin, Ohio, wo 1995 das erste Treffen

    der Gruppe / Initiative veranstaltet wurde.  Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für  Nutzung durch Nicht-Spezialisten  die Beschreibung digitaler Ressourcen (i.e. Websites), die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden  Verglichen mit MARC: Sehr einfach  Designziel: Allgemeinheit, Einfachheit Dublin Core
  15. Satz von 15 Elementen zur Beschreibung von Ressourcen:  Title

     Creator  Subject  Description  Publisher  Contributor  Date  Type  Format  Identifier  Source  Language  Relation  Coverage  Rights  Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig Dublin Core
  16. Elementübersicht: http://de.wikipedia.org/wiki/Dublin_Core Vgl. auch: http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core Übungsaufgabe: Geben Sie die wesentlichen

    Charakteristika des Werkes „Die Jungfrau züchtigt den Jesusknaben vor drei Zeugen“ (Max Ernst, 1926) mit Dublin Core wieder. Dublin Core Übung
  17.  Stärke und Schwäche von Dublin Core: Einfachheit  Genügen

    15 Elemente, um (digitale) Objekte adäquat zu beschreiben? Dublin Core
  18.  Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten

    und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS) :  Metadata Encoding and Transmission Standard (METS)  Metadata Object Description Schema (MODS)  Heimat von METS: http://www.loc.gov/standards/mets/  METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.” METS / MODS
  19. Sieben Hauptabschnitte:  Kopfteil (METS Header)  Erschließungsangaben (Descriptive Metadata)

     Verwaltungsangaben (Administrative Metadata)  Dateienabschnitt (File Section)  Strukturbeschreibung (Structural Map)  Strukturverknüpfungen (Structural Links)  Verhalten (Behavior) Ein Beispiel:  http://vd18-proto.bibliothek.uni-halle.de/de-slub- vd18/oai/?verb=GetRecord&metadataPrefix=mets&mode =view&identifier=5270690 METS / MODS
  20. OAI: Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über

    das Internet Konzepte & Co.:  Data Provider  Systeme, die Metadaten über OAI-PMH zugänglich machen  OAI-PMH  OAI Protocol for Metadata Harvesting  Service Provider  Sammelt Metadaten von Datenprovidern, bietet Suchinterface für Archive, von denen Metadaten gesammelt wurden OAI: Begrifflichkeiten, Konzepte
  21.  Datenkommunikation über http-Request  Basisadresse + Script (+ Verb

    (+ Argument)?)*  Sechs "Verben" zur Kommunikation  Identify [wer bist du?]  ListMetadataFormats [was sprichst du?]  ListSets [was hast du für Sammlungen?]  ListIdentifiers [gib mir deine Identifier]  ListRecords [gib mir Datensätze]  GetRecords [gib mir Datensätze]  Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken OAI: Kommunikation
  22. Beispielanwendung CEEC  Handschrift Dom 213  Bild: http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/pagesma/%22kn28-

    0213_001.jpg%22/segment/%22body%22  Beschreibung: http://www.ceec.uni-koeln.de/ceec- cgi/kleioc/0010/exec/katl/%22kn28-0213%22  XML (TEI-like): http://www.ceec.uni- koeln.de/projekte/CEEC/database/descriptions/kn28- 0213.xml  OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec- oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&i dentifier=kn28-0213 OAI: CEEC
  23. Arten von Metadaten:  Administrative metadata for managing resources, such

    as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
  24. /