Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Open Data und Suchmaschinen

Open Data und Suchmaschinen

Präsentation beim Open Data Beer am 02.04.2019 zu Google Dataset Search

Stefan Oderbolz

April 02, 2019
Tweet

More Decks by Stefan Oderbolz

Other Decks in Technology

Transcript

  1. «OPEN DATA UND SUCHMASCHINEN»

    View Slide

  2. 13. Mai 2019, Seite 2
    Stefan Oderbolz
    – Open Data Team
    Statistik Stadt Zürich
    – Ex-Liiper
    – Open Data Aktivist

    View Slide

  3. 13. Mai 2019, Seite 3
    STELL DIR VOR, DEINE DATEN SIND NUR EINE
    GOOGLE-SUCHE ENTFERNT…

    View Slide

  4. 13. Mai 2019, Seite 4
    Open Data und Suchmaschinen
    – Daten müssen einfach auffindbar sein

    View Slide

  5. 13. Mai 2019, Seite 5
    Open Data und Suchmaschinen
    – Ziel soll es sein, dass die Daten genutzt werden, egal wo und durch
    wen

    View Slide

  6. 13. Mai 2019, Seite 6
    Google Dataset Search
    – Erster Einblick in die Google-Indexierung von Datasets
    – Dataset Search ist Beta
    – Keine Mehrsprachigkeit
    – Fehler beim crawlen (z.B. mehrere Quellen für ein Dataset, Umlaute
    falsch)

    View Slide

  7. 13. Mai 2019, Seite 7
    Google Dataset Search
    https://toolbox.google.com/datasetsearch

    View Slide

  8. 13. Mai 2019, Seite 8
    Wie kommen meine Metadaten zur Suchmaschine?

    View Slide

  9. 13. Mai 2019, Seite 9
    Wie kommen meine Metadaten zur Suchmaschine?
    – Strukturierte Daten werden in Webseite des Datensatzes integriert 
    Suchmaschinen-Crawler
    {
    " @
    gr aph" : [
    {
    " @
    i d" : " ht t ps: / / dat a. st adt -
    zuer i ch. ch/ dat aset / pd_st apo_hundenam
    en/ r esour ce/ 54bf 65f 9- ce69- 43de- a51a-
    176d5d341071" ,
    " @
    t ype" : " schem
    a: Dat aDownl oad" ,
    " schem
    a: cont ent Ur l " : " ht t ps: / / dat a. st adt -
    zuer i ch. ch/ dat aset / pd_st apo_hundenam
    en/ r esour ce/ 54bf 65f 9- ce69- 43de- a51a-
    176d5d341071/ downl oad/ 20180305_hundenam
    en. csv" ,
    " schem
    a: descr i pt i on" : " Com
    m
    a- Separ at ed Val ues. W
    ei t er e
    I nf or m
    at i onen zu CSV f i nden Si e i n unser er Rubr i k W
    er kst at t unt er hr ef =\ " ht t ps: / / www. st adt -
    zuer i ch. ch/ por t al / de/ i ndex/ ogd/ wer kst at t / csv. ht m
    l \ " >I nf or m
    at i onen zu
    Dat enf or m
    at en. a> p>" ,
    " schem
    a: encodi ngFor m
    at " : " CSV" ,

    View Slide

  10. 13. Mai 2019, Seite 10
    Metadaten (schema.org)
    – Google pusht seit Jahren
    “structured data” als JSON-LD in
    HTML-Inhalten (Webseiten,
    Emails)
    – schema.org/Dataset beschreibt die
    Attribute

    View Slide

  11. 13. Mai 2019, Seite 11
    Primärdaten
    – Neben den Metadaten können auch
    direkt Primärdaten angegeben
    werden (“Linked Data”)
    – Google hat experimentellen Support
    für CSVW (“CSV on the Web”) für
    tabellarische Daten

    View Slide

  12. 13. Mai 2019, Seite 12
    Integration in CKAN
    – schema.org/Dataset habe ich in der Extension ckanext-dcat
    implementiert
    – CSVW fehlt noch (!)
    – Aktivierung:
    – Evtl. Mapping für eigene Felder anpassen
    – Plugin “structured_data” aktivieren
    – Profit!

    View Slide

  13. 13. Mai 2019, Seite 13
    Und jetzt? Was macht Google mit den Metadaten?
    – Die Bereitstellung als schema.org/Dataset hilft nicht nur Google (!)
    – Integration in klassische Suche ist nur eine Frage der Zeit
    – Implementation ist sehr einfach
    – Geringes Risiko
    – Daten werden potentiell besser gefunden und genutzt

    View Slide

  14. @OpenDataZurich
    Fragen?
    bit.ly/opendata-search

    View Slide