Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Open Data und Suchmaschinen

Open Data und Suchmaschinen

Präsentation beim Open Data Beer am 02.04.2019 zu Google Dataset Search

Stefan Oderbolz

April 02, 2019
Tweet

More Decks by Stefan Oderbolz

Other Decks in Technology

Transcript

  1. 13. Mai 2019, Seite 2 Stefan Oderbolz – Open Data

    Team Statistik Stadt Zürich – Ex-Liiper – Open Data Aktivist
  2. 13. Mai 2019, Seite 3 STELL DIR VOR, DEINE DATEN

    SIND NUR EINE GOOGLE-SUCHE ENTFERNT…
  3. 13. Mai 2019, Seite 4 Open Data und Suchmaschinen –

    Daten müssen einfach auffindbar sein
  4. 13. Mai 2019, Seite 5 Open Data und Suchmaschinen –

    Ziel soll es sein, dass die Daten genutzt werden, egal wo und durch wen
  5. 13. Mai 2019, Seite 6 Google Dataset Search – Erster

    Einblick in die Google-Indexierung von Datasets – Dataset Search ist Beta – Keine Mehrsprachigkeit – Fehler beim crawlen (z.B. mehrere Quellen für ein Dataset, Umlaute falsch)
  6. 13. Mai 2019, Seite 9 Wie kommen meine Metadaten zur

    Suchmaschine? – Strukturierte Daten werden in Webseite des Datensatzes integriert  Suchmaschinen-Crawler <scr i pt t ype=" appl i cat i on/ l d+j son" > { " @ gr aph" : [ { " @ i d" : " ht t ps: / / dat a. st adt - zuer i ch. ch/ dat aset / pd_st apo_hundenam en/ r esour ce/ 54bf 65f 9- ce69- 43de- a51a- 176d5d341071" , " @ t ype" : " schem a: Dat aDownl oad" , " schem a: cont ent Ur l " : " ht t ps: / / dat a. st adt - zuer i ch. ch/ dat aset / pd_st apo_hundenam en/ r esour ce/ 54bf 65f 9- ce69- 43de- a51a- 176d5d341071/ downl oad/ 20180305_hundenam en. csv" , " schem a: descr i pt i on" : " <p>Com m a- Separ at ed Val ues. W ei t er e I nf or m at i onen zu CSV f i nden Si e i n unser er Rubr i k W er kst at t unt er <a hr ef =\ " ht t ps: / / www. st adt - zuer i ch. ch/ por t al / de/ i ndex/ ogd/ wer kst at t / csv. ht m l \ " >I nf or m at i onen zu Dat enf or m at en. </ a></ p>" , " schem a: encodi ngFor m at " : " CSV" ,
  7. 13. Mai 2019, Seite 10 Metadaten (schema.org) – Google pusht

    seit Jahren “structured data” als JSON-LD in HTML-Inhalten (Webseiten, Emails) – schema.org/Dataset beschreibt die Attribute
  8. 13. Mai 2019, Seite 11 Primärdaten – Neben den Metadaten

    können auch direkt Primärdaten angegeben werden (“Linked Data”) – Google hat experimentellen Support für CSVW (“CSV on the Web”) für tabellarische Daten
  9. 13. Mai 2019, Seite 12 Integration in CKAN – schema.org/Dataset

    habe ich in der Extension ckanext-dcat implementiert – CSVW fehlt noch (!) – Aktivierung: – Evtl. Mapping für eigene Felder anpassen – Plugin “structured_data” aktivieren – Profit!
  10. 13. Mai 2019, Seite 13 Und jetzt? Was macht Google

    mit den Metadaten? – Die Bereitstellung als schema.org/Dataset hilft nicht nur Google (!) – Integration in klassische Suche ist nur eine Frage der Zeit – Implementation ist sehr einfach – Geringes Risiko – Daten werden potentiell besser gefunden und genutzt