Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Teaching Linked Open Data in Dutch

Teaching Linked Open Data in Dutch

For Syntra West

Pieter Colpaert

November 26, 2014
Tweet

More Decks by Pieter Colpaert

Other Decks in Technology

Transcript

  1. 1. Basisconcepten rond data a. Data Discussie: datakwaliteit en interoperabiliteit

    b. Open Data Discussie: data publiceren vs. data services c. Gelinkte data 2. De Linked Open Data cloud en het Semantische Web a. hoe data publiceren? b. hoe data hergebruiken? Programma
  2. ↓ Querying syntactic object semantic technical legal process Zou het

    databeheer samengevoegd kunnen worden? Mag je volgens de licenties en juridisch kader de data samenvoegen? Zijn communicatie-middelen aansluitbaar? Bvb. datasysteem met telefoon vs. datasysteem enkel bereikbaar via post Hoe makkelijk kan ik over de grenzen van je dataset heen vragen stellen? Hoe interoperabel zijn de uitwisselformaten van beide datasets? Bvb. JSON vs. PDF? Welke stukken data kan ik in 1 keer opvragen en hoe is ze hiërarchisch gestructureerd? Betekenen woorden gebruikt in mijn dataset hetzelfde als woorden gebruikt in de jouwe?
  3. Data-dumps Web-documenten query language service Algorithms as a service Data

    publishing Data services Hoge beschikbaarheid Niet use-case-specifiek Veel dataverwerking op server Voor specifieke use case
  4. name type same as vestiging iMinds Bedrijf IBBT Gaston Crommenlaan

    8 { “iMinds” : { “type” : “Bedrijf”, “same as” : “IBBT, “vestiging” : “Gaston Crommenlaan 8” } } <iMinds> <type>Bedrijf</type> <sameas>IBBT</sameas> <vestiging> Gaston Crommenlaan 8 </vestiging> </iMinds> Table / CSV / Spreadsheet JSON XML Serialisaties
  5. name type same as vestiging iMinds Bedrijf IBBT Gaston Crommenlaan

    8 { “iMinds” : { “type” : “Bedrijf”, “same as” : “IBBT, “vestiging” : “Gaston Crommenlaan 8” } } <iMinds> <type>Bedrijf</type> <sameas>IBBT</sameas> <vestiging> Gaston Crommenlaan 8 </vestiging> </iMinds> <iMinds> <type> <Bedrijf> . <iMinds> <sameas> <IBBT> . <iMinds> <vestiging> “Gaston Crommenlaan 8” . Table / CSV / Spreadsheet JSON XML triples Triple structuur
  6. World Wide Web iMinds is hetzelfde als IBBT iMinds is

    een Bedrijf IBBT is gevestigd in Gaston Crommenlaan 8 Machine 1 Machine 2 Machine 3 Gelinkte data
  7. Probleem Bedrijf als woord is ambigu. Hoe zorgen we dat

    alle machines hetzelfde verstaan? semantische interoperabiliteit en wat met de relatie “is een”? en wat met “iMinds”?
  8. Oplossing iMinds → http://data.kbodata.be/organisation/0866_386_380#id is een → http://www.w3.org/1999/02/22-rdf-syntax-ns#type Bedrijf →

    http://www.w3.org/ns/regorg#RegisteredOrganization Uniform Resource Identifiers (URI’s) een triple = is een atomair stukje data (een datum of feit) dat niet verkeerd verstaan kan worden op machine-niveau in een Web-context
  9. iMinds Bedrijf is een iMinds → http://data.kbodata.be/organisation/0866_386_380#id is een →

    http://www.w3.org/1999/02/22-rdf-syntax-ns#type Bedrijf → http://www.w3.org/ns/regorg#RegisteredOrganization
  10. ↓ Querying syntactic object semantic technical legal process weinig invloed

    Open Data: ✓ Het web: ✓ Link traversal, SPARQL en webservices ✓ Syntax geen probleem: Moet transformeerbaar zijn naar triples ✓ Objectmodel kan zelf beslist worden Geen ambigue woorden: URI’s ✓ Semantische links: ✓
  11. Samenvatting Nieuwe termen: datakwaliteit, data-interoperabiliteit, triples, open data, data publiceren

    vs. services, linked open data cloud Linked Open Data betekent uw data meer interoperabel maken met andere datasets gepubliceerd op het web door het gebruik van URI’s en triples als atomaire bouwblokken.
  12. Bvb. bezoek deze links iMinds → http://data.kbodata.be/organisation/0866_386_380#id is een →

    http://www.w3.org/1999/02/22-rdf-syntax-ns#type Bedrijf → http://www.w3.org/ns/regorg#RegisteredOrganization
  13. Linked Data principles 1. Voor elk woord gebruik je een

    URI 2. Iedereen moet je URI kunnen opzoeken via HTTP 3. De info te vinden via de URI bevat triples 4. De gevonden triples bevatten ook links naar externe relevante datasets Alleen belangrijk als je nieuwe URI’s definieert. Niet nodig als je uitspraken doet over zaken die al online te vinden zijn
  14. Bvb. ik lanceer een nieuw bedrijf {mijnnieuwbedrijf} → http://{mijnnieuwbedrijf}.be/#org is

    een → http://www.w3.org/1999/02/22-rdf-syntax-ns#type Bedrijf → http://www.w3.org/ns/regorg#RegisteredOrganization Een identifier voor uw bedrijf en jij bent baas over de betekenis.
  15. Bvb. ik lanceer een nieuw bedrijf {mijnnieuwbedrijf} → http://{mijnnieuwbedrijf}.be/#org is

    een → http://www.w3.org/1999/02/22-rdf-syntax-ns#type Bedrijf → http://www.w3.org/ns/regorg#RegisteredOrganization {mijnnieuwbedrijf} → http://{mijnnieuwbedrijf}.be/#org heeft een home page → http://xmlns.com/foaf/0.1/homepage http://{mijnnieuwbedrijf}.be/
  16. Publicatiemechanismen 1. Datadumps 2. Triples binnenin HTML pagina’s 3. JSON

    → JSON-LD webservices 4. Triple pattern fragments Enkele voorbeelden
  17. http://wiki.dbpedia.org/Downloads2014 → Alle feiten in wikipedia in 1 file Datadump

    1 grote file met een lijst van triples Voordeel: direct te importeren in een eigen systeem Probleem: moeilijk up to date te houden
  18. JSON API Oude manier: Ga in app naar URL, krijg

    data om direct te gebruiken (geliefd bij app ontwikkelaars) Voordeel: makkelijk opnieuw op te halen → real-time data http://{adres naar API-document over Empire State}
  19. JSON-LD API Voeg “context” toe: ieder woord krijgt een URI

    Voordeel: API’s worden semantisch gedesambigueerd Voordeel: 2 APIs met gelijkaardige context zijn semantisch interoperabel
  20. Triple Pattern Fragments basis-vragen toelaten op uw server iMinds →

    is een → ? iets ?iets → is een → bedrijf ?iets → is een → ?wat ?iets → ?relatie → ?wat iMinds → is een → Bedrijf ? Voordeel: laat apps toe om zelf complexe vragen te stellen over het real-time Web Bvb: http://fragments.dbpedia.org