Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Bakalaura darba aizstāvēšanas prezentācija

085d620aca53f8b5a7630021747d9c9d?s=128

Kārlis Lauva

January 23, 2014
Tweet

Transcript

 1. VALSTS PĀRVALDES ATVĒRTO DATU SEMANTISKĀS INTEGRĀCIJAS PROCESI Bakalaura darbs Kārlis

  Lauva 23.01.2014.
 2. Darba mērķi • Situācijas apskats Latvijā un ES • Semantiskās

  integrācijas procesu definēšana • Saeimas datu semantiskās integrācijas plāna izveide
 3. Atvērtie dati • Brīvi pieejami tīmeklī • Licencēti ar atvērtu

  licenci • Nav ierobežota to atkalizmantošana • Vēlama atvērtu formātu izmantošana
 4. Saistītie atvērtie dati • Atvērto datu publicēšanas veids • Unikālas

  tīmekļa adreses kā identifikatori • Izmanto RDF datu modeli • Sasaistīti ar citām atvērto datu kopām
 5. Atvērto datu situācija Latvijā • Viena no nozares prioritātēm •

  Tiesiskais regulējums tiek izstrādāts • Trūkst labu atvērto datu izmantošanas piemēru • Galvenā aktivitāte interesentu grupu līmenī
 6. Situācija Eiropas Savienībā • Labi piemēri Apvienotajā Karalistē un Francijā,

  no kā mācīties • Izstrādāta direktīva atvērto datu izmantošanai
 7. Piecu līmeņu atvērtie dati attēls: http://5sardata.info

 8. Semantiskā integrācija Atvērto datu transformācija, lai tie būtu pieejami tīmeklī

  kā saistītie atvērtie dati
 9. Semantiskās integrācijas procesi • Tvēruma un objektu definēšana • Datu

  ieguve • Datu attīrīšana • Datu bagātināšana • Datu publicēšana • Datu avota uzturēšana
 10. Objektu un tvēruma definēšana • Objektu, to īpašību un attiecību

  definēšana • Identifikatoru izvēle
 11. Sākotnējo datu ieguve • Datu lejupielāde no avota • Izgūšana

  (“scraping”) no lejupielādētiem dokumentiem • Pārveidošana atvērtos datu apmaiņas formātos
 12. Datu attīrīšana • Vienota kodējuma izmantošana • Ārpus tvēruma esošo

  objektu izmešana
 13. Datu bagātināšana • Sasaiste ar citām saistīto datu kopām •

  Ārējo attiecību aprakstīšana
 14. Saistīto datu publicēšana tīmeklī • Datu glabātuves izveide vai izvēle

  • Datu glabātuves formāta izvēle • Tīmekļa servera izveide pieprasījumu apstrādei • Serializēto RDF formātu nodrošināšana
 15. Saistīto datu avota uzturēšana • Datu ajtaunošana • Iepriekšējo soļu

  atkārtošana • Datu shēmas atjaunošana
 16. Saeimas datu semantiskā integrācija • Dati pieejami kā JavaScript funkciju

  izsaukumi • Izmantotas balsojumu, sēžu un deputātu kopas • Jau pieejami ārējie identifikatori
 17. attēls: saeima.lv

 18. attēls: saeima.lv

 19. Semantiskās integrācijas plāns • Valodā Python izveidots rīku kopums •

  Semantiski integrēts ar DBPedia.org • Datu bagātināšana nav automātiski iespējama • Esošo datu atjaunošana nav jāveic, jo esošie dati nemainās • Plāns Saeimas datu avota implementēšanai
 20. Rezultāti un secinājumi • Valstiskā līmenī ļoti aktuāls temats •

  Aktualitāte nākotnē tikai pieaugs • Uz šādu rīku bāzes var būvēt plašākam interesentu lokam izmantojamus rīkus • Saeimas saistīto datu avota (un datu izguves rīku) publicēšana atvērtā pirmkoda veidā - http://ej.uz/govscrape
 21. PALDIES PAR UZMANĪBU! 25.01.2013.