Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Bakalaura darba aizstāvēšanas prezentācija

085d620aca53f8b5a7630021747d9c9d?s=128

Kārlis Lauva

January 23, 2014
Tweet

More Decks by Kārlis Lauva

Other Decks in Education

Transcript

  1. VALSTS PĀRVALDES ATVĒRTO DATU SEMANTISKĀS INTEGRĀCIJAS PROCESI Bakalaura darbs Kārlis

    Lauva 23.01.2014.
  2. Darba mērķi • Situācijas apskats Latvijā un ES • Semantiskās

    integrācijas procesu definēšana • Saeimas datu semantiskās integrācijas plāna izveide
  3. Atvērtie dati • Brīvi pieejami tīmeklī • Licencēti ar atvērtu

    licenci • Nav ierobežota to atkalizmantošana • Vēlama atvērtu formātu izmantošana
  4. Saistītie atvērtie dati • Atvērto datu publicēšanas veids • Unikālas

    tīmekļa adreses kā identifikatori • Izmanto RDF datu modeli • Sasaistīti ar citām atvērto datu kopām
  5. Atvērto datu situācija Latvijā • Viena no nozares prioritātēm •

    Tiesiskais regulējums tiek izstrādāts • Trūkst labu atvērto datu izmantošanas piemēru • Galvenā aktivitāte interesentu grupu līmenī
  6. Situācija Eiropas Savienībā • Labi piemēri Apvienotajā Karalistē un Francijā,

    no kā mācīties • Izstrādāta direktīva atvērto datu izmantošanai
  7. Piecu līmeņu atvērtie dati attēls: http://5sardata.info

  8. Semantiskā integrācija Atvērto datu transformācija, lai tie būtu pieejami tīmeklī

    kā saistītie atvērtie dati
  9. Semantiskās integrācijas procesi • Tvēruma un objektu definēšana • Datu

    ieguve • Datu attīrīšana • Datu bagātināšana • Datu publicēšana • Datu avota uzturēšana
  10. Objektu un tvēruma definēšana • Objektu, to īpašību un attiecību

    definēšana • Identifikatoru izvēle
  11. Sākotnējo datu ieguve • Datu lejupielāde no avota • Izgūšana

    (“scraping”) no lejupielādētiem dokumentiem • Pārveidošana atvērtos datu apmaiņas formātos
  12. Datu attīrīšana • Vienota kodējuma izmantošana • Ārpus tvēruma esošo

    objektu izmešana
  13. Datu bagātināšana • Sasaiste ar citām saistīto datu kopām •

    Ārējo attiecību aprakstīšana
  14. Saistīto datu publicēšana tīmeklī • Datu glabātuves izveide vai izvēle

    • Datu glabātuves formāta izvēle • Tīmekļa servera izveide pieprasījumu apstrādei • Serializēto RDF formātu nodrošināšana
  15. Saistīto datu avota uzturēšana • Datu ajtaunošana • Iepriekšējo soļu

    atkārtošana • Datu shēmas atjaunošana
  16. Saeimas datu semantiskā integrācija • Dati pieejami kā JavaScript funkciju

    izsaukumi • Izmantotas balsojumu, sēžu un deputātu kopas • Jau pieejami ārējie identifikatori
  17. attēls: saeima.lv

  18. attēls: saeima.lv

  19. Semantiskās integrācijas plāns • Valodā Python izveidots rīku kopums •

    Semantiski integrēts ar DBPedia.org • Datu bagātināšana nav automātiski iespējama • Esošo datu atjaunošana nav jāveic, jo esošie dati nemainās • Plāns Saeimas datu avota implementēšanai
  20. Rezultāti un secinājumi • Valstiskā līmenī ļoti aktuāls temats •

    Aktualitāte nākotnē tikai pieaugs • Uz šādu rīku bāzes var būvēt plašākam interesentu lokam izmantojamus rīkus • Saeimas saistīto datu avota (un datu izguves rīku) publicēšana atvērtā pirmkoda veidā - http://ej.uz/govscrape
  21. PALDIES PAR UZMANĪBU! 25.01.2013.