Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Valsts pārvaldes atvērto datu semantiskās integrācijas procesi

Bakalaura darba aizstāvēšanas prezentācija

Kārlis Lauva

January 23, 2014
Tweet

More Decks by Kārlis Lauva

Other Decks in Education

Transcript

  1. Darba mērķi • Situācijas apskats Latvijā un ES • Semantiskās

    integrācijas procesu definēšana • Saeimas datu semantiskās integrācijas plāna izveide
  2. Atvērtie dati • Brīvi pieejami tīmeklī • Licencēti ar atvērtu

    licenci • Nav ierobežota to atkalizmantošana • Vēlama atvērtu formātu izmantošana
  3. Saistītie atvērtie dati • Atvērto datu publicēšanas veids • Unikālas

    tīmekļa adreses kā identifikatori • Izmanto RDF datu modeli • Sasaistīti ar citām atvērto datu kopām
  4. Atvērto datu situācija Latvijā • Viena no nozares prioritātēm •

    Tiesiskais regulējums tiek izstrādāts • Trūkst labu atvērto datu izmantošanas piemēru • Galvenā aktivitāte interesentu grupu līmenī
  5. Situācija Eiropas Savienībā • Labi piemēri Apvienotajā Karalistē un Francijā,

    no kā mācīties • Izstrādāta direktīva atvērto datu izmantošanai
  6. Semantiskās integrācijas procesi • Tvēruma un objektu definēšana • Datu

    ieguve • Datu attīrīšana • Datu bagātināšana • Datu publicēšana • Datu avota uzturēšana
  7. Sākotnējo datu ieguve • Datu lejupielāde no avota • Izgūšana

    (“scraping”) no lejupielādētiem dokumentiem • Pārveidošana atvērtos datu apmaiņas formātos
  8. Saistīto datu publicēšana tīmeklī • Datu glabātuves izveide vai izvēle

    • Datu glabātuves formāta izvēle • Tīmekļa servera izveide pieprasījumu apstrādei • Serializēto RDF formātu nodrošināšana
  9. Saeimas datu semantiskā integrācija • Dati pieejami kā JavaScript funkciju

    izsaukumi • Izmantotas balsojumu, sēžu un deputātu kopas • Jau pieejami ārējie identifikatori
  10. Semantiskās integrācijas plāns • Valodā Python izveidots rīku kopums •

    Semantiski integrēts ar DBPedia.org • Datu bagātināšana nav automātiski iespējama • Esošo datu atjaunošana nav jāveic, jo esošie dati nemainās • Plāns Saeimas datu avota implementēšanai
  11. Rezultāti un secinājumi • Valstiskā līmenī ļoti aktuāls temats •

    Aktualitāte nākotnē tikai pieaugs • Uz šādu rīku bāzes var būvēt plašākam interesentu lokam izmantojamus rīkus • Saeimas saistīto datu avota (un datu izguves rīku) publicēšana atvērtā pirmkoda veidā - http://ej.uz/govscrape