Slide 1

Slide 1 text

VALSTS PĀRVALDES ATVĒRTO DATU SEMANTISKĀS INTEGRĀCIJAS PROCESI Bakalaura darbs Kārlis Lauva 23.01.2014.

Slide 2

Slide 2 text

Darba mērķi ● Situācijas apskats Latvijā un ES ● Semantiskās integrācijas procesu definēšana ● Saeimas datu semantiskās integrācijas plāna izveide

Slide 3

Slide 3 text

Atvērtie dati ● Brīvi pieejami tīmeklī ● Licencēti ar atvērtu licenci ● Nav ierobežota to atkalizmantošana ● Vēlama atvērtu formātu izmantošana

Slide 4

Slide 4 text

Saistītie atvērtie dati ● Atvērto datu publicēšanas veids ● Unikālas tīmekļa adreses kā identifikatori ● Izmanto RDF datu modeli ● Sasaistīti ar citām atvērto datu kopām

Slide 5

Slide 5 text

Atvērto datu situācija Latvijā ● Viena no nozares prioritātēm ● Tiesiskais regulējums tiek izstrādāts ● Trūkst labu atvērto datu izmantošanas piemēru ● Galvenā aktivitāte interesentu grupu līmenī

Slide 6

Slide 6 text

Situācija Eiropas Savienībā ● Labi piemēri Apvienotajā Karalistē un Francijā, no kā mācīties ● Izstrādāta direktīva atvērto datu izmantošanai

Slide 7

Slide 7 text

Piecu līmeņu atvērtie dati attēls: http://5sardata.info

Slide 8

Slide 8 text

Semantiskā integrācija Atvērto datu transformācija, lai tie būtu pieejami tīmeklī kā saistītie atvērtie dati

Slide 9

Slide 9 text

Semantiskās integrācijas procesi ● Tvēruma un objektu definēšana ● Datu ieguve ● Datu attīrīšana ● Datu bagātināšana ● Datu publicēšana ● Datu avota uzturēšana

Slide 10

Slide 10 text

Objektu un tvēruma definēšana ● Objektu, to īpašību un attiecību definēšana ● Identifikatoru izvēle

Slide 11

Slide 11 text

Sākotnējo datu ieguve ● Datu lejupielāde no avota ● Izgūšana (“scraping”) no lejupielādētiem dokumentiem ● Pārveidošana atvērtos datu apmaiņas formātos

Slide 12

Slide 12 text

Datu attīrīšana ● Vienota kodējuma izmantošana ● Ārpus tvēruma esošo objektu izmešana

Slide 13

Slide 13 text

Datu bagātināšana ● Sasaiste ar citām saistīto datu kopām ● Ārējo attiecību aprakstīšana

Slide 14

Slide 14 text

Saistīto datu publicēšana tīmeklī ● Datu glabātuves izveide vai izvēle ● Datu glabātuves formāta izvēle ● Tīmekļa servera izveide pieprasījumu apstrādei ● Serializēto RDF formātu nodrošināšana

Slide 15

Slide 15 text

Saistīto datu avota uzturēšana ● Datu ajtaunošana ● Iepriekšējo soļu atkārtošana ● Datu shēmas atjaunošana

Slide 16

Slide 16 text

Saeimas datu semantiskā integrācija ● Dati pieejami kā JavaScript funkciju izsaukumi ● Izmantotas balsojumu, sēžu un deputātu kopas ● Jau pieejami ārējie identifikatori

Slide 17

Slide 17 text

attēls: saeima.lv

Slide 18

Slide 18 text

attēls: saeima.lv

Slide 19

Slide 19 text

Semantiskās integrācijas plāns ● Valodā Python izveidots rīku kopums ● Semantiski integrēts ar DBPedia.org ● Datu bagātināšana nav automātiski iespējama ● Esošo datu atjaunošana nav jāveic, jo esošie dati nemainās ● Plāns Saeimas datu avota implementēšanai

Slide 20

Slide 20 text

Rezultāti un secinājumi ● Valstiskā līmenī ļoti aktuāls temats ● Aktualitāte nākotnē tikai pieaugs ● Uz šādu rīku bāzes var būvēt plašākam interesentu lokam izmantojamus rīkus ● Saeimas saistīto datu avota (un datu izguves rīku) publicēšana atvērtā pirmkoda veidā - http://ej.uz/govscrape

Slide 21

Slide 21 text

PALDIES PAR UZMANĪBU! 25.01.2013.