Slide 1

Slide 1 text

Grip op je data Start met het analyseren van collectie-informatie Nynke Kuipers - Kubus erfgoed & digitalisering

Slide 2

Slide 2 text

Even voorstellen: Nynke Kuipers [email protected] Zelfstandig digitaal erfgoed specialist

Slide 3

Slide 3 text

“Digitaal erfgoed voor iedereen beschikbaar maken – dat doen we samen.” Nationale Strategie Digitaal Erfgoed Meer informatie: www.netwerkdigitaalerfgoed.nl/datawerkplaatsen

Slide 4

Slide 4 text

Datakwaliteit: wat betekent dat eigenlijk?

Slide 5

Slide 5 text

Herken jij dit?

Slide 6

Slide 6 text

Of dit? of

Slide 7

Slide 7 text

Correcte toepassing van de velden in de collectie-informatiesystemen Aanwezigheid van contextuele informatie bij erfgoedobjecten Toepassing van gestandaardiseerde termen uit het Termennetwerk Gebruik van gestandaardiseerde termen voor ten minste: wie, wat, waar, wanneer Inclusief en divers taalgebruik Vermelding van gebruiksrechten voor digitale erfgoedobjecten en bijbehorende beschrijvingen Datakwaliteit

Slide 8

Slide 8 text

Analyse van de datakwaliteit

Slide 9

Slide 9 text

Welke velden zijn in gebruik? Welke velden gebruik je? Welke velden wil je delen met het publiek? Zijn de velden volgens de invoerinstructie ingevuld?

Slide 10

Slide 10 text

Past de inhoud bij het doel van het veld?

Slide 11

Slide 11 text

Zijn de velden consequent ingevuld? Hoe is het hoofdlettergebruik? Wordt dit consistent gebruikt? Zijn de meeteenheden en datumnotaties correct? Is het gebruik van eigennamen eenduidig? Hoe wordt omgegaan met afkortingen? Wordt enkelvoud of meervoud consistent gebruikt?

Slide 12

Slide 12 text

Zijn termen gekoppeld? Via het Termennetwerk? Of via een andere open data thesaurusbron?

Slide 13

Slide 13 text

Komt kwetsend, achterhaald of discriminerend taalgebruik in de collectiedata voor?

Slide 14

Slide 14 text

Aan de slag met OpenRefine

Slide 15

Slide 15 text

Wat heb je nodig: 1. OpenRefine download via openrefine.org 2. Export van je data (.csv, .tsv, .xlsx, .xml) 3. Of download een Demobestand op: kubus.frl/downloads

Slide 16

Slide 16 text

Create project

Slide 17

Slide 17 text

Create project - configureren

Slide 18

Slide 18 text

ROWS - RECORDS

Slide 19

Slide 19 text

ALL - RE-ORDER / REMOVE COLUMNS

Slide 20

Slide 20 text

ALL - RE-ORDER / REMOVE COLUMNS

Slide 21

Slide 21 text

UNDO / REDO

Slide 22

Slide 22 text

ALL - Overzicht gevulde velden

Slide 23

Slide 23 text

ALL - Overzicht gevulde velden

Slide 24

Slide 24 text

ALL - Overzicht gevulde velden

Slide 25

Slide 25 text

Hoe verhouden de velden zich tot wat jij verwacht? Dataprofiel Collectieinformatie voor het publiek (Musea) Zijn de basisvelden bij veel items ingevuld? Zijn er velden gevuld waarvan je nog nooit gehoord hebt?

Slide 26

Slide 26 text

Filter resultaat

Slide 27

Slide 27 text

FACET - filter per kolom

Slide 28

Slide 28 text

FACET - filter per kolom

Slide 29

Slide 29 text

SPLIT MULTI-VALUED CELLS

Slide 30

Slide 30 text

SPLIT MULTI-VALUED CELLS

Slide 31

Slide 31 text

SPLIT MULTI-VALUED CELLS - controleer je resultaat

Slide 32

Slide 32 text

Inhoudelijke controle - veld Materiaal

Slide 33

Slide 33 text

Klopt de inhoud bij het veld? Dataprofiel Collectieinformatie voor het publiek (Musea) Worden namen en hoofdletters consequent genoteerd? Worden URI's gebruikt voor termen?

Slide 34

Slide 34 text

Vrij zoeken in tekst

Slide 35

Slide 35 text

Komt kwetsend, achterhaald of discriminerend taalgebruik in de collectiedata voor? Words Matter

Slide 36

Slide 36 text

Tips OpenRefine

Slide 37

Slide 37 text

Cluster and Edit

Slide 38

Slide 38 text

Cluster and Edit

Slide 39

Slide 39 text

Cluster and Edit

Slide 40

Slide 40 text

Data verrijken - Reconciliation

Slide 41

Slide 41 text

Data verrijken - Reconciliation Leestip: Verrijk je collectie met termen

Slide 42

Slide 42 text

Groot bestand?

Slide 43

Slide 43 text

Verhogen maximale memory usage Let bij het instellen op de limiet van je computer. Uitgangspunt is je RAM- geheugen. Neem als handvat de helft van je RAM- geheugen en ga daar dan iets onder zitten. In dit voorbeeld is een RAM-geheugen van 32GB beschikbaar.

Slide 44

Slide 44 text

OpenRefine kan niet alles voor je oplossen... ...maar het kan je wel helpen inzicht te krijgen!

Slide 45

Slide 45 text

Bedankt! Deze presentatie is te downloaden via kubus.frl/downloads vragen: [email protected]