Slide 1

Slide 1 text

Zoeken, vinden en beoordelen van onderzoeksdata Renate Mattiszik, Marta Kargól Saxion Hogeschool VOGIN-IP-lezing, 09 april 2026

Slide 2

Slide 2 text

Deze presentatie is tot stand gekomen door de samenwerking van Saxion en DCC-PO (Werkgroep zoeken en vinden van onderzoeksdata): Inge Boot van Hogeschool Rotterdam, Anne-Marie van Boeckel van Hanze Hogeschool, Esther Goedegebuure van Hogeschool Zeeland, Renate Mattiszik en Marta Kargól beide van Saxion

Slide 3

Slide 3 text

Programma Opening & Inleiding 10.55 - 11.10 Waar zoek ik? 11.10 - 11.30 Zoeken en documenteren 11.30 - 11.40 Opdracht 1 11.40 - 11.55 Bespreken opdracht 1 11.55 - 12.05 Beoordelen van datasets 12.05 - 12.30 Opdracht 2 12.30 - 12.45 Bespreken opdracht 2 12.45 - 12.55

Slide 4

Slide 4 text

Opening en Kennismaking Even voorstellen: • Waar werk je? • Wat is je functie? • Wat hoop je te leren?

Slide 5

Slide 5 text

Inhoud Inleiding Definitie hergebruiken van data Waarom en wanneer Waar zoek ik Data repositories Andere databronnen Zoeken en documenteren Documentatie Selectie Beoordelen van datasets FAIR principes Kwaliteit van data

Slide 6

Slide 6 text

Inleiding

Slide 7

Slide 7 text

Definitie • Datasets van eerder (eigen of niet eigen) onderzoek • Beleidsonderzoek • Patiëntendossiers • Bedrijfsdata • Overheidsdata • Data van niet academische instituten Hergebruik van data doelt in deze context op het gebruiken van eerder verzamelde data uit onderzoek of andere bronnen voor een lopend onderzoeksproject. Voorbeelden van data die je kunt hergebruiken zijn:

Slide 8

Slide 8 text

• Geld besparend • Tijd besparend • Duurzaamheid • Overvragen doelgroepen • Versnellen van wetenschappelijke ontwikkelingen • Versterken van je eigen dataset door te combineren met bestaande data • Specifieke groepen worden minder ondervraagt • Ethische overweging (wanneer het onderzoek impact heeft op deelnemers, dieren, milieu, etc.) • Stimulatie samenwerking tussen verschillende onderzoekers/disciplines • Mogelijkheid te vergroten tot internationaal & longitudinaal onderzoek Waarom data hergebruiken?

Slide 9

Slide 9 text

• Om nieuwe onderzoeksvragen te beantwoorden • Om te valideren (reproduceerbaarheid) • Om nieuwe datamodellen te bouwen (Data Science) • Om te onderbouwen dat je nieuwe data gaat verzamelen of produceren • Om andere datasets als vergelijkingsmateriaal te gebruiken • Om relevante datasets te citeren • Bij datadocumentatie om andermans methode over te nemen of je te laten inspireren Waarvoor kun je data(documentatie) hergebruiken?

Slide 10

Slide 10 text

Workflow Op welk moment in de onderzoekscyclus zoek je naar de data? Idee/Subsidieaanvraag/ oriëntatiefase: •Noodzaak van verzamelen nieuwe data onderbouwen •Toepasbaarheid van dataset uitleggen •Inspiratie Literatuuronderzoek: om relevante datasets te citeren Analyse: andere datasets als vergelijkingsmateriaal

Slide 11

Slide 11 text

Zoekstrategie dataset vs. zoekstrategie literatuur Napkin. AI

Slide 12

Slide 12 text

Waar zoek ik

Slide 13

Slide 13 text

Wat is je onderzoeks- vraag? Welke soort data(documen tatie) heb je nodig (kwalitatieve, kwantitatieve, survey templates etc.)? Welke variabelen heb je nodig (leeftijd, gender, beroep, etc.)? Wat wil je doen met de data? Met welke trefwoorden ga je zoeken? Binnen welke context? • Discipline • Geografie • Tijdsperiode in dataset • Tijdsperiode datacollectie • Doelgroep • Metadatasta ndaard • Open Access (licentie) Bepalen van je zoekstrategie in stappen

Slide 14

Slide 14 text

Waar zoek ik: een overzicht Datarepository van je instituut Generieke zoekmachines Vakspecifieke zoekmachines Nederlandse data repositories Internationale data repositories Andere databanken Datatijdschriften Wetenschappelijke literatuur Netwerk

Slide 15

Slide 15 text

Selecteren van data repositories Re3data : filtermogelijkheden, data repositories karakteristieken OAD data repositories: alfabetisch overzicht per vakgebied FAIRsharing.org: filtermogelijkheden, beleid en standarden

Slide 16

Slide 16 text

Afbeeldingen: Pampel H, Vierkant P, Scholze F, Bertelmann R, Kindling M, et al. (2013) Making Research Data Repositories Visible: The re3data.org Registry. PLoS ONE 8(11): e78080. doi:10.1371/journal.pone.0078080

Slide 17

Slide 17 text

Voorbeelden van zoekmachines Generieke zoekmachines DataCite Dataset Search Vakspecifieke zoekmachines (sociale wetenschappen) Portal Odissei CESSDA

Slide 18

Slide 18 text

Voorbeelden van datarepositories • Dans Data Stations • Dataverse.nl • 4TU.Research Data Nederlandse data repositories • Dryad • OSF • Zenodo Internationale data repositories

Slide 19

Slide 19 text

Andere bronnen: voorbeelden Overheidsdata Overheid.nl CBS Open data (StatLine) RIVM Open data platforms Kaggle Hugging World Bank Group OECD

Slide 20

Slide 20 text

Datatijdschriften & literatuuronderzoek Een peer review artikel waarin een dataverzameling wordt besproken in plaats van de onderzoeksresultaten. Data paper Een tijdschrift dat uitzonderlijk of gedeeltelijk datagerichte artikelen publiceert. Dit document beschrijft een dataset die informatie over 135 datatijdschriften verzamelt. Datatijdschrift Data Avaibility Statement Wanneer het openlijk delen van de data niet mogelijk is vanwege ethische of juridische overwegingen, vragen veel journals (wetenschappelijke tijdschriften) om een beschrijving van waar de data vindbaar zijn en onder welke voorwaarden de data toegankelijk zijn. Dit heet vaak een ‘data availability statement’. Journals geven zelf soms al verschillende voorbeelden van dergelijke statements op hun website.

Slide 21

Slide 21 text

Zoeken en documenteren

Slide 22

Slide 22 text

 Geen systematisch review mogelijk  Bij het zoeken van data is de rol van filters groter dan trefwoorden  Vergelijkbare strategie mogelijk  Vastleggen zoekstrategie en zoekresultaten is in beide gevallen aanbevolen Data vs. literatuur zoeken

Slide 23

Slide 23 text

Documenteren zoekproces Je kunt het volgende documenteren tijdens je zoekproces: • De gebruikte repository en/of zoekmachine (noteer informatie over bruikbaarheid, functionaliteiten en relevantie van een repository voor je onderzoeksvraag) • Gebruikte zoekwoorden en filters • Aantal gevonden resultaten • Datum • Evaluatie van je zoekproces en eventuele verbeteringen die je hebt aangebracht

Slide 24

Slide 24 text

Opdracht 1: • Bedenk een onderwerp/thema • Ga naar Re3data en selecteer relevante data repositories • Kies één repository en zoek daar naar relevante datasets • Ga naar DANS Data Stations en zoek daar naar relevante datasets • Hoe heb je gezocht? (trefwoorden, filters, etc.) • Onthoud de gevonden datasets voor de volgende opdracht • Wat zijn je ervaringen? Waar ben je tegen aan gelopen? Wat ging goed, wat niet?

Slide 25

Slide 25 text

Beoordelen van datasets

Slide 26

Slide 26 text

FAIR principes  FINDABLE • ACCESSIBLE • REUSABLE • INTEROPERABLE

Slide 27

Slide 27 text

• Toegangsvoorwaarden en licenties zijn duidelijk vermeld • Toegangsvoorwaarden van de dataleveranciers of onderzoekspartners

Slide 28

Slide 28 text

• Metadatastandaarden • Omschrijving variabelen (legenda) • Consistentie in omschrijvingen • Codering antwoordopties • Meeteenheden...

Slide 29

Slide 29 text

• Datadocumentatie • Gebruikslicentie • Bestandsformaten

Slide 30

Slide 30 text

Gebruikslicenties: twee bestaande datasets samenvoegen Bron: Wiki/cc license compatibility - Creative Commons

Slide 31

Slide 31 text

Bestande datasets toevoegen aan je eigen dataset Wanneer je een bewerkte dataset gaat publiceren, ben je bij de keuze voor een nieuwe licentie afhankelijk van de licentie die op de originele dataset staat. Het volgende schema geeft aan welke keuze je hebt: • Groen: Licentie die je mag toekennen op bewerkte data met een bepaalde oorspronkelijke licentie. • Geel : juridisch gezien mag het maar wordt afgeraden • Grijs: licenties die je niet mag gebruiken Bron: https://creativecommons.org/faq/#when-is-my-use- considered-an-adaptation

Slide 32

Slide 32 text

Kwaliteit van data Achtergrond van de auteurs Affiliatie van de auteurs Kwaliteit van publicaties gebaseerd op de dataset Kwaliteit van datarepository Kwaliteit van metadata, read.me, datadocumentatie Naleven van wetgeving

Slide 33

Slide 33 text

Documenteren gevonden datasets • Databank/repository/organisatie • Hoe de dataset toegankelijk is (open, onder embargo, beperkt, gesloten) • Link naar persistente identificatoren (bijv. DOI) • Datum • Je kunt de datasets toevoegen aan je reference manager (handmatig) Wanneer je datasets hebt gevonden, kun je het volgende documenteren:

Slide 34

Slide 34 text

FAIRness controleren: F-UJI • https://www.f-uji.net Een webservice waarmee de FAIRness van onderzoeksdata-objecten op datasetniveau worden beoordeeld op basis van de FAIRsFAIR Data Object Assessment Metrics

Slide 35

Slide 35 text

• Datarepositories bieden vaak datacitatie voorbeelden • Citeer de data volgens de regels van citatiestijl die je gebruikt in je artikel • Controleer de vereisten van het tijdschrift waarin je gaat publiceren • Meer info: https://www.dcc.ac.uk/guidance/how- guides/cite-datasets Citeren van data

Slide 36

Slide 36 text

Opdracht 2 Beoordeel een dataset op bruikbaarheid 1. FAIR principes 2. Kwaliteit van data 3. Zijn de datasets te combineren als je zelf je dataset met een CC BY licentie wilt publiceren? 4. Citeer je dataset