Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Zoeken, vinden en beoordelen van onderzoeksdata

Avatar for voginip voginip
April 24, 2026

Zoeken, vinden en beoordelen van onderzoeksdata

Workshop bij VOGIN-IP-lezing 2026, door Marta Kargól en Renate Mattiszik

Avatar for voginip

voginip

April 24, 2026

More Decks by voginip

Other Decks in Technology

Transcript

  1. Deze presentatie is tot stand gekomen door de samenwerking van

    Saxion en DCC-PO (Werkgroep zoeken en vinden van onderzoeksdata): Inge Boot van Hogeschool Rotterdam, Anne-Marie van Boeckel van Hanze Hogeschool, Esther Goedegebuure van Hogeschool Zeeland, Renate Mattiszik en Marta Kargól beide van Saxion
  2. Programma Opening & Inleiding 10.55 - 11.10 Waar zoek ik?

    11.10 - 11.30 Zoeken en documenteren 11.30 - 11.40 Opdracht 1 11.40 - 11.55 Bespreken opdracht 1 11.55 - 12.05 Beoordelen van datasets 12.05 - 12.30 Opdracht 2 12.30 - 12.45 Bespreken opdracht 2 12.45 - 12.55
  3. Opening en Kennismaking Even voorstellen: • Waar werk je? •

    Wat is je functie? • Wat hoop je te leren?
  4. Inhoud Inleiding Definitie hergebruiken van data Waarom en wanneer Waar

    zoek ik Data repositories Andere databronnen Zoeken en documenteren Documentatie Selectie Beoordelen van datasets FAIR principes Kwaliteit van data
  5. Definitie • Datasets van eerder (eigen of niet eigen) onderzoek

    • Beleidsonderzoek • Patiëntendossiers • Bedrijfsdata • Overheidsdata • Data van niet academische instituten Hergebruik van data doelt in deze context op het gebruiken van eerder verzamelde data uit onderzoek of andere bronnen voor een lopend onderzoeksproject. Voorbeelden van data die je kunt hergebruiken zijn:
  6. • Geld besparend • Tijd besparend • Duurzaamheid • Overvragen

    doelgroepen • Versnellen van wetenschappelijke ontwikkelingen • Versterken van je eigen dataset door te combineren met bestaande data • Specifieke groepen worden minder ondervraagt • Ethische overweging (wanneer het onderzoek impact heeft op deelnemers, dieren, milieu, etc.) • Stimulatie samenwerking tussen verschillende onderzoekers/disciplines • Mogelijkheid te vergroten tot internationaal & longitudinaal onderzoek Waarom data hergebruiken?
  7. • Om nieuwe onderzoeksvragen te beantwoorden • Om te valideren

    (reproduceerbaarheid) • Om nieuwe datamodellen te bouwen (Data Science) • Om te onderbouwen dat je nieuwe data gaat verzamelen of produceren • Om andere datasets als vergelijkingsmateriaal te gebruiken • Om relevante datasets te citeren • Bij datadocumentatie om andermans methode over te nemen of je te laten inspireren Waarvoor kun je data(documentatie) hergebruiken?
  8. Workflow Op welk moment in de onderzoekscyclus zoek je naar

    de data? Idee/Subsidieaanvraag/ oriëntatiefase: •Noodzaak van verzamelen nieuwe data onderbouwen •Toepasbaarheid van dataset uitleggen •Inspiratie Literatuuronderzoek: om relevante datasets te citeren Analyse: andere datasets als vergelijkingsmateriaal
  9. Wat is je onderzoeks- vraag? Welke soort data(documen tatie) heb

    je nodig (kwalitatieve, kwantitatieve, survey templates etc.)? Welke variabelen heb je nodig (leeftijd, gender, beroep, etc.)? Wat wil je doen met de data? Met welke trefwoorden ga je zoeken? Binnen welke context? • Discipline • Geografie • Tijdsperiode in dataset • Tijdsperiode datacollectie • Doelgroep • Metadatasta ndaard • Open Access (licentie) Bepalen van je zoekstrategie in stappen
  10. Waar zoek ik: een overzicht Datarepository van je instituut Generieke

    zoekmachines Vakspecifieke zoekmachines Nederlandse data repositories Internationale data repositories Andere databanken Datatijdschriften Wetenschappelijke literatuur Netwerk
  11. Selecteren van data repositories Re3data : filtermogelijkheden, data repositories karakteristieken

    OAD data repositories: alfabetisch overzicht per vakgebied FAIRsharing.org: filtermogelijkheden, beleid en standarden
  12. Afbeeldingen: Pampel H, Vierkant P, Scholze F, Bertelmann R, Kindling

    M, et al. (2013) Making Research Data Repositories Visible: The re3data.org Registry. PLoS ONE 8(11): e78080. doi:10.1371/journal.pone.0078080
  13. Voorbeelden van datarepositories • Dans Data Stations • Dataverse.nl •

    4TU.Research Data Nederlandse data repositories • Dryad • OSF • Zenodo Internationale data repositories
  14. Andere bronnen: voorbeelden Overheidsdata Overheid.nl CBS Open data (StatLine) RIVM

    Open data platforms Kaggle Hugging World Bank Group OECD
  15. Datatijdschriften & literatuuronderzoek Een peer review artikel waarin een dataverzameling

    wordt besproken in plaats van de onderzoeksresultaten. Data paper Een tijdschrift dat uitzonderlijk of gedeeltelijk datagerichte artikelen publiceert. Dit document beschrijft een dataset die informatie over 135 datatijdschriften verzamelt. Datatijdschrift Data Avaibility Statement Wanneer het openlijk delen van de data niet mogelijk is vanwege ethische of juridische overwegingen, vragen veel journals (wetenschappelijke tijdschriften) om een beschrijving van waar de data vindbaar zijn en onder welke voorwaarden de data toegankelijk zijn. Dit heet vaak een ‘data availability statement’. Journals geven zelf soms al verschillende voorbeelden van dergelijke statements op hun website.
  16.  Geen systematisch review mogelijk  Bij het zoeken van

    data is de rol van filters groter dan trefwoorden  Vergelijkbare strategie mogelijk  Vastleggen zoekstrategie en zoekresultaten is in beide gevallen aanbevolen Data vs. literatuur zoeken
  17. Documenteren zoekproces Je kunt het volgende documenteren tijdens je zoekproces:

    • De gebruikte repository en/of zoekmachine (noteer informatie over bruikbaarheid, functionaliteiten en relevantie van een repository voor je onderzoeksvraag) • Gebruikte zoekwoorden en filters • Aantal gevonden resultaten • Datum • Evaluatie van je zoekproces en eventuele verbeteringen die je hebt aangebracht
  18. Opdracht 1: • Bedenk een onderwerp/thema • Ga naar Re3data

    en selecteer relevante data repositories • Kies één repository en zoek daar naar relevante datasets • Ga naar DANS Data Stations en zoek daar naar relevante datasets • Hoe heb je gezocht? (trefwoorden, filters, etc.) • Onthoud de gevonden datasets voor de volgende opdracht • Wat zijn je ervaringen? Waar ben je tegen aan gelopen? Wat ging goed, wat niet?
  19. Bestande datasets toevoegen aan je eigen dataset Wanneer je een

    bewerkte dataset gaat publiceren, ben je bij de keuze voor een nieuwe licentie afhankelijk van de licentie die op de originele dataset staat. Het volgende schema geeft aan welke keuze je hebt: • Groen: Licentie die je mag toekennen op bewerkte data met een bepaalde oorspronkelijke licentie. • Geel : juridisch gezien mag het maar wordt afgeraden • Grijs: licenties die je niet mag gebruiken Bron: https://creativecommons.org/faq/#when-is-my-use- considered-an-adaptation
  20. Kwaliteit van data Achtergrond van de auteurs Affiliatie van de

    auteurs Kwaliteit van publicaties gebaseerd op de dataset Kwaliteit van datarepository Kwaliteit van metadata, read.me, datadocumentatie Naleven van wetgeving
  21. Documenteren gevonden datasets • Databank/repository/organisatie • Hoe de dataset toegankelijk

    is (open, onder embargo, beperkt, gesloten) • Link naar persistente identificatoren (bijv. DOI) • Datum • Je kunt de datasets toevoegen aan je reference manager (handmatig) Wanneer je datasets hebt gevonden, kun je het volgende documenteren:
  22. FAIRness controleren: F-UJI • https://www.f-uji.net Een webservice waarmee de FAIRness

    van onderzoeksdata-objecten op datasetniveau worden beoordeeld op basis van de FAIRsFAIR Data Object Assessment Metrics
  23. • Datarepositories bieden vaak datacitatie voorbeelden • Citeer de data

    volgens de regels van citatiestijl die je gebruikt in je artikel • Controleer de vereisten van het tijdschrift waarin je gaat publiceren • Meer info: https://www.dcc.ac.uk/guidance/how- guides/cite-datasets Citeren van data
  24. Opdracht 2 Beoordeel een dataset op bruikbaarheid 1. FAIR principes

    2. Kwaliteit van data 3. Zijn de datasets te combineren als je zelf je dataset met een CC BY licentie wilt publiceren? 4. Citeer je dataset