Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Rond

Marketing OGZ
July 01, 2022
330

 Rond

Marketing OGZ

July 01, 2022
Tweet

Transcript

  1. Grip op data in de ongestructureerde wereld van wetenschappelijk publiceren

    Inzet van een datahub door het UKB consortium Arjan Schalken, programma manager UKB [email protected] - @arjanschalken - linkedin.com/in/arjanschalken/
  2. Over het UKB consortium (1) • Door: Nederlandse universiteitsbibliotheken en

    SURF coöperatie • Voor: alle universiteiten en universitair medische centra (UMC’s) • Historische focus: kopen van toegang tot wetenschappelijke publicaties. Systemen gericht op zoeken, vinden, ontsluiten.
  3. Over het UKB consortium (2) • Sinds 2015 verschuiving naar

    betalen voor publiceren (Open Access): ook toegang nodig tot processen en data in interne uitgevers systemen (goedkeuring, financiën, contract gerelateerde informatie). • Omvat: ruim 30 miljoen euro per jaar aan centrale uitgeverscontracten inclusief >15.000 open access publicaties. Verwachting dat consortium landelijk wordt opgeschaald (meer contracten, meer deelnemers). • In 2021: >50% publicaties universiteiten en UMC’s vrij beschikbaar (open access) via consortium contracten. Nederland wereldwijd koploper in realisatie open access toegang tot eigen publicaties.
  4. Open Science / Open Access strategie Consortium (lees &) publiceer

    deals Portfolio management Onderhandeling Contract management • Publiceer trends • Dekkingsgraad consortium deals • Kostenontwikkeling • Benchmarking Portfolio management • Publiceer trends • Tijdschrift karakteristieken • Kosten binnen en buiten lopend contract • Quality of service huidig contract Onderhandelingen • % artikelen open access / achter betaalmuur • Compliant aan eisen financier • Procesverbetering • Over- en onderbesteding binnen het contract Contract management Belang van data voor het consortium
  5. Belang datahub voor het consortium Beperkt overzicht Leunend op kennis

    individuen Decentraal georganiseerd Beperkt inzicht Ad-hoc rapportages Beperkt aantal losse bronnen Beperkt toezicht Datakwaliteit Status benutting contract Meer overzicht Bundeling schaarse expertise Centraal georganiseerd Meer inzicht Continue geactualiseerde rapportages Groot aantal gecombineerde bronnen Meer toezicht Controle Datakwaliteit Sturing op voortgang contract
  6. Databronnen /velden Artikel ID (DOI) en per artikel: Tijdschrift ID

    (ISSN) Tijdschrift title Auteur Instelling (geen PID) Datum goedkeuring OA Licentie Financier (indien van toepassing) Publicatiekosten (‘list price’) Etc. Artikel ID (DOI) Uitgeversrapportage bijv. Springer Nature Registratiesysteem bijv. Universiteit Utrecht Research database, bijv. Scopus (commercial) Object ID database bijv. Crossref (open) Journal Titel ISSN Uitgever Contract Business- model Etc.
  7. dfdcts dfdcts Institutions dfdcts dfdcts Contracts Publishers Journals Data model

    API Dashboard dfdcts dfdcts Publications Losse uitgevers rapportages Gecombineerde rapportage Prepare Extract Transform Load SCOPUS NARCIS Consortia Manager DOAJ SURF Journal Catalogue Datamodel van de UKB datahub Registratie systemen universiteiten Versimpelde weergave Unpaywall Crossref issn.org
  8. Dashboard uitgever 1 Dashboard uitgever 2 Email uitgever 3 Dashboard

    6 Email uitgever 5 Dashboard 9 Losse uitgevers rapportages Handmatige download Gecombineerde rapportage
  9. Uitgevers rapportages Scopus(wereldwijd, publicatie metadata) Narcis(nationaal, publicatie registratie) Uitdaging: 1+1+1=

    4 in plaats van <1 Unpaywall, Crossref, ISSN org • Format rapportage verschilt per uitgever en bij uitgever soms per jaar • Incomplete data • Ongewenste data (privacy) • Via email en dashboards • Workflow data niet altijd definitieve publicatie data • Veel journals van veel uitgevers maar niet compleet • Moeite met correcte info over affiliatie van auteurs en publicatie datum • Architectuur API niet ontwikkeld voor gericht downloads specifieke metadata sets • Afhankelijk van kwaliteit en configuratie instellingssystemen • Voor consortium belangrijke metadata over rol (corresponding author) ontbreekt
  10. Uitdaging: business rules • Wanneer toon je een publicatie in

    het dashboard? Kwaliteitscriteria verschilt per bron en status van een artikel. • Wat te doen als metadata uit meerdere bronnen elkaar tegenspreekt? En wanneer maak je 1 bron leidend? • Welke bronnen en welke metadata (inclusief verklaarbare conflicten) toon je in welk dashboard?
  11. Uitdaging: wat te doen met fouten • Wanneer toch maar

    bron data repareren, met kans dat het maand later weer wordt overschreven? • Wanneer verbeteracties starten richting de beheerder van de externe bron? • Wanneer en hoe leren werken met deels incorrecte data? • Voor welke use case is 80% / 90% correctheid genoeg? Wanneer 100% nodig? • Wat zijn de mogelijkheden voor een handmatige check en aanpassing? • Wanneer is de datahub niet geschikt?
  12. Datahub: dashboard publicatie details Voorbeeld filter • Alle consortium instellingen

    Artikelen uit 2018 t/m 2021 • Die bij 1 consortium uitgever binnen en buiten een deal zijn gepubliceerd Doel: input onderhandelingen contractverlening Voorbeeld filter: • 1 / meerdere / alle instellingen • Artikelen uit 2021 • Gepubliceerd buiten een consortium deal • Waarvoor (waarschijnlijk) open access publicatiekosten zijn betaald Doel: prioriteren van uitgevers zonder consortium deal voor onderhandelingen over open access publiceren Voorbeeld filter • Alle universiteiten • Artikelen uit 2022 die onder een consortium deal vallen • Met funder eisen (NWO, ZonMW, EU) • Die niet compliant met fundereisen zijn gepubliceerd Doel: risico management, starten reparatie acties / procesverbetering
  13. Datahub: Gemiste Open Access service Missed OA: heatmap P U

    B B L I S H E R S INSTITUTIONS Gemiste open access publicatie mogelijkheid Artikel ID in tijdschrift van consortium deal • Corresponding auteur werkt bij Universiteit die meedoet aan consortium deal • Artikel ID zit niet in rapportage van uitgever Aanvullende handmatige check nodig • Corresponding auteur werkt bij meerdere universiteiten • Meerdere corresponding auteurs • Datum: online artikel versus online journal
  14. Corr author: Primaire affiliatie is consortium Consortium genoemd als 1

    vd affiliaties Reparatieverzoek ja Nee ja Consortium gebruikt als mail adres Geen reparatieverzoek ja Nee Artikel online in lopend jaar ja Nee Gemiste open access service: tevens handmatige check via instellingen Pilot Q1 met 1 grote uitgever: • 65% van datahub lijst wordt reparatieverzoek • 85% verzoeken door uitgever gehonoreerd Nee Datahub lijst DOI’s potentieel gemiste open access service
  15. Huidige meerwaarde: voorbeelden • Optimalisatie van contract benutting en kwaliteit

    dienstverlening: • Gemiste open access, reparatie acties • Artikelen die volgens uitgever open staan maar in werkelijkheid achter betaalmuur: herstelacties • Anticiperen op quotum status: waarschuwen instellingen bij overproductie, check workflow kwaliteit uitgever bij onverwachte onderproductie (oude publicaties, verkeerde publicatie typen meegeteld, etc.) • Eigen dataset als startpunt bij onderhandelingen, review op dataset die uitgever aanlevert voor onderhandelingen • Feedback loop: UKBsis datahub toont publicaties die instellingen missen in hun eigen registratiesysteem.
  16. dfdcts dfdcts Institutions dfdcts dfdcts Contracts Publishers Journals Data model

    API Dashboard dfdcts dfdcts Publications Losse uitgevers rapportages Gecombineerde rapportage Prepare Extract Transform Load SCOPUS NARCIS Consortia Manager DOAJ SURF Journal Catalogue In ontwikkeling: publicatiekosten (APC) Registratie systemen universiteiten APC APC APC APC APC APC
  17. Dashboard 6 Email uitgever 5 Dashboard 9 Losse uitgevers rapportages

    Handmatige download Gecombineerde rapportage In ontwikkeling: uitgevers data via centraal loket Dashboard uitgever 1 Dashboard uitgever 2 Email uitgever 3 + ROR ID instellingen
  18. Grip op data in de ongestructureerde wereld van wetenschappelijk publiceren

    Inzet van een datahub door het UKB consortium Arjan Schalken, programma manager UKB [email protected] - @arjanschalken - linkedin.com/in/arjanschalken/