Slide 13
Slide 13 text
Concrètement, quel plan de travail pour le projet ?
Publication Downloader
(WP 3)
- télécharge, stocke les
publications brutes (pdfs)
- Sources : BSO1, abonnements
GROBID / SOFTCITE (WP 4)
- extrait les métadonnées à partir des
pdf
- détecte les références aux données
de recherche et code logiciel
Annotation tooling (WP 2)
- estimation de la précision et du rappel
des différents algorithmes de détection
- constitution de bases d’apprentissages
pour WP3 et WP4
Publication Analyzer
(WP3)
- transforme les outputs
GROBID
- enrichit les méta-données
(affiliation et disciplines
scientifiques)
- calcule KPI d’analyse
Scientific tagger (BSO 2)
API d’inférence de disciplines
scientifiques à partir de méta -
données (NLP / ML)
Affiliation matcher (BSO 2)
API d’alignement d’affiliation sur
plusieurs référentiels nationaux et
internationaux
Repository harvesters
(WP3)
- moissonne des répertoires de
données / code logiciel
- spécificités d’implémentation
pour chaque répertoire
Repository Analyzer
(WP3)
- transforme les outputs
du harvester
- enrichit les méta-données
(affiliation et disciplines
scientifiques)
- calcule KPI d’analyse
Reconciliation (WP3)
- agrège et réconcilie les
KPIs liés aux publications
et aux entrepôts
- expose une API ouverte
pour le front
Web User Interface
(WP5)