Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20200311_datadrink_arkhn.pdf

8eada3aa8251117a617e101bb2881366?s=47 etalab-ia
March 11, 2020
42

 20200311_datadrink_arkhn.pdf

8eada3aa8251117a617e101bb2881366?s=128

etalab-ia

March 11, 2020
Tweet

Transcript

  1. ARKHN Datadrink #5 STANDARDISATION DES DONNÉES DE SANTÉ Corneliu MALCIU

  2. Où trouver la donnée de santé ?

  3. ✗ Difficultés d’accès aux données → Dans les bases de

    données de santé ! format propriétaire ✗
  4. ✗ Difficultés d’accès aux données 20+ logiciels format propriétaire →

    Dans les bases de données de santé ! ✗ Coûts de maintenance et de connexion élevés (~10K€ / connecteur ) ✗ Données de mauvaise qualité ✗ ✗ ✗ ✗ ✗ ✗
  5. 30 000 décès³ Causés chaque année par une mauvaise communication

    au sein des établissements Les conséquences 30k€ par logiciel¹ Dépensé lors de chaque déploiement pour accéder aux données. La moitié des projets ne dépassent pas le stade de POC 80% temps² Passé à nettoyer et à standardiser les données pour chaque projet ¹ French Ministry of Social Affairs and Health, Atlas des systèmes d’information hospitaliers (2018) ² Figure Eight, 2016 Data science report (2016) ³ French Ministry of Social Affairs and Health, B. Bégaud et D. Costagliola, Rapport sur la surveillance et la promotion du bon usage du médicament en France (2013)
  6. ARKHN : Standardisation des données de santé ✔ Intégration, standardisation

    et nettoyage des données de santé
  7. ✔ Accès direct au système informatique via une API sécurisée

    au standard ✔ Intégration, standardisation et nettoyage des données de santé ARKHN : Standardisation des données de santé
  8. ✔ Accès direct au système informatique via une API sécurisée

    au standard ✔ Intégration, standardisation et nettoyage des données de santé ✔ Accès au réseau pour les réutilisateurs de données et les établissements de santé ARKHN : Standardisation des données de santé
  9. En pratique : Cartographie et intégration de bases de données

  10. Cartographie d’une base inconnue ~ 10K tables ~ 100k columns

  11. ~ 10K tables ~ 100k columns Cartographie d’une base inconnue

  12. M → male F → female * → unknown SUBJECT_ID

    GENDER ... ... 106 F 107 M 108 F ... ... Nettoyage des données
  13. Et après ?

  14. L’interopérabilité pour tout l’écosystème ✔ Projets multi-centres ✔ Connexion Plug

    & Play ✔ IA & Federated Learning
  15. ARKHN Datadrink #5 corneliu@arkhn.com github.com/arkhn