Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20220203-datadrink-MinArm-SNDS

etalab-ia
February 03, 2022
79

 20220203-datadrink-MinArm-SNDS

Rebecca Leygonie, Doctorante en Data Science au Labo BI & Big Data du Ministère des Armées, nous présentera ses travaux sur le Système National des Données de Santé (SNDS) dont l'objectif est de pallier au fléau de la grande dimension en appliquant à ces données des méthodes d'analyse d'images.

etalab-ia

February 03, 2022
Tweet

Transcript

  1. Transposition de données de gestion à grande échelle vers des

    images structurées pour l’application de réseaux de neurones convolutifs Rebecca Leygonie PhD student à l’Université de Paris et Data Scientist au laboratoire BI & Big Data du Ministère des Armées 3 février 2022
  2. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Système National des Données de Santé 2/15 SNDS = plus de 3 000 variables et un flux annuel de : 1.2 milliards de feuilles de soins 11 millions de séjours hospitaliers 500 millions d’actes 450 To de données Rebecca Leygonie [email protected]
  3. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Rebecca Leygonie [email protected]
  4. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Fléau de la dimension 4/15 Compléxité temporelle des approches classiques : O(m ∗ n2) avec n : nombre d’attributs et m : nombre d’observations. Si m = 67Mio et n = 3 000 ⇒ 6.03e + 14s ≃ 190258 siècles. Rebecca Leygonie [email protected]
  5. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Réduction de dimension 5/15 Fig. : Principal Component Analysis Rebecca Leygonie [email protected]
  6. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Représenter les données du SNDS sous forme d’images pour y appliquer des modèles de la vision par ordinateur. Exemple : Rebecca Leygonie [email protected]
  7. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Rebecca Leygonie [email protected]
  8. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Applications 8/15 Détection de pathologies Analyse des facteurs de risque Analyse de phénomènes sociaux Rebecca Leygonie [email protected]
  9. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Objectif 9/15 Analyse empirique de l’information résiduelle nécessaire pour la classification d’images Rebecca Leygonie [email protected]
  10. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Données de synthèse 10/15 Rebecca Leygonie [email protected]
  11. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Ajout de bruit 11/15 Inversement de pixels Rebecca Leygonie [email protected]
  12. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Ajout de bruit 12/15 Rebecca Leygonie [email protected]
  13. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Résultats 13/15 Rebecca Leygonie [email protected]
  14. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Résultats 14/15 Tab. : Comparaison des performances du classifieur et du décodeur en fonction du bruit utilisé durant la génération des QR Codes Bruit Classifieur Décodeur Random distortions 99.5% 63.5% Ruled surface distortions 99.35% 54.3% Foreground/Background selection 99.35% 97.5% Rebecca Leygonie [email protected]
  15. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Merci pour votre attention ! Rebecca Leygonie [email protected]