Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20220203-datadrink-MinArm-SNDS

etalab-ia
February 03, 2022
100

 20220203-datadrink-MinArm-SNDS

Rebecca Leygonie, Doctorante en Data Science au Labo BI & Big Data du Ministère des Armées, nous présentera ses travaux sur le Système National des Données de Santé (SNDS) dont l'objectif est de pallier au fléau de la grande dimension en appliquant à ces données des méthodes d'analyse d'images.

etalab-ia

February 03, 2022
Tweet

Transcript

  1. Transposition de données de gestion à grande échelle vers des

    images structurées pour l’application de réseaux de neurones convolutifs Rebecca Leygonie PhD student à l’Université de Paris et Data Scientist au laboratoire BI & Big Data du Ministère des Armées 3 février 2022
  2. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Système National des Données de Santé 2/15 SNDS = plus de 3 000 variables et un flux annuel de : 1.2 milliards de feuilles de soins 11 millions de séjours hospitaliers 500 millions d’actes 450 To de données Rebecca Leygonie Rebecca.leygonie@gmail.com
  3. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Rebecca Leygonie Rebecca.leygonie@gmail.com
  4. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Fléau de la dimension 4/15 Compléxité temporelle des approches classiques : O(m ∗ n2) avec n : nombre d’attributs et m : nombre d’observations. Si m = 67Mio et n = 3 000 ⇒ 6.03e + 14s ≃ 190258 siècles. Rebecca Leygonie Rebecca.leygonie@gmail.com
  5. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Réduction de dimension 5/15 Fig. : Principal Component Analysis Rebecca Leygonie Rebecca.leygonie@gmail.com
  6. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Représenter les données du SNDS sous forme d’images pour y appliquer des modèles de la vision par ordinateur. Exemple : Rebecca Leygonie Rebecca.leygonie@gmail.com
  7. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Rebecca Leygonie Rebecca.leygonie@gmail.com
  8. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Applications 8/15 Détection de pathologies Analyse des facteurs de risque Analyse de phénomènes sociaux Rebecca Leygonie Rebecca.leygonie@gmail.com
  9. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Objectif 9/15 Analyse empirique de l’information résiduelle nécessaire pour la classification d’images Rebecca Leygonie Rebecca.leygonie@gmail.com
  10. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Données de synthèse 10/15 Rebecca Leygonie Rebecca.leygonie@gmail.com
  11. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Ajout de bruit 11/15 Inversement de pixels Rebecca Leygonie Rebecca.leygonie@gmail.com
  12. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Ajout de bruit 12/15 Rebecca Leygonie Rebecca.leygonie@gmail.com
  13. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Résultats 13/15 Rebecca Leygonie Rebecca.leygonie@gmail.com
  14. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Résultats 14/15 Tab. : Comparaison des performances du classifieur et du décodeur en fonction du bruit utilisé durant la génération des QR Codes Bruit Classifieur Décodeur Random distortions 99.5% 63.5% Ruled surface distortions 99.35% 54.3% Foreground/Background selection 99.35% 97.5% Rebecca Leygonie Rebecca.leygonie@gmail.com
  15. Système National des Données de Santé (SNDS) Fléau de la

    dimension Réduction de dimension Objectif Analyse empirique Objectif Données de synthèse Ajout de bruit Résultats Merci pour votre attention ! Rebecca Leygonie Rebecca.leygonie@gmail.com