Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20220203-datadrink-MinArm-SNDS

etalab-ia
February 03, 2022
65

 20220203-datadrink-MinArm-SNDS

Rebecca Leygonie, Doctorante en Data Science au Labo BI & Big Data du Ministère des Armées, nous présentera ses travaux sur le Système National des Données de Santé (SNDS) dont l'objectif est de pallier au fléau de la grande dimension en appliquant à ces données des méthodes d'analyse d'images.

etalab-ia

February 03, 2022
Tweet

Transcript

  1. Transposition de données de gestion à grande échelle vers des
    images structurées pour l’application de réseaux de neurones
    convolutifs
    Rebecca Leygonie
    PhD student à l’Université de Paris
    et Data Scientist au laboratoire BI & Big Data du Ministère des Armées
    3 février 2022

    View Slide

  2. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Système National des Données de Santé 2/15
    SNDS = plus de 3 000 variables et un flux annuel de :
    1.2 milliards de feuilles de soins
    11 millions de séjours hospitaliers
    500 millions d’actes
    450 To de données
    Rebecca Leygonie [email protected]

    View Slide

  3. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Rebecca Leygonie [email protected]

    View Slide

  4. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Fléau de la dimension 4/15
    Compléxité temporelle des approches classiques :
    O(m ∗ n2)
    avec n : nombre d’attributs et m : nombre d’observations.
    Si m = 67Mio et n = 3 000 ⇒ 6.03e + 14s ≃ 190258 siècles.
    Rebecca Leygonie [email protected]

    View Slide

  5. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Réduction de dimension 5/15
    Fig. : Principal Component Analysis
    Rebecca Leygonie [email protected]

    View Slide

  6. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Représenter les données du SNDS sous forme d’images pour y
    appliquer des modèles de la vision par ordinateur.
    Exemple :
    Rebecca Leygonie [email protected]

    View Slide

  7. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Rebecca Leygonie [email protected]

    View Slide

  8. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Applications 8/15
    Détection de pathologies
    Analyse des facteurs de risque
    Analyse de phénomènes sociaux
    Rebecca Leygonie [email protected]

    View Slide

  9. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Objectif 9/15
    Analyse empirique de l’information résiduelle
    nécessaire pour la classification d’images
    Rebecca Leygonie [email protected]

    View Slide

  10. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Données de synthèse 10/15
    Rebecca Leygonie [email protected]

    View Slide

  11. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Ajout de bruit 11/15
    Inversement de pixels
    Rebecca Leygonie [email protected]

    View Slide

  12. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Ajout de bruit 12/15
    Rebecca Leygonie [email protected]

    View Slide

  13. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Résultats 13/15
    Rebecca Leygonie [email protected]

    View Slide

  14. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Résultats 14/15
    Tab. : Comparaison des performances du classifieur et du décodeur
    en fonction du bruit utilisé durant la génération des QR Codes
    Bruit Classifieur Décodeur
    Random distortions 99.5% 63.5%
    Ruled surface distortions 99.35% 54.3%
    Foreground/Background selection 99.35% 97.5%
    Rebecca Leygonie [email protected]

    View Slide

  15. Système National des Données de Santé (SNDS)
    Fléau de la dimension
    Réduction de dimension
    Objectif
    Analyse empirique
    Objectif
    Données de synthèse
    Ajout de bruit
    Résultats
    Merci pour votre attention !
    Rebecca Leygonie [email protected]

    View Slide