Upgrade to Pro — share decks privately, control downloads, hide ads and more …

datadrink_04062020_signaux_faibles

8eada3aa8251117a617e101bb2881366?s=47 etalab-ia
June 04, 2020
29

 datadrink_04062020_signaux_faibles

8eada3aa8251117a617e101bb2881366?s=128

etalab-ia

June 04, 2020
Tweet

Transcript

  1. Datadrink #7 Jeudi 4 juin 2020 L’impact de la crise

    économique sur la détection d’entreprises fragiles Pierre Camilleri
  2. Le projet Signaux Faibles

  3. Intervenir en amont des difficultés permet de mobiliser davantage d’outils

    de financement ou d'accompagnement
  4. Projet partenarial : - DGE - Banque de France -

    DGEFP - ACOSS - DINSIC
  5. Apprentissage supervisé (xgboost) pour anticiper de 18 mois la défaillance

    d’entreprises
  6. Données mobilisées sur: - le secteur d'activité, l’âge, le nombre

    d'établissements, l’effectif, la localisation, etc. - les cotisations sociales - l'activité partielle - les données financières - les procédures collectives, les CCSF
  7. L’impact de la crise

  8. Les utilisateurs sont submergés !

  9. Les données ont été lourdement impactées par les dispositifs d’aide

    Environnement non stationnaire ! Les données financières répercutent l’état réel 9 mois après la clôture de l’exercice
  10. Notre cheminement de pensées

  11. Modification experte des données d’entrée ? Par exemple, pondérer l’impact

    pour chaque secteur d’activité
  12. Insuffisant Opération du modèle hors de sa zone d’apprentissage Besoin

    d’une expertise pointue (situation inédite)
  13. On voudrait pouvoir entraîner un modèle sur les dernières données

    disponibles !
  14. Notre plan pour redresser la barre

  15. Combinaison de différentes sources pour définir un objectif d’apprentissage L’apprentissage

    faiblement supervisé
  16. - Entreprises accompagnées par les acteurs de terrain - Entreprises

    estimées en difficulté avant la crise - Entreprises estimées non fragiles pendant la crise - Règles expertes : secteurs les plus touchés
  17. - Entreprises accompagnées par les acteurs de terrain - Entreprises

    estimées en difficulté avant la crise - Entreprises estimées non fragiles pendant la crise - Règle expertes : secteurs les plus touchés Génération de labels Apprentissage supervisé sur les dernières données
  18. Avantages - Utilisation des dernières données disponibles - Possibilité d’évolutions

    futures - Réutilisation du modèle existant pour les labels - Utilisation des remontées du terrain
  19. Il n’y a plus qu’à ! Des questions ? Des

    remarques ? pierre.camilleri@banque-france.fr