20201210-datadrink-AFD.pdf

Construction de la première « BDD des Banques Publiques de
Développement » Le Prospecteur ODD 10 Décembre 2020

2 Contexte Les 453 Banques Publiques de Développement (BPD) jouent
un rôle moteur dans la contribution à l’atteinte des Objectifs de Développement Durable (ODD). • Un angle mort de l’architecture financière internationale. • Plusieurs études menées afin de mesurer la contribution des financements de ces banques aux ODD avec des méthodes variées mais peu d’analyse sur le narratif des banques.

3 Objectifs Construire une base de données sur les BPD
afin d’alimenter les chercheurs et le grand public à la fois • sur les données financières : Total des actifs, Capitaux propres, etc. • sur l’alignement des banques de développement sur les ODD dans leur narratif Contraintes • Délais courts: La base doit être présentée au Sommet « Finance in Common » qui se tient en Novembre 2020. • Ressources restreintes => Automatisation au maximum des processus.

4 Méthodologie Analyse des Rapports Annuels • Les BPD publient
chaque année un rapport annuel (RA) présentant leurs activités et leur états financiers. • Récupération de plus de 3000 Rapports Annuels des BPD datant de 1966 à 2020. Construction de 2 algorithmes • Un algorithme basé sur des techniques de NLP pour collecter les éléments financiers présentés dans les RA • Un algorithme de machine learning (XGBoost) pour qualifier l’importance des ODD dans le narratif des BPDs.

5 Méthodologie – Focus sur l’algorithme ODD Le SDG Tracker
du SDG Financing Lab de l’OCDE • Algorithme de Machine Learning (XGBoost) développé par l’OCDE • Premiers travaux concluants • Base d’apprentissage déjà faite  Application du SDG Tracker sur les Rapports Annuels des banques de développements Limites de l’algorithme SDG Tracker • L’algorithme de l’OCDE est construit pour analyser des textes courts alors qu’un RA contient entre plusieurs centaines de pages => Temps de calcul trop long sur de longs textes. • L’algorithme de l’OCDE présente les résultats sous forme de fréquences relatives. Le total des 17 ODD est toujours égal à 100 ce qui lie les ODD les uns aux autres… => Nécessité de modifier et adapter l’algorithme de l’OCDE

6 Optimisation du temps de calcul Optimisation de l’inférence sur
des longs textes • Remplacement de Tika par Xpdf pour la convertion des PDF en texte • Suppression des étapes de pré-traitements non nécessaires • Remplacement de XgBoost par LGBM • Parrallélisation des traitements sur 8 cœurs. • Utilisation de l’approche des fenêtres glissantes de 20 lignes, au lieu d’une analyse phrase par phrase.  Résultats plus robustes • Conservation de la probabilité maximale des fenêtres glissantes pour chaque ODD qui ressort  Résultats directement sous forme de pourcentage exploitables  Indépendant de la taille du document Le Prospecteur ODD, une adaptation du SDG Tracker de l’OCDE Obtention d’un algorithme qui tourne sur 3000 documents (plus de 100 pages chacun) en 30 minutes.

7 Le SDG Tracker versus le Prospecteur ODD • Résultats
obtenus sur le RA 2018 de l’AFD

8 Un site présentant les résultats du prospecteur ODD Des
résultats directement exploitables https://afdshiny.shinyapps.io/developmentbanksdatabase/ Merci à DreamRs pour le développement de cette Data Visualisation en R Shiny !

9 En conclusion 453 banques de développement analysées via 2000
rapports annuels datant de 2008 à 2018 Le site https://afdshiny.shinyapps.io/developmentbanksdatabase présentant • Une vision financière sur les principaux éléments financiers • Une vision ODD pour une analyse par groupe de banques • Une vision banque avec la possibilité de comparer les banques entre elles et identifier leur spécificités • Une possibilité de téléchargement des données mise en open data • Un historique disponible sur 10 ans pour certaines banques • Et plein d’autres surprises !!! Rendez vous en Septembre 2021 pour la publication des millésimes 2019 et 2020 !

Merci afd.fr Bruce Olivaux [email protected] @OlivauxB

20201210-datadrink-AFD.pdf

20201210-datadrink-AFD.pdf

etalab-ia

More Decks by etalab-ia

Featured

Transcript

Construction de la première « BDD des Banques Publiques de

2 Contexte Les 453 Banques Publiques de Développement (BPD) jouent

3 Objectifs Construire une base de données sur les BPD

4 Méthodologie Analyse des Rapports Annuels • Les BPD publient

5 Méthodologie – Focus sur l’algorithme ODD Le SDG Tracker

6 Optimisation du temps de calcul Optimisation de l’inférence sur

7 Le SDG Tracker versus le Prospecteur ODD • Résultats

8 Un site présentant les résultats du prospecteur ODD Des

9 En conclusion 453 banques de développement analysées via 2000

Merci afd.fr Bruce Olivaux [email protected] @OlivauxB