gros volume de données Construire un outil qui permet d’extraire à partir des sources transformées, des indicateurs scientifiques. Sélectionner l’ensemble des sources de données intéressantes et à considérer pour le projet. Exploitez cette outil d’enrichissement dans le cadre d’un projet d’analyse du financement des projets Chronologie
Tag lemma Word Embd. container MElt container Fast Text data pretrain models ! /" " ! MElt : Preprocessing for French content FastText : Library for word representations spaCy : Python library for text processing ETL Airflow dataESR
sources, chaque source est lié à un ou plusieurs champs disciplinaires. On se retrouve donc avec plein de nomenclatures qui ne communique pas avec les autres. scanR est un outil pour aider à trouver les structures, il faut donc rationaliser l’ensemble des données agrégés de manière à faciliter la recherche. D’où l’idée de proposer une meta-nomenclature Ex sur la radicalisation avant les attentats.