Le métier de data scientist comporte bien des facettes, mais repose avant tout sur une bonne appréhension des données. Qu’elles soient brutes ou déjà raffinées, simples ou complexes, ``small’’ ou ``big’’ (ou ``smart’’) , la compréhension de ces ``data’’ passe par une phase d’exploration visuelle. Construire les bons outils de visualisation est alors une étape importante pour deviner les premières caractéristiques de ces données, tester les premières relations, esquisser les premiers patterns, ... Ne pas tromper – ne pas tromper soi-même –, nécessite d’avoir de bons réflexes et de bonnes méthodes afin de voir – peut-être – « ce que l’on ne s’attendait pas à voir » pour reprendre la célèbre phrase de Tuckey. Représenter ou « donner à voir aux autres », est ensuite, un autre challenge, nécessitant d’autres outils, d’autres méthodes, et posant de nouvelles questions que nous aborderons sur la base d’exemples et de contre-exemples patiemment glanés lors de cours, conférences et dans la jungle des publications (web, journaux, TV, pubs…) qui nous assaille quotidiennement.
Christophe Bontemps, ingénieur de recherche (économétrie) à Toulouse School of Economics (INRA), nous propose un tour d'horizon pratique des méthodes et des graphiques qui permettent de visualiser efficacement différents types de données. Il faudra pour cela suivre quelques règles, puisées dans la littérature (statistique, graphisme, psychologie)… pour mieux s'en affranchir, parfois !