Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Science in 2023 - French version

Data Science in 2023 - French version

Paulo Cysne Rios, Jr.

June 05, 2023
Tweet

More Decks by Paulo Cysne Rios, Jr.

Other Decks in Technology

Transcript

  1. La science des données en 2023 • Une introduction aux

    concepts de la science des données, applications et derniers développements • Par Paulo Cysne Rios, Jr. 5 Juin 2023
  2. Qu'est-ce que la science des données ? • La science

    des données est le domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques • pour extraire des connaissances et des idées à partir de données sous diverses formes, à la fois structurées et non structurées. • La science des données combine des compétences en mathématiques, statistiques, informatique, connaissance du domaine et communication pour résoudre des problèmes complexes et créer de la valeur pour les organisations et la société.
  3. Phases d'un projet de science des données • Clarification commerciale

    : à quelle question voulons-nous répondre ? • Nettoyage des données • Exploration de données • Modélisation des données avec l'apprentissage automatique • Évaluation du modèle • Déploiement en production
  4. Qu'est-ce que l'apprentissage automatique ? • L'apprentissage automatique est une

    branche de la science des données qui se concentre sur la création de systèmes capables d'apprendre à partir des données et de faire des prédictions ou des décisions sans être explicitement programmés. • L'apprentissage automatique utilise des algorithmes qui peuvent apprendre des données et s'améliorer au fil du temps.
  5. Principaux domaines d'application La science des données et tels que

    l'apprentissage automatique peuvent être appliqués à divers domaines et industries : Santé : diagnostic, pronostic, recommandation de traitement, découverte de médicaments, etc. Finance : evaluation de risques de crédit, détection de fraude, optimisation de portefeuille, trading algorithmique, etc. Marketing : segmentation de la clientèle, prédiction du taux de désabonnement, systèmes de recommandation, analyse des sentiments, etc. Fabrication : contrôle qualité, maintenance prédictive, optimisation des processus, etc. Éducation : apprentissage adaptatif, prédiction des performances des élèves, détection de plagiat, etc. Et beaucoup plus!
  6. Comment la science des données est transformatrice La science des

    données est transformatrice car elle peut aider les organisations et la société à : Découvrir de nouvelles idées et connaissances à partir de données qui étaient auparavant cachées ou inconnues Prendre de meilleures décisions et actions basées sur des preuves et des prévisions basées sur des données Innover avec de nouveaux produits, services et solutions qui exploitent les données et l'analyse Améliorer l'efficacité, la productivité et la performance des processus et des opérations Créer de la valeur et un avantage concurrentiel pour les organisations et la société
  7. Science des données vs intelligence d'affaires La science des données

    et la Business Intelligence (BI) sont toutes deux liées à l'analyse des données, mais elles présentent quelques différences essentielles : La science des données est plus exploratoire et expérimentale, tandis que la BI est plus descriptive et rapportante La science des données utilise des techniques avancées telles que l'apprentissage automatique, le traitement du langage naturel, la vision par ordinateur, etc., tandis que la BI utilise principalement des techniques traditionnelles telles que les tableaux de bord, etc. La science des données vise à répondre à des questions complexes telles que pourquoi, et si et comment, tandis que la BI vise à répondre à des questions simples telles que quoi, quand et où La science des données se concentre sur la génération d'informations et de prévisions à partir des données, tandis que la BI se concentre sur la fourniture d'informations et de rapports à partir des données.
  8. Avantages de la science des données par rapport à la

    Business Intelligence La science des données peut gérer des données non structurées ou semi-structurées, telles que du texte, des images, de l'audio, de la vidéo, etc., tandis que la BI ne peut gérer que des données structurées, telles que des tableaux ou des feuilles de calcul. La science des données peut découvrir des modèles et des tendances cachés dans les données qui ne sont pas évidentes ou prédéfinies, tandis que la BI ne peut afficher que des métriques et des indicateurs prédéfinis dans les données La science des données peut fournir des recommandations et des solutions exploitables basées sur l'analyse des données, tandis que la BI ne peut fournir que des informations et des rapports basés sur l'analyse des données.
  9. Pourquoi la BI est toujours aussi répandue en Europe Une

    culture prudente ou conservatrice étouffe l'innovation dans certaines entreprises. Ils redoutent le défi d'acquérir de nouvelles compétences. Ils craignent de perdre leur emploi.
  10. La peur et l'aversion au risque sont préjudiciables à une

    entreprise car elles peuvent: • Empêcher l'entreprise de faire des investissements risqués qui pourraient créer de la valeur et un avantage concurrentiel pour les parties prenantes • Limiter la capacité de l'entreprise à explorer de nouvelles opportunités et à découvrir de nouvelles idées et connaissances à partir des données • Réduire l'efficacité, la productivité et les performances de l'entreprise en provoquant des retards, des erreurs ou des inefficacités dans les processus et les opérations • Entraver l'innovation et la créativité de l'entreprise en décourageant l'expérimentation et en apprenant de ses erreurs • Provoquer un retour négatif sur l'entreprise lorsque le statu quo est inacceptable ou menacé, et la seule façon d'éviter la perte est de prendre une option risquée.
  11. Comment l'explanabilité du modèle est transformatrice L'explanabilité du modèle est

    la capacité de comprendre comment un modèle d'apprentissage automatique fonctionne et pourquoi il fait certaines prédictions ou décisions. L'explanabilité du modèle est transformatrice car elle peut aider les utilisateurs à : Faire confiance au modèle et à ses résultats en vérifiant sa logique et son raisonnement Expliquer le modèle et ses résultats aux parties prenantes et aux clients en fournissant des interprétations et des visualisations claires et intuitives Respecter les normes et réglementations éthiques et juridiques en garantissant la transparence et la responsabilité du modèle et de ses résultats
  12. Qu'est-ce que l'inférence causale ? L'inférence causale est une branche

    de la science des données qui se concentre sur la compréhension des relations causales entre les variables ou les événements d'un système. L'inférence causale vise à répondre à des questions telles que • A cause-t-il B ? Par exemple, le tabagisme cause-t-il le cancer du poumon ? • Dans quelle mesure A affecte-t-il B ? Par exemple, dans quelle mesure la publicité affecte-t-elle les ventes ? • Que se passerait-il si A changeait ? Par exemple, que se passerait-il si nous augmentions le prix d'un produit ? • Comment pouvons-nous intervenir pour atteindre un résultat souhaité ? Par exemple, comment réduire la propagation d'une maladie ?