Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Données et intelligence d'affaires | Les Affair...

Roger Kamena
October 03, 2017

Données et intelligence d'affaires | Les Affaires | 3 octobre 2017

Atelier portant sur l'application de la science des données aux sciences de la décision à l'aide des infrastructures de mégadonnées (big data).

Roger Kamena

October 03, 2017
Tweet

More Decks by Roger Kamena

Other Decks in Business

Transcript

  1. LA SCIENCE DE LA DÉCISION DANS UN CONTEXTE DE BIG

    DATA DONNÉES ET INTELLIGENCE MARKETING | LES AFFAIRES
  2. AGENDA DÉROULEMENT DE L’ATELIER La Mégadonnée et la modélisation 20’

    2 4 Science des données et modèles de décision 20’ Le modèle de maturité DMM 20’ 3 2
  3. “In God we trust. Everyone else bring DATA ” W.

    Edwards Deming (Pioneer Data Scientist) 4
  4. COMPLEXITÉ DE L’ENVIRONNEMENT MARKETING 6 LA DONNÉE MARKETING EST TRÈS

    DIVERSIFIÉE ET COMPLEXE À GERER En 2018, un expert marketing doit interagir avec un très grand nombre de technologies et de sources de données. Elle doit prendre des décisions basées sur des millions, voire des milliards d’interactions consommateurs captées et mesurées numériquement en fonction des métriques de performance de son entreprise. Comment s’y retrouver?
  5. LE BESOIN DE MODÉLISER UN IDENTIFIANT UNIVERSEL 7 COMPRENDRE LE

    CONSOMMATEUR AU-DELÀ DU COURRIEL ET DU FURETEUR WEB
  6. PRINCIPES FONDAMENTAUX DE LA MODÉLISATION 9 LA MESURE VS LA

    DIMENSIONNALITÉ DES DONNÉES CUBE DE DONNÉES MÉTRIQUES D’AFFAIRES DIMENSIONS D’AFFAIRES ATTRIBUTS HIÉRARCHIE NIVEAUX
  7. QU’EST-CE QU’UN LAC DE DONNÉES ? 12 UN SUJET DE

    DÉBAT FRÉQUENT Définition du ‘Lac de données’ “Un lac de données est un dépôt de stockage qui détient une grande quantité de données brutes dans son format natif, y compris des données structurées, semi-structurées et non structurées. La structure et les exigences des données ne sont pas définies jusqu'à ce que les données soient nécessaires.” James Dixon, le fondateur et CTO de Pentaho
  8. DIFFÉRENCE ENTRE UN LAC ET UN ENTREPÔT ? 13 COMPRENDRE

    LES ENVIRONNEMENTS DE DONNÉES ET LEUR RÔLE
  9. PROCESSUS DE TRAITEMENT DE DONNÉES 14 STRUCTURE D’UN LAC DE

    DONNÉES SOUS-INSTANCE QUEBECOR SOUS-INSTANCE QUEBECOR STORAGE PROCESSING EXPLORING ACTING Data Integration INGESTION LES CINQ GRANDES ÉTAPES DE TRAITEMENT Data Unification Data Transformation Data Mining Data Insights
  10. ÉTAPES DE DÉPLOIEMENT DE L’INFRASTRUCTURE 15 GESTION DE PROJET D’ARCHITECTURE

    DE DONNÉES Step 1 Define Step 2 Design Step 3 Build Step 4 Train Step 5 Deploy Analyser les besoins Schématiser les rapports Créer les rapports Former les spécialistes
  11. “The important and difficult job is NEVER to find the

    right answer; it is to find the right QUESTION.” Peter Drucker 17
  12. Donnée pertinente pour les rapports quotidien et le suivi sur

    l’état des lieu de l’organisation. Exécution par : Analyste de données junior LES 3 GRANDS TYPES DE CONNAISSANCE SAVOIR CE QUE L’ON NE SAIT PAS Donnée pertinente pour l’analyse des causes de la performance afin de trouver des réponses à des questions connues. Exécution par : Analyste de données sénior NE PAS SAVOIR CE QUE L’ON NE SAIT PAS Donnée pertinente pour l’exploration des zones inconnues pour découvrir des opportunités et des menaces cachées. Méthodes de machine learning. Exécution par : Scientifique de données SAVOIR CE QUE L’ON SAIT SAVOIR EXPLORER POUR MIEUX DÉCIDER 18 Analytique de Description Analytique de Diagnostique Analytique de Prédiction et de Prescription
  13. MODÉLISER LA PRISE DE DÉCISION 19 ORGANISER LA DONNÉE POUR

    PRENDRE ACTION Analyze media presence Analyze in-market media traffic Analyze engaged media traffic Analyze active shopping media traffic Remove media placements with low online visits, brand awareness lift, video completions or ad viewability Remove media placements with low cart-to-detail rates or purchase intent Remove media placements with low brand equity lift or social interaction Remove media placements with low buy-to-detail rates or purchase behavior CONVERT Downstream Optimization Discover Consider Convince Cause Effect
  14. LA MÉTHODE RCA (ROOT CAUSE ANALYSIS) 20 UNE SCIENCE DÉCISIONNELLE

    DE L’ANALYSE CAUSALE Le type d’analyse adapté à ce modèle est nommé ‘RCA’, Root Cause Analysis. Il s’agit d’une méthode de résolution de problème utilisée dans plusieurs industries et dans plusieurs contextes au-delà du média (finance, ingénierie de systèmes, agriculture, logistique, médecine, etc.) Pour bien fonctionner, un modèle RCA a besoin d’un ensemble de dimensions qui elles peuvent être réduites à des sous-éléments. Le diagramme de Cause à Effet d’Ishikawa ou le diagramme Fishbone est souvent la forme que prendra ce type d’analyse.,
  15. CASCADE D’OPTIMISATION 21 PROCESSUS D’ANALYSE PAR DIMENSION Goals Channel Network

    Tactic Segment Creative Am I pacing? Why? Which Channel? Why? Which Network? Why? Which Tactic? Why? Which Segment? Why? Which Creative? Why?
  16. KPI MAPPING FOR ROOT CAUSE ANALYSIS 22 ROOT CAUSE ANALYSIS

    | RETAIL ACCOUNT OPTIMIZATION EXAMPLE Revenue Top Metric Essential KPIs Intermediate Indicators Foundational Metrics Key Drivers Our campaign managers have a structured optimization approach to identify key drivers of performance. This method is called Root Cause Analysis (RCA). Spend CPA Conversions RPC Conv. Rate Clicks Impressions CTR Avg Pos. Impr. Share Negative KW QS KW Set Bid / Max CPC Ad Copy # Competitors Competitor Ad Comp. Bid Bid Market Bid Mktg Activity Seasonality Offer Interest ROI Query Vol.
  17. 4 RÈGLES DE LA PRISE DE DÉCISION À RETENIR... Prendre

    le temps de déterminer quel graphique pourra le mieux assister la décision marketing. 1 2 3 Ne garder que les métriques et les dimensions nécessaires au diagnostic. Mettre le pacing de vos objectifs au coeur du tableau de bord. Ne faites jamais rien sans un objectifs et une cible marketing bien définis. 4
  18. LA MATRICE DMMSM 29 DATA MATURITY MODEL DATA MANAGEMENT STRATEGY

    DATA GOVERNANCE DATA QUALITY PLATFORM & ARCHITECTUR E DATA OPERATIONS Metadata Oversight Business / IT Alignment Im plem entation O versight Stakeholder Alignment Quality Needs Quality Solutions Direction & Compliance Data Infrastructure Infrastructure Oversight Business Process & Data Requirements Q uality Needs Q uality Strategy Qu’est-ce que le DMMSM Les domaines de processus sont consolidés dans cinq catégories: • Stratégie • Gouvernance • Qualité • Opérations • Plates-formes et architecture Bien que chaque processus puisse être considéré séparément, la collecte de pratiques dans ce modèle sert de guide pour la conception d'une feuille de route de gestion de données.
  19. LES 5 ÉTAPES DE MATURITÉ DU MODÈLE DMM 30 CONNAÎTRE

    SON CYCLE Niveau 1 Performer Niveau 2 Gérer Niveau 3 Définir Niveau 4 Mesurer Niveau 5 Optimiser Les données sont gérées comme une exigence pour la mise en œuvre des projets. Il est conscient de l'importance de la gestion des données en tant qu'actif d'infrastructure critique. Les données sont traitées au niveau de l'organisation comme étant essentielles pour une performance réussie de la mission. Les données sont traitées comme une source d'avantage concurrentiel. Les données sont considérées comme essentielles pour la survie dans un marché dynamique et concurrentiel.
  20. NIVEAU 1 - PERFORMER DES OPÉRATIONS 31 L’IMMATURITÉ DANS LA

    GESTION DE DONNÉES Description: Les processus sont effectués ad hoc, principalement au niveau du projet. Les processus ne sont généralement pas appliqués dans les secteurs d'activité. La discipline du processus est principalement réactive; par exemple, les processus de qualité des données mettent l'accent sur la réparation plutôt que de la prévention. Des améliorations fondamentales peuvent exister, mais les améliorations ne sont pas encore étendues au sein de l'organisation ou maintenues.
  21. NIVEAU 2 - GÉRER LES PROCESSUS DE DONNÉE 32 APPROCHE

    PROCÉDURALE Description: Les processus sont planifiés et exécutés conformément à la politique; emploient des personnes qualifiées ayant des ressources suffisantes pour produire des résultats contrôlés; impliquer les acteurs concernés; sont surveillés et contrôlés et évalués pour l'adhésion au processus défini. Les processus sont planifiés et exécutés conformément à la politique; emploient des personnes qualifiées ayant des ressources suffisantes pour produire des résultats contrôlés; impliquer les acteurs concernés; sont surveillés et contrôlés et évalués pour l'adhésion au processus défini.
  22. NIVEAU 3 - GÉRER LES PROCESSUS DE DONNÉE 33 APPROCHE

    PROCÉDURALE Description: Un ensemble de processus standard est utilisé et suivi de façon constante. Les processus pour répondre à des besoins spécifiques sont adaptés à l'ensemble des processus standard selon les directives de l'organisation.
  23. NIVEAU 4 - MESURER LA DONNÉE 34 APPROCHE QUANTITATIVE Description:

    Des métriques de processus ont été définies et sont utilisées pour la gestion des données. Il s'agit notamment de la gestion de la variance, de la prévision et de l'analyse à l'aide de techniques statistiques et autres techniques quantitatives. La performance des processus est gérée tout au long de la durée du processus.
  24. NIVEAU 5 - OPTIMISER AVEC LA DONNÉE 35 APPROCHE QUANTITATIVE

    Description: La performance des processus est optimisée grâce à l'application de l'analyse de niveau 4 pour l'identification des opportunités d'amélioration. Les meilleures pratiques sont partagées avec les pairs et l'industrie.