Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AppsClub : Data Science

AppsClub : Data Science

Ouarezzamen Saber

February 19, 2015
Tweet

Other Decks in Science

Transcript

  1. Disques durs bon marché (loi de Kryder)  Big data

     Cloud computing  Outils d’analyse de masse  data scientists  Départements data science  Nouvelle compréhension analytique des données
  2. Exemples de big data: • Facebook • Twitter • Données

    météo • Trafic ferroviaire • …
  3. Comment est ce que je peux devenir un data scientist

    ? • Stastiques • BDD • Algorithmes et machine learning • Calcul distribué et calcul parallèle • Visualisation des données et design
  4. Quels sont les outils à la disposition du data scientist

    ? Languages de programmation • Python • R Autres outils • Hadoop • HIVE • PIG • …
  5. Langage R • Langage et logiciel libre dédié au traitement

    de données et d’analyses statistiques. • Riche en extension notamment d’interfaçage avec des BDD ou d’exportation de résultats.
  6. Hadoop • Framework Java libre • Dédié aux applications distribuées

    (MapReduce) et échelonnables (BigData) • Généralement l’outil incontournale de tout data scientist
  7. • HBase: SGBD pour BDD distribuées d’Hadoop • HIVE: Logiciel

    d’analyse de données qui permet d’utiliser Hadoop avec une syntaxe proche d’SQL (développé par facebook) • PIG: Comparable à HIVE mais utilisant le langage Pig Latin (développé par Yahoo!)
  8. Bibliographie • Data Science: An introduction http://en.wikibooks.org/wiki/Data_Science:_An_Introduction • Coursera -

    Data Science specialization https://www.coursera.org/specialization/jhudatascience/1 • A very short history of data sciencehttp://whatsthebigdata.com/2012/04/26/a-very- short-history-of-data-science/ • Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics http://cm.bell- labs.com/cm/ms/departments/sia/doc/datascience.pdf • OpenClassrooms - Python http://openclassrooms.com/courses/apprenez-a-programmer-en- python • R programming http://en.wikibooks.org/wiki/R_Programming