Upgrade to Pro — share decks privately, control downloads, hide ads and more …

R, vous avez dit R ? — Breizh Data Club Meetup

Colin Fay
January 24, 2018

R, vous avez dit R ? — Breizh Data Club Meetup

Colin Fay

January 24, 2018
Tweet

More Decks by Colin Fay

Other Decks in Technology

Transcript

  1. R ? Vous avez dit R ? Colin FAY -

    ThinkR 2018-01-24 Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 1 / 38
  2. $ whoami Colin FAY Data Analyst, formateur R, Social Media

    Manager chez ThinkR, agence spécialisée en Data Science et en langage R. Cofondateur du Breizh Data Club, et fondateur de Data-Bzh, la première plateforme de data-blogging bretonne. http://thinkr.fr http://breizhdataclub.org http://data-bzh.fr http://twitter.com/_colinfay http://github.com/colinfay Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 2 / 38
  3. Agence d'expert en Data Science et en langage R Formation

    Analyse Développement Consulting ThinkR Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 4 / 38
  4. R, vous avez dit R ? Colin FAY - https://twitter.com/_ColinFay

    — ThinkR - http://thinkr.fr — 5 / 38
  5. Au programme : C'est quoi R ? R, ça sert

    à quoi ? Atelier Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 6 / 38
  6. Un peu d'histoire Aout 1993 : création de R comme

    projet de recherche par Ross Ihaka et Robert Gentleman 1995 : premier release en open source 1997 : première version "officielle", avec 12 packages, et 3 mirroirs du CRAN. Formation du R core group. 2001 : sortie de la version 1.0, première version stable en production 2003 : création de la R Foundation 2004 : sortie de la version 2 2013 : sortie de la version 3 2017 : 10 000 packages sur le CRAN Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 8 / 38
  7. Langage de programmation, lingua franca de la Data Science Open

    Source Gratuit Multiplateforme Modulable C'est quoi R ? Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 9 / 38
  8. Une grande communauté d'utilisateurs et de développeurs R est plébiscité

    par 3 millions d'utilisateurs 2 dépôts officiels : le CRAN et Bioconductor Une plateforme de développement ouverte : GitHub Jeudi dernier, il y avait sur le CRAN pas moins de 12 000 packages disponibles Le même jour, une recherche GitHub de language:R renvoit presque 200 000 résultats. Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 10 / 38
  9. Fonctionnalités natives import et export de tables calculs matriciels optimisés

    modélisation statistiques courantes moteur graphique puissant Fonctionnalités additionnelles Les packages (bibliothèques additionnelles) : Apportent de nouvelles fonctionnalités au logiciel Sont créés et maintenus par la communauté Sont téléchargeables sur un dépôt centralisé sécurisé C'est quoi R ? Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 11 / 38
  10. Un système Open Source la R Development Core Team :

    l'équipe de développement de R base la R Foundation : ONG d'intérêt public (Fondation pour le logiciel libre) dont les missions sont de supporter la Core Team le R Consortium : Projet collaboratif de la fondation Linux, fournit support à la R Foundation et à la communauté de développeurs via des bourses (~500 k$ de budget annuel) ROpenSci : Projet communautaire supporté par NumFocus pour la Science Reproductible Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 12 / 38
  11. R, ça sert à quoi ? Colin FAY - https://twitter.com/_ColinFay

    — ThinkR - http://thinkr.fr — 13 / 38
  12. Principales fonctionnalités de R Import et export de données Statistique

    simples à avancées Manipulation de données (filter, join, summarise...) Sortie graphique de qualité Interfaçage simple et rapide avec d'autres langages de programmation Outils pensé pour une utilisation interactive (exploration de données), mais aussi automatisable (sur serveur) Environnement dédié à la reproductibilité Intégration simplifiée avec Git Connexion aux bases de données Application web, rapports automatisés, blogs, livres... Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 16 / 38
  13. Principales fonctionnalités de R Import et export de données via

    http://www.sthda.com Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 17 / 38
  14. Principales fonctionnalités de R Statistique simples à avancées summary(lm(Sepal.Length ~

    Sepal.Width, data = iris)) #> #> Call: #> lm(formula = Sepal.Length ~ Sepal.Width, data = iris) #> #> Residuals: #> Min 1Q Median 3Q Max #> -1.5561 -0.6333 -0.1120 0.5579 2.2226 #> #> Coefficients: #> Estimate Std. Error t value Pr(>|t|) #> (Intercept) 6.5262 0.4789 13.63 <2e-16 *** #> Sepal.Width -0.2234 0.1551 -1.44 0.152 #> --- #> Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 #> #> Residual standard error: 0.8251 on 148 degrees of freedom #> Multiple R-squared: 0.01382, Adjusted R-squared: 0.007159 #> F-statistic: 2.074 on 1 and 148 DF, p-value: 0.1519 Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 18 / 38
  15. Principales fonctionnalités de R Statistique simples à avancées Colin FAY

    - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 19 / 38
  16. Principales fonctionnalités de R Sortie graphique de qualité Colin FAY

    - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 20 / 38
  17. Principales fonctionnalités de R Interfaçage simple et rapide avec d'autres

    langages de programmation Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 21 / 38
  18. Principales fonctionnalités de R Environnement dédié à la reproductibilité Colin

    FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 22 / 38
  19. Principales fonctionnalités de R Intégration simplifiée avec Git Colin FAY

    - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 23 / 38
  20. Principales fonctionnalités de R Connexion aux bases de données Colin

    FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 24 / 38
  21. Principales fonctionnalités de R Application web, rapports automatisés, blogs, livres...

    Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 25 / 38
  22. Facebook Google Twitter Microsoft Uber Airbnb IBM Ford Capgemini Deloitte

    Consulting Gartner KPMG Un usage en entreprise Source : http://www.listendata.com/2016/12/companies-using-r.html Et en France ? EDF, BNP Paribas, SNCF, Sanofi, RTE, Servier, Orange, Axa, INSEE, Ipsos, Banque de France, CNRS... Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 26 / 38
  23. Les slides que vous avez en ce moment sous les

    yeux Beamer ioslide slidy Des présentations Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 33 / 38
  24. [email protected] http://twitter.com/_colinfay http://twitter.com/thinkr_fr https://github.com/ColinFay https://thinkr.fr/ http://colinfay.me/ breizhdataclub.org/ Atelier Rendez-vous sur

    : https://github.com/ThinkR-open/meetup-r Suivez le guide ! Merci ! Colin Fay Colin FAY - https://twitter.com/_ColinFay — ThinkR - http://thinkr.fr — 38 / 38