Slide 1

Slide 1 text

Big Data & Open Source Stefane Fermigier, Printemps du Libre 2012 Thursday, June 21, 2012

Slide 2

Slide 2 text

Caractéristiques • Volume • Vitesse • Variété • Variabilité Thursday, June 21, 2012

Slide 3

Slide 3 text

Facteurs économiques Source: Michael Driscoll Thursday, June 21, 2012

Slide 4

Slide 4 text

Scalabilité: horizontale vs. verticale Thursday, June 21, 2012

Slide 5

Slide 5 text

La stack Big Data Stockage (NoSQL, NewSQL) Traitement (MapReduce, etc.) Indexation Collecte & injections Infra & sys. management Thursday, June 21, 2012

Slide 6

Slide 6 text

Source: Michael Driscoll Thursday, June 21, 2012

Slide 7

Slide 7 text

Pourquoi le big data open source ? Thursday, June 21, 2012

Slide 8

Slide 8 text

Thursday, June 21, 2012

Slide 9

Slide 9 text

Pourquoi le big data open source ? • Expertise en scalabilité horizontale (Beowulf, Google, etc.) • Majors de l’internet (Google, Yahoo!, Facebook, Twitter) imprégnés de culture open source • Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation Thursday, June 21, 2012

Slide 10

Slide 10 text

Quelque projets significatifs et leurs créateurs • Google (MapReduce et BigTable) • Amazon (Dynamo, S3) • Yahoo! (Hadoop, S4) • Facebook (Cassandra, Hive) • Twitter (Storm, FlockDB) • LinkedIn (Kafka, SenseiDB, Voldemort) • LiveJournal (Memcached), Thursday, June 21, 2012

Slide 11

Slide 11 text

Plus d’infos Livre blanc disponible sur www.fermigier.com Thursday, June 21, 2012

Slide 12

Slide 12 text

Questions? • Qui fait du big data dans la salle ? • Pour faire quoi ? • Quels sont vos projets dans le domaine ? Thursday, June 21, 2012

Slide 13

Slide 13 text

Merci! Thursday, June 21, 2012