#25 Apprendre le Deep Learning sur la plateforme RAMP par Victor Fomin

#25 Apprendre le Deep Learning sur la plateforme RAMP par Victor Fomin

Si tu as
- envie de faire du deep learning
- envie d'apprendre en compétition et en collaboration
- mais n'as pas de bonne GPU à la maison
Alors, viens découvrir la plateforme RAMP. Dans cette présentation, je voudrais parler de mon expérience de participation au challenge "Classify pollinating insects" sur la plateforme RAMP, outil conçu pour :
- prototypage collaborative
- éducation
- data science process management
- data challenge avec soumission du code

La première partie de la présentation est consacrée à la plateforme. La deuxième partie fait le zoom sur le challenge "Classify pollinating insects".

Bio : Victor Fomin, ingénieur-développeur en traitement d'images, fan de deep learning

6aa4f3c589d3108830b371d0310bc4da?s=128

Toulouse Data Science

December 13, 2017
Tweet

Transcript

  1. 1.

    Apprendre le Deep Learning sur la plateforme RAMP Victor FOMIN

    D E C E M B R E 2 0 1 7 T O U L O U S E D A T A S C I E N C E RAMP
  2. 2.

    02 T O U L O U S E D

    A T A S C I E N C E Victor FOMIN DEEP LEARNING révolutionne l'intelligence artificielle
  3. 3.

    SI TU AS envie de faire du deep learning envie

    d'apprendre en compétition et en collaboration mais n'as pas de bonne GPU à la maison T O U L O U S E D A T A S C I E N C E Victor FOMIN RAMP https://www.ramp.studio/ 03
  4. 5.

    COLLABORATION PROTOTYPAGE EDUCATION COMMUNAUTÉ OPEN-SOURCE INITIATIVE DE PARIS SACLAY -

    CENTER FOR DATASCIENCE 05 RAMP T O U L O U S E D A T A S C I E N C E Victor FOMIN https://medium.com/@balazskegl/the-data-science-ecosystem-678459ba6013 https://www.ramp.studio/
  5. 6.

    06 T O U L O U S E D

    A T A S C I E N C E Victor FOMIN RAMP Data-science thèmes Domaines de données RAMP-workflow RAMP-kits https://github.com/paris-saclay-cds/ramp-workflow https://github.com/ramp-kits/ - Outils - Pipelines - Metriques - CV - Test scripts - Ensemble de problématiques - Expériences - Solutions initiales Voyages Biologie Climat Ecologie Santé Physique des particules CNN Feature engineering Imbalanced data etc Soumission du code
  6. 7.

    07 T O U L O U S E D

    A T A S C I E N C E Victor FOMIN Problèmes & événements Problème: Pollinating insect classification Evénement: JNI challenge collaborative phase Kits
  7. 8.

    08 T O U L O U S E D

    A T A S C I E N C E Victor FOMIN Problème: Pollinating insect classification Evénement: JNI challenge collaborative phase Soumission du code End-to-end pipeline Infrastructure configurable Phase collaborative Limitations de l'infrastructure Limitation du workflow Pas de logs disponibles
  8. 10.

    RAMP POLLINATING INSECT CLASSIFICATION Evénement : 18/09/2017 - 12/11/2017 Phases:

    individuelle, collaborative Infrastructure: g3.4xlarge instance AWS, 50h par participant Frameworks: Keras, TF, PyTorch Données: ~150k d'images d'insects projet SPIPOLL, 403 classes Evaluation: accuracy, f-score, training time Récompences: 2000€, 1000€, 500€ (indiv) | 2500€ (collab) 10 T O U L O U S E D A T A S C I E N C E Victor FOMIN http://www.spipoll.org
  9. 11.

    11 T O U L O U S E D

    A T A S C I E N C E Victor FOMIN RAMP POLLINATING INSECT CLASSIFICATION Données déséquilibrées: Training & Validation: 70k d'images Hidden test: 70k d'images mean 144.791563 std 384.923778 min 4 25% 15.5 50% 42 75% 130 max 4875 n=4 | 259 | L'Azuré du Thym (mâle) n=5 | 345 | Le Cardinal à la tête noire n=4875 | 202 | L'Abeille mellifère