Upgrade to Pro — share decks privately, control downloads, hide ads and more …

#25 Apprendre le Deep Learning sur la plateforme RAMP par Victor Fomin

#25 Apprendre le Deep Learning sur la plateforme RAMP par Victor Fomin

Si tu as
- envie de faire du deep learning
- envie d'apprendre en compétition et en collaboration
- mais n'as pas de bonne GPU à la maison
Alors, viens découvrir la plateforme RAMP. Dans cette présentation, je voudrais parler de mon expérience de participation au challenge "Classify pollinating insects" sur la plateforme RAMP, outil conçu pour :
- prototypage collaborative
- éducation
- data science process management
- data challenge avec soumission du code

La première partie de la présentation est consacrée à la plateforme. La deuxième partie fait le zoom sur le challenge "Classify pollinating insects".

Bio : Victor Fomin, ingénieur-développeur en traitement d'images, fan de deep learning

Toulouse Data Science

December 13, 2017
Tweet

More Decks by Toulouse Data Science

Other Decks in Technology

Transcript

  1. Apprendre le Deep Learning
    sur la plateforme
    RAMP
    Victor FOMIN
    D E C E M B R E 2 0 1 7
    T O U L O U S E D A T A S C I E N C E
    RAMP

    View full-size slide

  2. 02
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    DEEP LEARNING révolutionne l'intelligence artificielle

    View full-size slide

  3. SI TU AS
    envie de faire du deep learning
    envie d'apprendre en compétition
    et en collaboration
    mais n'as pas de bonne GPU à la
    maison
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    RAMP
    https://www.ramp.studio/
    03

    View full-size slide

  4. CONTENU
    RAMP
    Pollinating insect
    classification

    View full-size slide

  5. COLLABORATION PROTOTYPAGE
    EDUCATION
    COMMUNAUTÉ OPEN-SOURCE
    INITIATIVE DE PARIS SACLAY - CENTER FOR DATASCIENCE
    05
    RAMP
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    https://medium.com/@balazskegl/the-data-science-ecosystem-678459ba6013
    https://www.ramp.studio/

    View full-size slide

  6. 06
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    RAMP
    Data-science thèmes Domaines de données
    RAMP-workflow RAMP-kits
    https://github.com/paris-saclay-cds/ramp-workflow https://github.com/ramp-kits/
    - Outils
    - Pipelines
    - Metriques
    - CV
    - Test scripts
    - Ensemble de problématiques
    - Expériences
    - Solutions initiales
    Voyages
    Biologie
    Climat
    Ecologie
    Santé
    Physique des particules
    CNN
    Feature engineering
    Imbalanced data
    etc
    Soumission du code

    View full-size slide

  7. 07
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    Problèmes & événements
    Problème: Pollinating insect classification
    Evénement: JNI challenge collaborative phase
    Kits

    View full-size slide

  8. 08
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    Problème: Pollinating insect classification
    Evénement: JNI challenge collaborative phase
    Soumission du code
    End-to-end pipeline
    Infrastructure configurable
    Phase collaborative
    Limitations de l'infrastructure
    Limitation du workflow
    Pas de logs disponibles

    View full-size slide

  9. CONTENU
    RAMP
    Pollinating insect
    classification
    L'Azuré des Nerpruns

    View full-size slide

  10. RAMP POLLINATING INSECT CLASSIFICATION
    Evénement : 18/09/2017 - 12/11/2017
    Phases: individuelle, collaborative
    Infrastructure: g3.4xlarge instance AWS, 50h par participant
    Frameworks: Keras, TF, PyTorch
    Données: ~150k d'images d'insects projet SPIPOLL, 403 classes
    Evaluation: accuracy, f-score, training time
    Récompences: 2000€, 1000€, 500€ (indiv) | 2500€ (collab)
    10
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    http://www.spipoll.org

    View full-size slide

  11. 11
    T O U L O U S E D A T A S C I E N C E Victor FOMIN
    RAMP POLLINATING INSECT CLASSIFICATION
    Données déséquilibrées:
    Training & Validation: 70k d'images
    Hidden test: 70k d'images
    mean 144.791563
    std 384.923778
    min 4 25% 15.5
    50% 42 75% 130
    max 4875
    n=4 | 259 | L'Azuré du Thym (mâle) n=5 | 345 | Le Cardinal à la tête noire
    n=4875 | 202 | L'Abeille mellifère

    View full-size slide

  12. RÉSULTATS:
    Transfer learning, InceptionV4 sur PyTorch
    Prédictions avec TTA
    https://docs.google.com/presentation/d/1V2xQYvH2haFV0KWmOvo5FSTYGcEttBTNrSfxNPvpycY
    12
    T O U L O U S E D A T A S C I E N C E Victor FOMIN

    View full-size slide

  13. Se former sur ML/DL
    Faire des compétitions
    Utiliser comme un sandbox
    RAMP

    View full-size slide