La CI/CD à l'heure du Machine Learning

1 There is a better way OCTO Part of Accenture
© 2023 - All rights reserved CI/CD la construction d’artefacts à l’heure du ML Meetup crafting data science 06/12/2023

3 03 02 01 05 04 There is a better
way OCTO Part of Accenture © 2023 - All rights reserved Introduction Faire un prototype ou un démonstrateur Commencer le développement d’un produit Passer à l’échelle Conclusion

© 2023 - All rights reserved Un nouvel événement peut justiﬁer un déploiement d’un nouvel artefact Pourquoi c’est différent dans un contexte ML ? Changement dans le code Changement dans les données N O UVEAU

© 2023 - All rights reserved Je veux montrer aux équipes marketing que le ML peut les aider. Le cas d’usage : montrer que je peux prédire de l'appétence pour un produit Mes enjeux : Aller vite - Être frugal Mes besoins

© 2023 - All rights reserved Lors de la prédiction, in-memory Quand charger la version du modèle souhaitée ? @app.get("/predict") def predict(X): model = Model() X_train, y_train = get_train_data() model.fit(X_train, y_train) return model.predict(X) Code python effectuant l’entraînement avant l’inférence

© 2023 - All rights reserved Je veux construire un produit de façon itérative. Le cas d’usage : Je veux servir mes premiers modèles à mes utilisateurs. Mes enjeux : Commencer à mesurer la valeur de mon produit - Pouvoir pivoter rapidement en fonction des premiers feedbacks utilisateurs. Mes besoins

© 2023 - All rights reserved Lors du déploiement, avec la nouvelle version du logiciel Quand charger la version du modèle souhaitée ? FROM python:3.11-slim COPY . /source COPY model.joblib /model WORKDIR /source RUN pip install -r requirements.txt CMD streamlit run main.py Dockerﬁle embarquant le modèle et le code dans un même artefact

© 2023 - All rights reserved Je veux passer à l’échelle. Le cas d’usage : servir de nombreux utilisateurs, je veux pouvoir tester et mettre à jour rapidement des modèles. Mes enjeux : Pérenniser la production - agir en cas de drift - continuer à déployer à la demande. Mes besoins

© 2023 - All rights reserved Mais aussi… Où stocker les versions du modèle ? Le même registre d’artefact que pour le logiciel Un registre d’artefact spécialisé en ML … mais tire un ﬂux d’écriture sur le repo autre que la CI … mais il faut avoir plus d’arguments que le registry pour justiﬁer ce choix structurant

© 2023 - All rights reserved Lors de l’inférence, s’il a évolué Quand charger la version du modèle souhaitée ? @app.get("/predict") def predict(X): model_handler = ModelHandler() model = model_handler.load() return model.predict(X) class ModelHandler: def load(self): if self.check_if_model_changed(): self.model_ = self._load() return self.model_ Pseudo-code d’inférence, qui vériﬁe si le modèle a changé à chaque prédiction pour éventuellement le mettre à jour Variante : charger le modèle à chaque nouvelle prédiction

© 2023 - All rights reserved En résumé Où réaliser l’entraînement ? 📅 Quand l’utiliser ? Dans le service d’inférence Démonstrateur ou online learning Dans l’environnement de travail du DS Entraînement peu fréquent Dans l’environnement de production Lorsque l’entraînement est déclenché principalement par des changements des données (ou mixte)

© 2023 - All rights reserved En résumé Où stocker les versions du modèle ? 📅 Quand l’utiliser ? Git Quand le train se fait dans l’env de dev Stockage de type blob Lorsque le train se fait via un service dédié Le même registre que pour le logiciel Lorsque le train se fait dans la CI Registre spécialisé en ML Lorsque l’organisation a déjà le service dans sa stack ou lorsque d’autres besoins justiﬁent de l’adopter

© 2023 - All rights reserved En résumé Quand charger la version du modèle souhaitée ? 📅 Quand l’utiliser ? Lors du déploiement Lorsque le train se fait dans la CI ou en dev Lors de l’inférence Lorsque le train peut être déclenché par un changement dans les données Lorsque les prédictions ne sont pas fréquentes (batch) Lors de l’inférence, lorsque le modèle est mis à jour Lorsque le train peut être déclenché par un changement dans les données Lorsque les prédictions sont fréquentes

© 2023 - All rights reserved ๏ Il n’y a pas une seule bonne façon de faire de la CI/CD pour un logiciel avec ML : choisissez vos patterns selon votre contexte et faites des ADR. ๏ Les outils du logiciel ne sont pas toujours suffisants à déployer du ML - mais ils peuvent l’être, au moins temporairement. ๏ Un logiciel avec ML peut ressembler à ces 3 exemples au cours de sa vie : sa CI/CD doit évoluer avec ses besoins. Takeaway

La CI/CD à l'heure du Machine Learning

La CI/CD à l'heure du Machine Learning

Emmanuel-Lin

Featured

Transcript

1 There is a better way OCTO Part of Accenture

2 There is a better way OCTO Part of Accenture

3 03 02 01 05 04 There is a better

4 There is a better way OCTO Part of Accenture

5 There is a better way OCTO Part of Accenture

6 There is a better way OCTO Part of Accenture

7 There is a better way OCTO Part of Accenture

8 There is a better way OCTO Part of Accenture

9 There is a better way OCTO Part of Accenture

10 There is a better way OCTO Part of Accenture

11 There is a better way OCTO Part of Accenture

12 There is a better way OCTO Part of Accenture

13 There is a better way OCTO Part of Accenture

14 There is a better way OCTO Part of Accenture

15 There is a better way OCTO Part of Accenture

16 There is a better way OCTO Part of Accenture

17 There is a better way OCTO Part of Accenture

18 There is a better way OCTO Part of Accenture

19 There is a better way OCTO Part of Accenture

20 There is a better way OCTO Part of Accenture

21 There is a better way OCTO Part of Accenture

22 There is a better way OCTO Part of Accenture

23 There is a better way OCTO Part of Accenture

24 There is a better way OCTO Part of Accenture

25 There is a better way OCTO Part of Accenture

26 There is a better way OCTO Part of Accenture

27 There is a better way OCTO Part of Accenture

28 There is a better way OCTO Part of Accenture

29 There is a better way OCTO Part of Accenture

30 There is a better way OCTO Part of Accenture

31 There is a better way OCTO Part of Accenture

32 There is a better way OCTO Part of Accenture

33 There is a better way OCTO Part of Accenture

34 There is a better way OCTO Part of Accenture

35 There is a better way OCTO Part of Accenture