Conférence
LLMs : et si on arrêtait de coder à l’aveugle ?
Le TDD à la rescousse !
Raphaël ANJOU
Soirée du
Test Logiciel
Sophia
Antipolis
17 octobre 2024
17h à 22h30
Polytech Nice
Sophia à Biot
7ème édition de la
Slide 2
Slide 2 text
Conférence
Qui suis-je ?
Architecte Solutions IA Générative
Slide 3
Slide 3 text
Conférence
Qui êtes-vous ?
Slide 4
Slide 4 text
Conférence
ALERTES ACRONYMES !!!
LLMs, et si on arrêtait
de coder à l’aveugle ?
Le TDD à la rescousse !
Slide 5
Slide 5 text
Conférence
C’est quoi un LLM ?
Large Language Model
Entrée Sortie
Slide 6
Slide 6 text
Conférence
C’est quoi le TDD ?
Test Driven Development
Slide 7
Slide 7 text
Conférence
LLMs, et si on arrêtait
de coder à l’aveugle ?
Le TDD à la rescousse !
Slide 8
Slide 8 text
Conférence
Pourquoi c’est un sujet ?
Slide 9
Slide 9 text
Conférence
Pourquoi c’est compliqué ?
Slide 10
Slide 10 text
Conférence
Les LLMs sont imprévisibles
Slide 11
Slide 11 text
Conférence
Les LLMs sont imprévisibles
Slide 12
Slide 12 text
Conférence
Les LLMs sont imprévisibles
Slide 13
Slide 13 text
Conférence
Les prompts sont stables
Slide 14
Slide 14 text
Conférence
Comment fait-on pour garantir la stabilité ?
Slide 15
Slide 15 text
Conférence
Mais Raph !!!
Comment on test un truc
qu’on NE PEUT PAS prévoir ???
Slide 16
Slide 16 text
Conférence
C’est quoi un test ?
Fonction
Entrée
Résultat attendu
Résultat obtenu
Validation
Slide 17
Slide 17 text
Conférence
Validation
Résultat obtenu
Résultat attendu
Fonction Entrée
C’est quoi un test de LLM ?
Appel
à un LLM
Appel à un process
utilisant un LLM
Slide 18
Slide 18 text
Conférence
Validation
Résultat obtenu
Résultat attendu
Fonction Entrée
C’est quoi un test de LLM ?
Demande utilisateur
Prompt système
Contenu externe
Slide 19
Slide 19 text
Conférence
Validation
Résultat obtenu
Résultat attendu
Fonction Entrée
C’est quoi un test de LLM ?
Format structuré
Format non-structuré
Slide 20
Slide 20 text
Conférence
Validation
Résultat obtenu
Résultat attendu
Fonction Entrée
C’est quoi un test de LLM ?
Slide 21
Slide 21 text
Conférence
Validation
Résultat obtenu
Résultat attendu
Fonction Entrée
C’est quoi un test de LLM ?
Format structuré
Format non-structuré
Métriques évaluées
par un autre LLM
Métriques
déterministiques
Slide 22
Slide 22 text
Conférence
Passons au concret !
Slide 23
Slide 23 text
Conférence
Quelle est la fonctionnalité ?
« En tant qu’utilisateur, je souhaite obtenir des informations
sur les évènements disponibles à un moment donné »
J’ai envie de sortir ce soir.
Y a-t-il des expositions en avril 2025 ?
J'aimerais sortir en famille et en ville le 19 octobre.
Slide 24
Slide 24 text
Conférence
Quelle est la fonctionnalité ?
Ça veut dire quoi « matin », « soir », « après-midi » ?
Si la date n’est pas précisée ?
Si l’heure n’est pas précisée ?
S’il n’ y a pas de détails donnés par l’utilisateur ?
Slide 25
Slide 25 text
Conférence
Passons aux tests !
« Promptfoo »
Slide 26
Slide 26 text
Conférence
Passons aux tests !
Slide 27
Slide 27 text
Conférence
Passons aux tests !
Slide 28
Slide 28 text
Conférence
Passons à la fonctionnalité !
Slide 29
Slide 29 text
Conférence
Passons aux tests !
Slide 30
Slide 30 text
Conférence
Et ma pipeline de CI alors ?
Slide 31
Slide 31 text
Conférence
En conclusion
Tester, c’est possible !
Mais c’est pas si facile…
Slide 32
Slide 32 text
Conférence
Merci de
votre écoute !
Soirée du
Test Logiciel
Sophia
Antipolis
17 octobre 2024
17h à 22h30
Polytech Nice
Sophia à Biot
7ème édition de la
Votre avis nous intéresse