LLMs : et si on arrêtait de coder à l’aveugle ? Le TDD à la rescousse !

Conférence LLMs : et si on arrêtait de coder à
l’aveugle ? Le TDD à la rescousse ! Raphaël ANJOU Soirée du Test Logiciel Sophia Antipolis 17 octobre 2024 17h à 22h30 Polytech Nice Sophia à Biot 7ème édition de la

Conférence Qui suis-je ? Architecte Solutions IA Générative

Conférence Qui êtes-vous ?

Conférence ALERTES ACRONYMES !!! LLMs, et si on arrêtait de
coder à l’aveugle ? Le TDD à la rescousse !

Conférence C’est quoi un LLM ? Large Language Model Entrée
Sortie

Conférence C’est quoi le TDD ? Test Driven Development

Conférence LLMs, et si on arrêtait de coder à l’aveugle
? Le TDD à la rescousse !

Conférence Pourquoi c’est un sujet ?

Conférence Pourquoi c’est compliqué ?

Conférence Les LLMs sont imprévisibles

Conférence Les prompts sont stables

Conférence Comment fait-on pour garantir la stabilité ?

Conférence Mais Raph !!! Comment on test un truc qu’on
NE PEUT PAS prévoir ???

Conférence C’est quoi un test ? Fonction Entrée Résultat attendu
Résultat obtenu Validation

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi
un test de LLM ? Appel à un LLM Appel à un process utilisant un LLM

un test de LLM ? Demande utilisateur Prompt système Contenu externe

un test de LLM ? Format structuré Format non-structuré

un test de LLM ?

un test de LLM ? Format structuré Format non-structuré Métriques évaluées par un autre LLM Métriques déterministiques

Conférence Passons au concret !

Conférence Quelle est la fonctionnalité ? « En tant qu’utilisateur,
je souhaite obtenir des informations sur les évènements disponibles à un moment donné » J’ai envie de sortir ce soir. Y a-t-il des expositions en avril 2025 ? J'aimerais sortir en famille et en ville le 19 octobre.

Conférence Quelle est la fonctionnalité ? Ça veut dire quoi
« matin », « soir », « après-midi » ? Si la date n’est pas précisée ? Si l’heure n’est pas précisée ? S’il n’ y a pas de détails donnés par l’utilisateur ?

Conférence Passons aux tests ! « Promptfoo »

Conférence Passons aux tests !

Conférence Passons à la fonctionnalité !

Conférence Passons aux tests !

Conférence Et ma pipeline de CI alors ?

Conférence En conclusion Tester, c’est possible ! Mais c’est pas
si facile…

Conférence Merci de votre écoute ! Soirée du Test Logiciel
Sophia Antipolis 17 octobre 2024 17h à 22h30 Polytech Nice Sophia à Biot 7ème édition de la Votre avis nous intéresse

LLMs : et si on arrêtait de coder à l’aveugle ?...

LLMs : et si on arrêtait de coder à l’aveugle ? Le TDD à la rescousse !

Raphaël Anjou

More Decks by Raphaël Anjou

Other Decks in Technology

Featured

Transcript

Conférence LLMs : et si on arrêtait de coder à

Conférence Qui suis-je ? Architecte Solutions IA Générative

Conférence Qui êtes-vous ?

Conférence ALERTES ACRONYMES !!! LLMs, et si on arrêtait de

Conférence C’est quoi un LLM ? Large Language Model Entrée

Conférence C’est quoi le TDD ? Test Driven Development

Conférence LLMs, et si on arrêtait de coder à l’aveugle

Conférence Pourquoi c’est un sujet ?

Conférence Pourquoi c’est compliqué ?

Conférence Les LLMs sont imprévisibles

Conférence Les LLMs sont imprévisibles

Conférence Les LLMs sont imprévisibles

Conférence Les prompts sont stables

Conférence Comment fait-on pour garantir la stabilité ?

Conférence Mais Raph !!! Comment on test un truc qu’on

Conférence C’est quoi un test ? Fonction Entrée Résultat attendu

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi

Conférence Validation Résultat obtenu Résultat attendu Fonction Entrée C’est quoi

Conférence Passons au concret !

Conférence Quelle est la fonctionnalité ? « En tant qu’utilisateur,

Conférence Quelle est la fonctionnalité ? Ça veut dire quoi

Conférence Passons aux tests ! « Promptfoo »

Conférence Passons aux tests !

Conférence Passons aux tests !

Conférence Passons à la fonctionnalité !

Conférence Passons aux tests !

Conférence Et ma pipeline de CI alors ?

Conférence En conclusion Tester, c’est possible ! Mais c’est pas

Conférence Merci de votre écoute ! Soirée du Test Logiciel