[Agentforce World Tour Paris 2026] Sans tests, vos agents ne sont pas fiables

Sans tests, vos agents ne sont pas ﬁables Subtitle Nathan
Abondance CTO @ Think2 /nabondance

Nathan Abondance CTO @ Think2

Agenda /nabondance - Think2 Pourquoi tester les agents Comment tester
les agents C'est pas headless du coup ? Le futur 1 2 3 4

Pourquoi tester

Pourquoi tester les agents Pour les mêmes raisons qu'on teste
l'Apex /nabondance - Think2 🔧 Valider le fonctionnement 🛡 Éviter les régressions 🚀 Déployer sereinement 📖 Documenter le comportement attendu

Pourquoi tester les agents Ce qu'on veut vériﬁer /nabondance -
Think2 🎯 Le bon topic et subagent est déclenché ⚡ La bonne action est appelée 📦 Avec les bons paramètres 💬 La réponse reste dans les clous (ton, format, guardrails)

Comment tester

Comment tester les agents En quelques clics /nabondance - Think2
🚫 Pas besoin de framework externe 🧰 Outil fourni par Salesforce : Testing Center 🤖 Créer les jeux de tests avec Agentforce ou un import csv 📋 Choisir ce qu'on vériﬁe

Comment tester les agents ? Le Les testing centers Setup
Agentforce Studio 🟢 Dédié aux tests d'agents 🟢 Métadonnée AiEvaluationDefinition 🟢 Possible d'interagir via la CLI ❌ Impossible de modiﬁer un jeu de test 🟢 Construit sur Agentforce Grid 🟢 Plus de fonctionnalités: ➕ Modiﬁcation des jeux de test ➕ Bouchonnage de la donnée ➕ Meilleur debuggage ➕ Scoring personnalisable ➕ Historique des tests ❌ Pas de Métadonnée récupérable ❌ Invisible via CLI /nabondance - Think2 Celui du futur → Compatible avec la CLI →

C'est le moment de cliquer

C'est pas headless du coup ?

C'est pas headless du coup ? Tester sans clic grâce
à l'agentforce CLI /nabondance - Think2 🔎 Pour les scripts CI/CD complets et la logique 👉 🔎 Explication approfondie de l'agentforce CLI 👉 󰳕 Gérer les tests depuis un terminal 🔁 Répétable, versionnable (git) 📄 Sortie machine-readable (JSON, JUnit) ⌨ sf agent test run --api-name=MyTest

C'est pas headless du coup ? ⚙ Se base sur
la Agentforce CLI 🚨 Lancé sur chaque PR ✔ Assertions : "bonne action" vs "exception levée" 📊 Seuil d'évaluation (pas juste pass/fail) ⚠ Seuls les tests du Testing Center Setup sont déployables ⚠ Chaque run = appels LLM = €€ Intégrer les tests d'agents dans une CI/CD /nabondance - Think2 🔎 Pour les scripts CI/CD complets et la logique 👉

Le futur Et la conclusion

Mais du coup c'est quoi la suite ? Ce qui
arrive (ou pas) /nabondance - Think2 ✅ Testing Center in Agentforce Studio — GA Juin ✅ Custom Scoring Evals : Déﬁnir ses propres critères (ton de marque, conformité, qualité de résolution), le Testing Center score automatiquement ✅ Multi-turn Conversation Testing : Tester des conversations complètes, avec simulation voix et historique de runs 🧪 A/B Testing API — Pilote : Splitter le traﬁc prod entre deux versions d'agent, promouvoir la gagnante via API ⛔ Métadonnée de Testing Center in Agentforce Studio : Aucune info 😢

Si vous avez des sueurs froides à mettre en prod
de l'apex pas testé, pourquoi le faire avec des agents ?

Conclusion Et le QR code /nabondance - Think2 1⃣ Tester
ses agents comme son code 2⃣ Deux Testing Center avec leurs qualités et défauts 3⃣ On peut intégrer les tests d'agents dans une CI slides

Thank you Paris 🫶

[Agentforce World Tour Paris 2026] Sans tests, ...

[Agentforce World Tour Paris 2026] Sans tests, vos agents ne sont pas fiables

Nathan Abondance

More Decks by Nathan Abondance

Other Decks in Programming

Featured

Transcript

Sans tests, vos agents ne sont pas ﬁables Subtitle Nathan

Nathan Abondance CTO @ Think2

Agenda /nabondance - Think2 Pourquoi tester les agents Comment tester

Pourquoi tester

Pourquoi tester les agents Pour les mêmes raisons qu'on teste

Pourquoi tester les agents Ce qu'on veut vériﬁer /nabondance -

Comment tester

Comment tester les agents En quelques clics /nabondance - Think2

Comment tester les agents ? Le Les testing centers Setup

C'est le moment de cliquer

C'est pas headless du coup ?

C'est pas headless du coup ? Tester sans clic grâce

C'est pas headless du coup ? ⚙ Se base sur

Le futur Et la conclusion

Mais du coup c'est quoi la suite ? Ce qui

Si vous avez des sueurs froides à mettre en prod

Conclusion Et le QR code /nabondance - Think2 1⃣ Tester

Thank you Paris 🫶