L’IA en cage : comment sandboxer un agent sans casser sa valeur

L'IA en cage Comment sandboxer un agent sans casser sa
valeur Julien Maitrehenry github.com/jmaitrehenry · jmaitrehenry.ca

J U L I E N M A I T
R E H E N R Y Qui suis-je ? Dev, Ops, Cloud Architect, mentor Cloud Architect & acting CTO @Paren Des credentials partout 🔑 jmaitrehenry.ca github.com/jmaitrehenry linkedin/in/jmaitrehenry

AGENDA Pourquoi mettre l'IA en cage ? sbx, c'est quoi
? Réseau & secrets Le workflow au quotidien Ce que la cage ne protège pas Lancer de tomates 🍅 (alias Q&A)

Pourquoi mettre l'IA en cage ?

Sur ma machine de dev… 🔑 Clés SSH - tous
les environnements ☁ Credentials cloud (AWS, GCP, Azure…) 🗂 Code de plusieurs projets 📄 Documents personnels 😅 Des .env qui traînent

Et je donne accès à tout ça… à un agent
IA autonome ? 🤔

Les risques 💀 Exfiltration de données ⚡ Exécution de code
non maîtrisé 👁 Lecture de secrets en clair 🌊 Side effects sur la prod La question n'est pas « mon agent est-il malveillant ? » mais « que se passe-t-il quand il se trompe avec mes droits ? »

Le piège de l'over-approval Début je lis tout +1h je
fais confiance +3h je clique sans lire Fatigue j'approuve aveuglément 🫠 Ce n'est pas de la paresse. C'est de la biologie.

La cage remplace votre vigilance défaillante.

sbx, c'est quoi ?

Petit point vocabulaire docker sandbox run … ⚠ DEPRECATED —
plugin Docker Desktop, plus maintenu ❯ sbx run claude . ✅ La CLI actuelle — standalone

sbx : un binaire standalone • Docker Desktop NON requis
• Pas de souci de licensing en entreprise • Un seul prérequis : compte Docker Hub (login OAuth) ❯ brew install docker/tap/sbx # winget / apt aussi ❯ sbx login # OAuth Docker Hub

MicroVM ≠ container Isolation Host protégé ? sbx (microVM) Hyperviseur
— kernel dédié ✅ Oui Container + socket Namespaces ❌ Non Docker-in-Docker Container privilégié ⚠ Partiel Exécution directe Aucune ❌ Non

Concrètement, ça change quoi ? 🖥 Kernel + daemon Docker
privés docker ps sur l'hôte ne voit pas la sandbox et l'agent ne voit pas vos containers 📁 Workspace monté au même chemin /Users/vous/projet reste /Users/vous/projet: stack traces directement ouvrables 🧹 sbx rm = tout disparaît Images, containers, paquets. Vos fichiers de workspace restent (passthrough)

La base : 4 commandes ❯ sbx run claude .
# agent dans une microVM ❯ sbx ls # lister (pas docker ps !) ❯ sbx exec -ti claude-xx bash # shell dans la VM ❯ sbx rm claude-xx # tout nettoyer

Réseau & secrets

3 niveaux de policy réseau 🌐 Open Tout autorisé Tests
seulement, jamais avec des credentials ⚖ Balanced Deny par défaut + dev courant autorisé (npm, GitHub, APIs IA…) Le bon point de départ ★ 🔒 Locked Down Tout bloqué sauf whitelist Contrôle max — même votre provider IA est bloqué

Affiner & auditer ❯ sbx policy allow network 'api.github.com' ❯
sbx policy allow network '**.npmjs.org' ❯ sbx policy log # CHAQUE requête : règle, forward ou block 👆 L'audit trail. Le reçu qui permet de faire confiance.

Comment l'agent s'authentifie sans connaître les credentials ? 🤯

Le proxy host-side Agent IA dans la microVM → Proxy
sur votre host → API externe api.openai.com requête SANS credentials requête + Authorization: Bearer *** 🗝 Le secret vit sur dans sbx serveur, sur le host, jamais dans la VM 💉 Le proxy injecte le header au passage 🚫 L'agent ne peut ni lire, ni loguer, ni exfiltrer le token

Le setup tient en une ligne ❯ sbx secret set
-g github 🔄 Rotation : on change la valeur du secret et c’est tout ✍ SSH agent forwarding inclus, commits signés sans donner la clé privée 📦 Bonus : registres privés avec sbx secret set --registry

Le workflow au quotidien

Mon setup réel : plusieurs repos Un agent, le contexte
de tout l'écosystème - une seule cible en écriture. ❯ sbx create --template jmaitrehenry/sandbox-templates:copilot-docker \ copilot . \ ../ohio-dashboard:ro ../customer-api:ro ../data-api:ro ../WebApp:ro 📁 . le repo principal, en lecture-écriture 🔒 ../*:ro les repos voisins en lecture seule : contexte sans risque 🧩 --template image custom : les deps requises déjà installées

Standardiser l'équipe : les templates FROM docker/sandbox-templates:copilot- docker USER root
RUN apt-get purge -y nodejs RUN curl - fsSL https://deb.nodesource.com/setup_24.x | sudo -E bash – RUN apt-get install -y nodejs USER agent ❯ docker buildx build --push --platform linux/arm64/v8,linux/amd64 -t myorg/sandbox-templates:copilot-docker-node24 . • Versionné, partagé via registry • Toute l'équipe, même env • ⚠ Encore expérimental

Standardiser l'équipe : les kits # spec.yaml network: allow: ['api.github.com']
secrets: [github, openai] install: ['apt install -y jq'] ❯ sbx kit push ghcr.io/org/kit:1.0 • Versionné, partagé via OCI registry • Toute l'équipe, même env • ⚠ Encore expérimental

Le fix qui sauve : jemalloc sur ARM Le ripgrep
intégré crashe sur Apple Silicon - #9554 # 1. neutraliser le ripgrep intégré - idempotent, persistant ❯ sbx exec copilot-dataget bash -c "grep -qxF \ 'export USE_BUILTIN_RIPGREP=0' /etc/sandbox-persistent.sh \ || echo 'export USE_BUILTIN_RIPGREP=0' >> /etc/sandbox-persistent.sh" # 2. entrer dans la VM, puis lancer l'agent ❯ sbx exec -ti copilot-dataget bash cd /Users/julien/dev/app && copilot --yolo Idempotent et persistant : la ligne n'est ajoutée qu'une seule fois.

sbx sans argument = dashboard Le panneau réseau (Tab) :
les requêtes de l'agent en live, allow/block à la volée.

Plusieurs agents, un seul repo ? ❯ sbx run claude
--branch auto . # worktree isolé sous .sbx/ ❯ sbx run copilot --branch auto . # chacun sa branche ❯ sbx run --clone claude . # copie complète du repo Votre working tree n'est jamais touché. Diff + cherry-pick 🍒 à la fin. 💡 Ajoutez .sbx/ au .gitignore

Ce que la cage ne protège pas

Limite #1 : votre workspace Le workspace monté est en
lecture-écriture. L'agent peut modifier, supprimer, réécrire vos fichiers non commités. La cage protège le système, pas le répertoire que vous lui donnez. Mitigation : --branch, --clone, ou montage :ro

Limite #2 : l'exfiltration La policy limite les destinations, pas
le contenu. GitHub autorisé (Balanced) = un agent compromis par prompt injection peut pousser votre code vers un repo externe. Mitigation : Locked Down + sbx policy log + review des diffs

Limite #3 : le contexte Tout le workspace est lisible
par l'agent… …et transite vers le provider IA pour l'inférence. Ce qui est monté est, de fait, partagé. Mitigation : ne monter que le strict nécessaire, :ro si possible

Limite #4 : les hooks La sandbox limite les actions
dans la VM… …mais pas à l’extérieur ! Un hook git, un github workflow peuvent executer des commandes preparé par votre agent et impacté votre système. Mitigation : vérifier les changements manuelement dans certains dossier: .github, .husky, Makefile, etc

Notre bilan ✅ Gains • Sérénité (YOLO sans surveiller) •
Auditabilité (policy log) • Multi-agents (branch/clone) • Kits versionnés ⚠ Frictions • Login Docker Hub obligatoire • Setup des policies au départ • Debug réseau parfois silencieux • Overhead VM (boot, RAM) • Kits expérimentaux

Notre setup final MicroVM Copilot (YOLO) Docker Daemon privé Workspace
monté → Proxy host Policy réseau Injection headers Logs → APIs autorisées ✓ GitHub / npm / OpenAI ✗ tout le reste Jamais dans la VM ↑ La requête sort sans credentials → le proxy l'enrichit. Le token n’est jamais disponible au LLM.

4 choses à retenir 1 sbx remplace docker sandbox, standalone,
sans Docker Desktop 2 MicroVM = isolation réelle du système hôte (le workspace reste à vous de protéger) 3 Secrets injectés par le proxy, jamais dans la VM 4 Dashboard + branch mode + kits = workflow complet, du solo à l'org

Merci Questions RÉPONSES INFORMATION docs.docker.com/ai/sandboxes · brew install docker/tap/sbx ·
jmaitrehenry.ca Lien de la présentation

L’IA en cage : comment sandboxer un agent sans ...

L’IA en cage : comment sandboxer un agent sans casser sa valeur

More Decks by Julien Maitrehenry

Other Decks in Programming

Featured

Transcript