AI Coding Agentは、もはや「チャットで回答を返す存在」ではなく、ファイル編集、shell実行、依存関係の追加、CI/CDやクラウド環境への操作まで行う“実行主体”になりつつあります。
本資料では、AIエージェントに外部能力を接続し、実行させるための制御層を「ハーネス」と定義し、そのハーネスを本当にセキュリティ境界として扱えているのかを考えます。
Prompt InjectionやTool Misuse、Sensitive Info Disclosureなどのリスクは、モデルの出力だけでなく、エージェントが何を実行できるかという権限・環境設計の問題でもあります。
許可プロンプトやルールだけに頼るのではなく、sandbox、filesystem isolation、network isolation、egress制御、最小権限、監査ログなどの強制制御を組み合わせ、AIエージェント時代の実行環境をどう設計すべきかを整理します。
MEGU-Meet #4「AI-Generated Vulnerabilities LT」での登壇資料です。