ユーザー/ アプリケーション !$?!@!@#@@ (不適切なコンテンツ) ガードレールによってブ ロックされました • コンテンツフィルター ◦ ヘイト、侮辱、性的、暴力、不正行為、プロンプトアタック などの有害コンテンツをテキスト・画像の両方で検出・ブ ロック • 拒否トピック ◦ 特定のトピック(話題)を定義してブロック • ワードフィルター ◦ カスタムの単語やフレーズを定義してブロック • 機密情報フィルター ◦ PII(個人識別情報)などの機密情報をブロックまたはマスク • コンテキストグラウンディングチェック ◦ ソース情報に基づかないハルシネーションを検出・フィルタ リング • 自動推論チェック(プレビュー) ◦ 論理ルールに基づいてモデル応答の正確性を検証し、事実誤 認を防止 Guardrailsの主な機能