Bedrockでガードレールのフィルターを理解する

Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

ガードレールとは？ Amazon Bedrock Guardrails

Slide 8

Slide 8 text

ガードレールとは？日本語の対応

Slide 9

Slide 9 text

Slide 10

Slide 10 text

料金・仕組み仕組み

Slide 11

Slide 11 text

仕組み・料金料金

Slide 12

Slide 12 text

仕組み・料金料金

Slide 13

Slide 13 text

Slide 14

Slide 14 text

フィルターの種類コンテンツフィルター - Hate（ヘイト、憎悪） - Insults（侮辱） - Sexual（性的） - Violence（暴力） - Misconduct（不正行為） - Prompt Attack（プロンプト攻撃） - ジェイルブレイク: 有害なコンテンツを生成させる - プロンプトインジェクション: プロンプトを上書きさせる

Slide 15

Slide 15 text

フィルターの種類

Slide 16

Slide 16 text

フィルターの種類

Slide 17

Slide 17 text

フィルターの種類拒否されたトピック - 望ましくない拒否トピックを指定できる（最大30個） - 200文字でトピックの定義を説明 & 最大5つのサンプルフレーズ - 例 - 投資アドバイスに関する内容 - 仮想通貨に関する内容 - …etc

Slide 18

Slide 18 text

フィルターの種類

Slide 19

Slide 19 text

フィルターの種類機密情報フィルター - 個人情報、機密情報をブロック / マスクできる - 住所,名前,email,クレジットカード,講座,IPアドレス …etc - マスクの場合は [NAME-1], [EMAIL-1] などに置き換えられる - 正規表現での指定も可能

Slide 20

Slide 20 text

フィルターの種類

Slide 21

Slide 21 text

フィルターの種類

Slide 22

Slide 22 text

フィルターの種類単語フィルター - 入力プロンプトやモデル応答内の単語やフレーズ (完全一致) をブロックする - 単語やフレーズ（最大3語）を10,000語まで指定可能 - S3に.txt/.csvをアップロードして登録することも可能

Slide 23

Slide 23 text

フィルターの種類

Slide 24

Slide 24 text

フィルターの種類コンテキストグラウンディングチェック - 参照ソースとユーザークエリが提供された場合に、モデル応答の幻覚を検出してフィルタリング - RAG, 要約など参考にすべきソースが入っている場合に使用 - 処理される各チャンクの関連性をチェック - 各モデル応答のグラウンディングと関連性に対応する信頼スコアが生成される - 閾値を用いてフィルタリング

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text