Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太|BLUEISH Shota Totsuka ・LLMアプリ開発者(Go/Python …etc) ・生成AI, 機械学習 ・趣味: スキー/スノボ, 最近はDifyにContribute ・静岡県(浜松)に住んでます  近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash

Slide 3

Slide 3 text

自己紹介 ©Blueish 2024. All rights reserved. AWS認定(1月から開始)

Slide 4

Slide 4 text

01 ガードレールとは? 02 料金・仕組み 03 フィルターの種類 04 デプロイ 目次 ©Blueish 2024. All rights reserved. 05 まとめ

Slide 5

Slide 5 text

01 ガードレールとは? ©Blueish 2024. All rights reserved.

Slide 6

Slide 6 text

©Blueish 2024. All rights reserved. ガードレールとは? - LLM Applicationにて、LLMへの入力やLLMからの出力の内容を保護する仕組み - システム側が許容していない入力を弾く - システム側が許容していない出力をユーザーに返さない ガードレール

Slide 7

Slide 7 text

ガードレールとは? Amazon Bedrock Guardrails

Slide 8

Slide 8 text

ガードレールとは? 日本語の対応

Slide 9

Slide 9 text

02 料金・仕組み ©Blueish 2024. All rights reserved.

Slide 10

Slide 10 text

料金・仕組み 仕組み

Slide 11

Slide 11 text

仕組み・料金 料金

Slide 12

Slide 12 text

仕組み・料金 料金

Slide 13

Slide 13 text

03 フィルターの種類 ©Blueish 2024. All rights reserved.

Slide 14

Slide 14 text

フィルターの種類 コンテンツフィルター - Hate(ヘイト、憎悪) - Insults(侮辱) - Sexual(性的) - Violence(暴力) - Misconduct(不正行為) - Prompt Attack(プロンプト攻撃) - ジェイルブレイク: 有害なコンテンツを生成させる - プロンプトインジェクション: プロンプトを上書きさせる

Slide 15

Slide 15 text

フィルターの種類

Slide 16

Slide 16 text

フィルターの種類

Slide 17

Slide 17 text

フィルターの種類 拒否されたトピック - 望ましくない拒否トピックを指定できる(最大30個) - 200文字でトピックの定義を説明 & 最大5つのサンプルフレーズ - 例 - 投資アドバイスに関する内容 - 仮想通貨に関する内容 - …etc

Slide 18

Slide 18 text

フィルターの種類

Slide 19

Slide 19 text

フィルターの種類 機密情報フィルター - 個人情報、機密情報をブロック / マスク できる - 住所,名前,email,クレジットカード,講座,IPアドレス …etc - マスクの場合は [NAME-1], [EMAIL-1] などに置き換えられる - 正規表現での指定も可能

Slide 20

Slide 20 text

フィルターの種類

Slide 21

Slide 21 text

フィルターの種類

Slide 22

Slide 22 text

フィルターの種類 単語フィルター - 入力プロンプトやモデル応答内の単語やフレーズ (完全一致) をブロックする - 単語やフレーズ(最大3語)を10,000語まで指定可能 - S3に.txt/.csvをアップロードして登録することも可能

Slide 23

Slide 23 text

フィルターの種類

Slide 24

Slide 24 text

フィルターの種類 コンテキスト グラウンディングチェック - 参照ソースとユーザークエリが提供された場合に、モデル応答の幻覚を検出して フィルタリング - RAG, 要約など参考にすべきソースが入っている場合に使用 - 処理される各チャンクの関連性をチェック - 各モデル応答のグラウンディングと関連性に対応する信頼スコアが生成される - 閾値を用いてフィルタリング

Slide 25

Slide 25 text

フィルターの種類

Slide 26

Slide 26 text

フィルターの種類 画像コンテンツフィルター

Slide 27

Slide 27 text

04 デプロイ・検証 ©Blueish 2024. All rights reserved.

Slide 28

Slide 28 text

デプロイ・検証 デプロイ(バージョン管理)

Slide 29

Slide 29 text

デプロイ・検証 テスト

Slide 30

Slide 30 text

ご清聴ありがとうございました。 ©Blueish 2024. All rights reserved.