Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
No content
Slide 2
Slide 2 text
自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太|BLUEISH Shota Totsuka ・LLMアプリ開発者(Go/Python …etc) ・生成AI, 機械学習 ・趣味: スキー/スノボ, 最近はDifyにContribute ・静岡県(浜松)に住んでます 近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash
Slide 3
Slide 3 text
自己紹介 ©Blueish 2024. All rights reserved. AWS認定(1月から開始)
Slide 4
Slide 4 text
01 ガードレールとは? 02 料金・仕組み 03 フィルターの種類 04 デプロイ 目次 ©Blueish 2024. All rights reserved. 05 まとめ
Slide 5
Slide 5 text
01 ガードレールとは? ©Blueish 2024. All rights reserved.
Slide 6
Slide 6 text
©Blueish 2024. All rights reserved. ガードレールとは? - LLM Applicationにて、LLMへの入力やLLMからの出力の内容を保護する仕組み - システム側が許容していない入力を弾く - システム側が許容していない出力をユーザーに返さない ガードレール
Slide 7
Slide 7 text
ガードレールとは? Amazon Bedrock Guardrails
Slide 8
Slide 8 text
ガードレールとは? 日本語の対応
Slide 9
Slide 9 text
02 料金・仕組み ©Blueish 2024. All rights reserved.
Slide 10
Slide 10 text
料金・仕組み 仕組み
Slide 11
Slide 11 text
仕組み・料金 料金
Slide 12
Slide 12 text
仕組み・料金 料金
Slide 13
Slide 13 text
03 フィルターの種類 ©Blueish 2024. All rights reserved.
Slide 14
Slide 14 text
フィルターの種類 コンテンツフィルター - Hate(ヘイト、憎悪) - Insults(侮辱) - Sexual(性的) - Violence(暴力) - Misconduct(不正行為) - Prompt Attack(プロンプト攻撃) - ジェイルブレイク: 有害なコンテンツを生成させる - プロンプトインジェクション: プロンプトを上書きさせる
Slide 15
Slide 15 text
フィルターの種類
Slide 16
Slide 16 text
フィルターの種類
Slide 17
Slide 17 text
フィルターの種類 拒否されたトピック - 望ましくない拒否トピックを指定できる(最大30個) - 200文字でトピックの定義を説明 & 最大5つのサンプルフレーズ - 例 - 投資アドバイスに関する内容 - 仮想通貨に関する内容 - …etc
Slide 18
Slide 18 text
フィルターの種類
Slide 19
Slide 19 text
フィルターの種類 機密情報フィルター - 個人情報、機密情報をブロック / マスク できる - 住所,名前,email,クレジットカード,講座,IPアドレス …etc - マスクの場合は [NAME-1], [EMAIL-1] などに置き換えられる - 正規表現での指定も可能
Slide 20
Slide 20 text
フィルターの種類
Slide 21
Slide 21 text
フィルターの種類
Slide 22
Slide 22 text
フィルターの種類 単語フィルター - 入力プロンプトやモデル応答内の単語やフレーズ (完全一致) をブロックする - 単語やフレーズ(最大3語)を10,000語まで指定可能 - S3に.txt/.csvをアップロードして登録することも可能
Slide 23
Slide 23 text
フィルターの種類
Slide 24
Slide 24 text
フィルターの種類 コンテキスト グラウンディングチェック - 参照ソースとユーザークエリが提供された場合に、モデル応答の幻覚を検出して フィルタリング - RAG, 要約など参考にすべきソースが入っている場合に使用 - 処理される各チャンクの関連性をチェック - 各モデル応答のグラウンディングと関連性に対応する信頼スコアが生成される - 閾値を用いてフィルタリング
Slide 25
Slide 25 text
フィルターの種類
Slide 26
Slide 26 text
フィルターの種類 画像コンテンツフィルター
Slide 27
Slide 27 text
04 デプロイ・検証 ©Blueish 2024. All rights reserved.
Slide 28
Slide 28 text
デプロイ・検証 デプロイ(バージョン管理)
Slide 29
Slide 29 text
デプロイ・検証 テスト
Slide 30
Slide 30 text
ご清聴ありがとうございました。 ©Blueish 2024. All rights reserved.