生成AIをセキュリティ業務に導入した話 / generative-ai for security operations

Slide 1

Slide 1 text

生成AIでセキュリティエンジニアの属人化問題の改善に挑戦する ~ 生成AIをセキュリティ業務に導入した話 ~ @AWS Security and Risk Management Forum 2024-03-19

Slide 2

Slide 2 text

本日の内容 ● はじめに ● セキュリティ業務の課題 ● 生成AIの導入事例 ● 導入のポイント ● まとめ

Slide 3

Slide 3 text

はじめに

Slide 4

Slide 4 text

自己紹介小笠原清志画像 System Security 推進 Group（SSG）技術チームのマネージャ @gassara-kys 猫を２匹飼ってます😽😽 @gassara5

Slide 5

Slide 5 text

セキュリティ業界でもトレンドセキュリティ向け生成AI 引用元: https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20231018

Slide 6

Slide 6 text

去年ブログを書きましたブログの中でも書いた内容をより詳細に解説します。また、その後の様々なチャレンジについても触れていきます。 https://developers.cyberagent.co.jp/blog/archives/45548/

Slide 7

Slide 7 text

本日のゴール ● 生成AIを使った業務改善のケーススタディを持ち帰っていただく ● 生成AIの可能性と課題を知っていただく

Slide 8

Slide 8 text

本日お話しないこと ● 生成AIのセキュリティリスクについての話 ○ 敵対的プロンプトや機密情報が学習に利用されるリスク ○ セキュリティの攻撃手法や対策の話 ● 生成AIの利用ガイドラインやポリシー的な話

Slide 9

Slide 9 text

セキュリティ業務の課題

Slide 10

Slide 10 text

セキュリティ業務とは CyberAgentグループで発生するセキュリティの課題を解決するために、インハウスのセキュリティエンジニアとして様々な活動を行っています ● インシデントレスポンス ● コンサルティング（技術・マネージメント） ● リスクアセスメント ● ソフトウェアの開発 ● … など業務の種類

Slide 11

Slide 11 text

セキュリティのカバー範囲が広い幅広く相談に対応できるように、 SSG内では各領域の専門的な人材を集めチーム体制を作っています CyberAgentグループ SSG プロダクトA プロダクトB プロダクトC クラウドセキュリティバックエンドデータセキュリティネットワーク ID管理脅威モデリング

Slide 12

Slide 12 text

属人化の問題はセキュリティ業界では起こりがち業界固有のドメイン知識や技術領域、マネージメントのスキルが必要になる。幅広い知識や専門性も求められる性質上、属人化が避けられない傾向でもある。業界知識技術マネージメント認証認可ネットワーク AI コンテナクラウドガイドラインリスク評価プライバシーデータ管理業務設計ゲームメディア広告 DX事業

Slide 13

Slide 13 text

課題① 組織としてスケールしない属人化が進行すると組織としてスケールしない状態に陥る可能性があります（特定の個人に信頼・経験が集中し組織全体としては成長できてない）相談相談スケールしない組織組織全体で成長

Slide 14

Slide 14 text

課題② 非効率人が変わり引き継ぎがうまくできないケースが多々発生し、一から調査し直しが発生することがあり非効率な状態後任やりすぎな担当者引き継ぎサプライチェーン ID管理サーバ保守ネットワーク設計サプライチェーン ID管理サーバ保守ネットワーク設計全てを引き継ぐのは難しい

Slide 15

Slide 15 text

課題③ ボトルネック・不安定セキュリティの相談（コンサル）は、人によって回答品質やレスポンス速度にバラツキがでており、結果的にプロダクトに迷惑がかかる可能性経験値忙しいスキル丁寧さその人の状態や能力、性格に依存

Slide 16

Slide 16 text

AIの可能性人間の依存度を下げることで属人化の課題を緩和することができます。今まで、自動化が難しかったセキュリティのコンサル業務やインシデントレスポンスなどの複雑な業務においても、生成AIの技術を使ったアプローチで改善を試みた事例を紹介していきます。業務アプローチ標準化・仕組み化できる業務 • 自動化🤖 • ドキュメンテーション📖 • アウトソース🤝 複雑な業務・センシティブな業務 ● セキュリティコンサル ● インシデントレスポンス • ドキュメンテーション📖 • 後継者育成👶 • AIの活用💬？チャレンジ💪

Slide 17

Slide 17 text

生成AIの導入事例

Slide 18

Slide 18 text

2023年の頭から積極的に生成AIを導入していった SSGではさまざまなセキュリティの業務に生成AIを導入していきました。生成AIへの期待感時間 2023/3 2023/9 2023/12 今 RISKEN（OSS）で生成 AIによる要約機能の実装脅威検知の解析に生成AIを導入セキュリティのコンシェルジュAIを開発様々な課題にぶち当たり現実を知る💧

Slide 19

Slide 19 text

RISKENの事例 RISKENはCyberAgentで開発しているセキュリティのソフトウェア（OSS）です。例えば、クラウド上の危険な設定を検出するのに役立ちます。 https://docs.security-hub.jp/

Slide 20

Slide 20 text

RISKENの事例（デモ）生成AIがスキャン結果をわかりやすく翻訳＆要約

Slide 21

Slide 21 text

RISKENの事例（仕組み） RISKENで検出した問題の一覧 RISKEN API CyberAgentではAWS上にRISKENサーバをホストして、社内のエンジニアが自由に使える環境を構築しています LLM 1 LLM 2 ＊モデルは選択可能 Findingをクリック日本語へ翻訳・内容の要約＊LLM サービスのAPI トークン🔑を設定することで生成AI機能が利用できます

Slide 22

Slide 22 text

RISKENの事例（導入した結果） RISKENに生成AIを導入して良かったことをまとめます ● セキュリティの問題の理解度が上がり次のアクションへつながりやすくなった ○ 優先度の判断の助けになった（リスク評価しやすい） ○ 何をすべきかがより分かりやすくなった ● RISKENが扱う様々なセキュリティスキャン結果（スキーマがバラバラ）との相性が良かった ○ 複数のスキャリティのスキャン結果データ（JSON形式）を扱う ○ どんなスキーマのデータでも良い感じに要約してくれる ● 主に「要約」と「翻訳」の依頼のみなのでハルシネーションが発生しづらい

Slide 23

Slide 23 text

RISKENの事例（宣伝） RISKEN OSS RISKENはOSSとして社外に公開しています。 CyberAgentでは、主にグループ内のAWSや他クラウド、GitHub上の危険な設定の検出に利用しています。もし興味がある方がいらっしゃいましたら、お気軽に使ってみてください♪ [主な機能] • AWSなどのクラウド環境の設定ミスを検出 • ソースコードの静的解析、シークレット、依存ライブラリチェック • インターネットからバックエンドのリソースまでの経路を分析するアタックフロー分析機能

Slide 24

Slide 24 text

セキュリティコンシェルジュ（SSG AI）の事例 SSGの人間質問者コンシェルジュAI ① セキュリティの質問 ➁ 事例をもとに回答する ③ 過去事例がない場合は SSGメンバーが対応 ③ ヒアリング・回答ドキュメントソース ④ ドキュメントに記録 ⑤ 取り込み（自動）過去に解決済みの問題はAIに任せることができる。また、実体験に基づいた説得力のある回答を生成できる可能性がある。次に同じような質問が来ても良いようにドキュメント化しておくことで、結果的にSSGの負担を減らせる SSG AI

Slide 25

Slide 25 text

セキュリティコンシェルジュ（SSG AI）の事例 ChatGPTのようなUIで生成AI とチャットが可能

Slide 26

Slide 26 text

セキュリティコンシェルジュ（SSG AI）の事例普段使い慣れたSlackでも生成AIとチャットできる

Slide 27

Slide 27 text

セキュリティコンシェルジュ（SSG AI）の事例ユーザ「決済機能を実装したいんだけど、セキュリティ上で気をつけることはありますか？」ドキュメント検索関連ドキュメントをコンテキスト付与して生成AIに質問（RAG） API （ECSサービス）データソース（ECSタスク）ドキュメント更新クロール「過去の対応履歴から以下の推奨事項が見つかりました...」セキュリティの質問 SSGが過去にまとめた文章や対応履歴をもとに回答してくれる →非同期フロント← ドキュメントお問合せ対応脆弱性診断結果データソース（社内ドキュメント） VectorDB （ECSサービス）同期 EFS （Backup） ECSクラスター Amazon Bedrock

Slide 28

Slide 28 text

セキュリティコンシェルジュ（SSG AI）の事例コンポーネント AWSサービス説明 API Amazon ECS WEBチャットやSlack、ClickUpからのリクエストを受け付ける APIエンドポイント。 WEB Amazon ECS WEBチャットのフロントエンド。 VectorDB Amazon ECS 社内のドキュメントソースをセマンティック検索するためのベクトルDBサービス。QdrantというOSSを採用。 Embedding Amazon Bedrock ドキュメントソースの保存、検索時に利用するAPI。 Amazon Titanモデルを採用。生成AI Amazon Bedrock 生成AIのAPI。日本語にも対応可能なClaude 3 Sonnetモデルを採用。 Input Token数が20万(200K)トークンと大きくRAGとの相性が良い。データソースJOB Amazon ECS 非同期に外部のデータソースの取り込みや、VectorDBへの保存するためのECSタスク。Lambdaのような時間的な制約はないのが良い。ドキュメントソース Amazon S3 データソースの保存場所。

Slide 29

Slide 29 text

Slide 30

Slide 30 text

セキュリティコンシェルジュ（SSG AI）の事例 ● いわゆるRAG（Retrieval Augmented Generation）を利用したアプリケーションを実装 ● WEBのチャットだけでなく、普段利用しているアプリ（SlackやClickUp）にも対応したインターフェースを実装することで利用が広がった ● チャットデータはAWS環境に閉じているため、機密情報の取り扱い等を意識しなくても良いユーザ体験を実現実装ポイント

Slide 31

Slide 31 text

セキュリティコンシェルジュ（SSG AI）の事例導入効果 ● セキュリティ運用の属人化の排除 👉お問合せの約半分近くをAIが回答できるように（できる見込み） 👉過去の履歴や議事録の検索などの手間が削減され回答品質やスピードが向上 ● 対応時間が短縮し、より高度なセキュリティ対応に集中できるようになった ● 将来的にはセキュリティ以外の部署にも使ってもらえるサービスを目指す

Slide 32

Slide 32 text

導入のポイント

Slide 33

Slide 33 text

導入のポイント最後に生成AI（RAGのアプリ）を導入するためのポイントを個人的に整理してみましたポイント ● 生成AIを信頼しすぎない ● 生成された回答が何に影響を受けているかを特定しチューニングできるようにする ● 生成AIを活用できるポイントとそうでない箇所を見極める

Slide 34

Slide 34 text

最初はひどかった話過去に実際に来たセキュリティの「お問い合わせ」データ（100件程度）を使って生成AIで回答を作成したところ、60%以上の回答は品質が悪かった

Slide 35

Slide 35 text

生成AIが回答を生成するまでのプロセスプロンプトドキュメント検索質問回答 ● 文脈に関連したドキュメントがヒットできたか？ ● 必要なドキュメントは収集・保存できているか？ ● ドキュメントの品質は問題ないか？ ● 最終的に正しい回答を生成できたか？ ● ハルシネーションはないか？ ● 正しく命令できているか？ ● 書き方によって回答が大きく変化することはあるか？ ● モデルの選択は適切か？ ● 聞き方は問題ないか？ ● 目的の回答を得るために十分な情報を含んでいるか？プロセスチェックポイント

Slide 36

Slide 36 text

生成AIが回答を生成するまでのプロセスプロンプトドキュメント検索質問回答 ● 最終的に正しい回答を生成できたか？ ● ハルシネーションはないか？ ● 正しく命令できているか？ ● 書き方によって回答が大きく変化することはあるか？ ● モデルの選択は適切か？ ● 聞き方は問題ないか？ ● 目的の回答を得るために十分な情報を含んでいるか？コントロール可能な範囲 ● 文脈に関連したドキュメントがヒットできたか？ ● 必要なドキュメントは収集・保存できているか？ ● ドキュメントの品質は問題ないか？プロセスチェックポイント

Slide 37

Slide 37 text

みんなでチューニングできるようにした回答のフッターにどんなドキュメントを参照したのかのリストを追加した。これによって、どういう質問をすると、どのドキュメントがヒットするのか、関連度がどれくらいかが明らかになった。ドキュメント自体に問題がないかも確認しやすくなった。ドキュメント検索

Slide 38

Slide 38 text

みんなでチューニングできるようにしたドキュメントソースの設定画面を用意した。どのドキュメントソースを選択するか選んだり、検索時に算出される関連度スコア（-1.0~1.0）のベースラインを設定したり、生成AIが参照するドキュメントの数の調整ができる。この設定変更は他のユーザに影響しないようになっている。ドキュメント検索

Slide 39

Slide 39 text

みんなでチューニングできるようにしたシステムプロンプトも変更できるようにした。 • 共通のプロンプトと、 • 関連ドキュメントが見つかった時に、そのドキュメントをどう扱うか指示するためのプロンプト、の２種類が存在する。この設定変更は他のユーザに影響しないようになっている。プロンプト

Slide 40

Slide 40 text

AI活用ポイント① 対応実施生成AIが使えそうなところからやり始めるディレクションT SSG ClickUP更新担当アサイン依頼 (1) 詳細ヒアリング MTG/Slack DM調整 (2) 最終案内の整理問い合わせ元 ClickUP起票（自動）問い合わせ背景等のヒアリング技術T / アセスメントT 分類分けよくある質問「よくある質問」技術チームやアセスメントチームと協力して対応前提等のヒアリング担当アサイン詳細ヒアリング、ディスカッション案内事項の展開調査等で参照するもの ●DocBase ●過去ClickUP ●その他のドキュメント ●関連部署に問い合わせ AI活用ポイント② AI活用ポイント③ 回答（提案、案内）ポイント① よくある質問はドキュメントを事前に用意できるし、 AIが最も活用できる箇所ポイント② 会話するための一般的な予備知識の確認や、ヒアリング項目の洗い出しに利用ポイント③ 一般的なガイドラインや、社内ドキュメント等を参照し、AIと壁打ちをして、最終回答を作るまずは①にスコープを絞る全てを一撃で返そうとはせず AI活用ポイントを整理

Slide 41

Slide 41 text

ベクトルDBによるセマンティック検索は超高性能セマンティック検索とは、質問（自然言語）の意図や目的、文脈を読み取り、それらに近いドキュメントを検索する技術で、予想以上に性能が高いことが分かった 1200件以上のドキュメントから最も関連度の高いドキュメントを検索 SSG AI 質問者質問検索「Googleドライブを使って取引先とデータ共有できますか？」「スプシを使って取引先とデータ共有できますか？」「Googleドライブを使ってお客様とデータ共有できますか？」実際に３種類の質問はすべて同じドキュメントが検索された。多少の表記のゆらぎがあっても意図を理解してくれる。

Slide 42

Slide 42 text

生成される回答の品質に最も強く影響を受けるのはドキュメントだということが分かった生成AIは参考にすべきドキュメントが存在した場合には、その内容を組み込んで回答してくれるが、ドキュメント内の内容に誤りがあったり（例えばURLリンク切れとか）、ドキュメントに書かれていないことは回答できない。よくある質問をリストアップドキュメントを用意 AIに質問してテスト回答品質を評価テストプロセスコレ次第

Slide 43

Slide 43 text

ドキュメント自体もAIに作らせる既存のドキュメントがない場合は作成する必要があるが、ゼロから作成するのではなく、AIの力を借りることで効率化した。フォーマットを指定して、社内の過去のドキュメントからそれっぽいものを生成してくれる。実際に←のやりとりで作成されたドキュメントはほとんど問題なく、少し手直しする程度で完成した。

Slide 44

Slide 44 text

ドキュメント自体もAIに作らせる設定画面の関連度スコアや参照数を調整することでうまく作成してくれるようになった。フッターを見るとAIが様々な社内ドキュメントを参照していることが分かった。 MTG議事録などズバリという文章ではないものの中から情報をかき集め、目的のドキュメントをうまく作ってくれる

Slide 45

Slide 45 text

評価と改善のサイクルをまわす日々のお問合せ業務の裏で並行して、生成AIの回答をSlackの検証チャンネルに投稿して評価。週次MTGでフィードバックと改善のサイクルをまわす。日々のお問合せが飛んでくる検証チャンネルに飛ばす回答品質を３段階で評価する評価ログをS3に保存して Athenaで集計週次MTGでAIの回答品質を評価改善案を洗い出し生成評価分析改善

Slide 46

Slide 46 text

まとめ

Slide 47

Slide 47 text

本日のまとめ本日は生成AIをセキュリティの業務に導入した事例についてお話しました。 ● AIの技術が属人化の課題を改善するアプローチになる可能性 ● 生成AIを導入した２つの事例を紹介 ○ RISKENなどのセキュリティソリューションに生成AIを導入 ○ コンシェルジュAI（SSG AI）を開発し、コンサルティング業務など自動化が難しいプロセスにも導入 ● 生成AIを導入しても人間の仕事が無くなるということはなく、AIの品質評価や、ドキュメントの生成・品質担保等、今後どうメンテナンスしていくかを考える必要が出てくる

Slide 48

Slide 48 text

ご静聴ありがとうございました