Upgrade to Pro — share decks privately, control downloads, hide ads and more …

生成AIをセキュリティ業務に導入した話 / generative-ai for security operations

生成AIをセキュリティ業務に導入した話 / generative-ai for security operations

AWS Security and Risk Management Forumに登壇しました。(2024/03/19)
弊社で生成AIをセキュリティ業務に導入した事例を紹介しています。

資料中に登場するRISKENというツールは今後OSSとして公開しています。よかったら触ってみてください。

AWS Security and Risk Management Forum 2024: https://v2.nex-pro.com/campaign/63211/apply
元ネタ(ブログ): https://developers.cyberagent.co.jp/blog/archives/45548/
弊社リリース: https://www.cyberagent.co.jp/techinfo/news/detail/id=29960
RISKEN: https://github.com/ca-risken/doc

gassara-kys

March 19, 2024
Tweet

More Decks by gassara-kys

Other Decks in Technology

Transcript

  1. 課題② 非効率 人が変わり引き継ぎがうまくできないケースが多々発生し、 一から調査し直しが発生することがあり非効率な状態 後任 やりすぎな 担当者 引き継ぎ サプライ チェーン

    ID管理 サーバ 保守 ネットワ ーク設計 サプライ チェーン ID管理 サーバ 保守 ネットワ ーク設計 全てを引き継ぐ のは難しい
  2. 2023年の頭から積極的に生成AIを導入していった SSGではさまざまなセキュリティの業務に生成AIを導入していきました。 生成AIへの 期待感 時間 2023/3 2023/9 2023/12 今 RISKEN(OSS)で生成

    AIによる要約機能の実装 脅威検知の解析 に生成AIを導入 セキュリティのコンシ ェルジュAIを開発 様々な課題にぶち当 たり現実を知る💧
  3. RISKENの事例(仕組み) RISKENで検出した問題の一覧 RISKEN API CyberAgentではAWS上にRISKENサーバを ホストして、社内のエンジニアが自由に 使える環境を構築しています LLM 1 LLM

    2 *モデルは選択可能 Findingを クリック 日本語へ翻訳・ 内容の要約 *LLM サービスのAPI トークン🔑を設定することで 生成AI機能が利用できます
  4. RISKENの事例(導入した結果) RISKENに生成AIを導入して良かったことをまとめます • セキュリティの問題の理解度が上がり次のアクションへつながりやすくなった ◦ 優先度の判断の助けになった(リスク評価しやすい) ◦ 何をすべきかがより分かりやすくなった • RISKENが扱う様々なセキュリティスキャン結果(スキーマがバラバラ)

    との相性が良かった ◦ 複数のスキャリティのスキャン結果データ(JSON形式)を扱う ◦ どんなスキーマのデータでも良い感じに要約してくれる • 主に「要約」と「翻訳」の依頼のみなのでハルシネーションが発生しづらい
  5. セキュリティコンシェルジュ(SSG AI)の事例 SSGの人間 質問者 コンシェ ルジュAI ① セキュリティの質問 ➁ 事例をもとに回答する

    ③ 過去事例がない場合は SSGメンバーが対応 ③ ヒアリング・回答 ドキュメン トソース ④ ドキュメントに記録 ⑤ 取り込み (自動) 過去に解決済みの問題はAIに任せることができる。 また、実体験に基づいた説得力のある回答を 生成できる可能性がある。 次に同じような質問が来ても良いように ドキュメント化しておくことで、 結果的にSSGの負担を減らせる SSG AI
  6. セキュリティコンシェルジュ(SSG AI)の事例 ユーザ 「決済機能を実装したいんだけど、 セキュリティ上で気をつけること はありますか?」 ドキュメント 検索 関連ドキュメントを コンテキスト付与して

    生成AIに質問(RAG) API (ECSサービス) データソース (ECSタスク) ドキュメント 更新 クロール 「過去の対応履歴から以下の推 奨事項が見つかりました...」 セキュリティの質問 SSGが過去にまとめた文章や 対応履歴をもとに回答してくれる →非同期 フロント← ドキュメント お問合せ対応 脆弱性診断結果 データソース (社内ドキュメント) VectorDB (ECSサービス) 同期 EFS (Backup) ECSクラスター Amazon Bedrock
  7. セキュリティコンシェルジュ(SSG AI)の事例 コンポーネント AWSサービス 説明 API Amazon ECS WEBチャットやSlack、ClickUpからのリクエストを受け付ける APIエンドポイント。

    WEB Amazon ECS WEBチャットのフロントエンド。 VectorDB Amazon ECS 社内のドキュメントソースをセマンティック検索するための ベクトルDBサービス。QdrantというOSSを採用。 Embedding Amazon Bedrock ドキュメントソースの保存、検索時に利用するAPI。 Amazon Titanモデルを採用。 生成AI Amazon Bedrock 生成AIのAPI。日本語にも対応可能なClaude 3 Sonnetモデルを採用。 Input Token数が20万(200K)トークンと大きくRAGとの相性が良い。 データソースJOB Amazon ECS 非同期に外部のデータソースの取り込みや、VectorDBへの保存する ためのECSタスク。Lambdaのような時間的な制約はないのが良い。 ドキュメントソース Amazon S3 データソースの保存場所。
  8. セキュリティコンシェルジュ(SSG AI)の事例 コンポーネント AWSサービス 説明 API Amazon ECS WEBチャットやSlack、ClickUpからのリクエストを受け付ける APIエンドポイント。

    WEB Amazon ECS WEBチャットのフロントエンド。 VectorDB Amazon ECS 社内のドキュメントソースをセマンティック検索するための ベクトルDBサービス。QdrantというOSSを採用。 Embedding Amazon Bedrock ドキュメントソースの保存、検索時に利用するAPI。 Amazon Titanモデルを採用。 生成AI Amazon Bedrock 生成AIのAPI。日本語にも対応可能なClaude 3 Sonnetモデルを採用。 Input Token数が20万(200K)トークンと大きくRAGとの相性が良い。 データソースJOB Amazon ECS 非同期に外部のデータソースの取り込みや、VectorDBへの保存する ためのECSタスク。Lambdaのような時間的な制約はないのが良い。 ドキュメントソース Amazon S3 データソースの保存場所。
  9. 生成AIが回答を生成するまでのプロセス プロンプト ドキュメント検索 質問 回答 • 文脈に関連したドキュメントがヒットできたか? • 必要なドキュメントは収集・保存できているか? •

    ドキュメントの品質は問題ないか? • 最終的に正しい回答を生成できたか? • ハルシネーションはないか? • 正しく命令できているか? • 書き方によって回答が大きく変化することはあるか? • モデルの選択は適切か? • 聞き方は問題ないか? • 目的の回答を得るために十分な情報を含んでいるか? プロセス チェックポイント
  10. 生成AIが回答を生成するまでのプロセス プロンプト ドキュメント検索 質問 回答 • 最終的に正しい回答を生成できたか? • ハルシネーションはないか? •

    正しく命令できているか? • 書き方によって回答が大きく変化することはあるか? • モデルの選択は適切か? • 聞き方は問題ないか? • 目的の回答を得るために十分な情報を含んでいるか? コントロール可能な 範囲 • 文脈に関連したドキュメントがヒットできたか? • 必要なドキュメントは収集・保存できているか? • ドキュメントの品質は問題ないか? プロセス チェックポイント
  11. AI活用ポイント① 対応実施 生成AIが使えそうなところからやり始める ディレクションT SSG ClickUP更新 担当アサイン依頼 (1) 詳細ヒアリング MTG/Slack

    DM調整 (2) 最終案内の整理 問い合わせ元 ClickUP起票(自動) 問い合わせ 背景等のヒアリング 技術T / アセスメントT 分類分け よくある質問 「よくある質問」 技術チームやアセスメントチーム と協力して対応 前提等のヒアリング 担当アサイン 詳細ヒアリング、 ディスカッション 案内事項の展開 調査等で参照するもの •DocBase •過去ClickUP •その他のドキュメント •関連部署に問い合わせ AI活用ポイント② AI活用ポイント③ 回答(提案、案内) ポイント① よくある質問はドキュメントを 事前に用意できるし、 AIが最も活用できる箇所 ポイント② 会話するための一般的な予備知識 の確認や、ヒアリング項目の 洗い出しに利用 ポイント③ 一般的なガイドラインや、社内 ドキュメント等を参照し、AIと 壁打ちをして、最終回答を作る まずは①に スコープを絞る 全てを一撃で返そうとはせず AI活用ポイントを整理
  12. ベクトルDBによるセマンティック検索は超高性能 セマンティック検索とは、質問(自然言語)の意図や目的、文脈を読み取り、それらに近い ドキュメントを検索する技術で、予想以上に性能が高いことが分かった 1200件以上のドキュメントから 最も関連度の高いドキュメントを検索 SSG AI 質問者 質問 検索

    「Googleドライブを使って取引先とデータ共有できますか?」 「スプシを使って取引先とデータ共有できますか?」 「Googleドライブを使ってお客様とデータ共有できますか?」 実際に3種類の質問はすべて同じ ドキュメントが検索された。 多少の表記のゆらぎがあっても 意図を理解してくれる。
  13. 本日のまとめ 本日は生成AIをセキュリティの業務に導入した事例についてお話しました。 • AIの技術が属人化の課題を改善するアプローチになる可能性 • 生成AIを導入した2つの事例を紹介 ◦ RISKENなどのセキュリティソリューションに生成AIを導入 ◦ コンシェルジュAI(SSG

    AI)を開発し、コンサルティング業務など 自動化が難しいプロセスにも導入 • 生成AIを導入しても人間の仕事が無くなるということはなく、AIの品質評価や、 ドキュメントの生成・品質担保等、今後どうメンテナンスしていくか を考える必要が出てくる