PSIRTでAIテストを実施するまでの道のり

Slide 1

Slide 1 text

PSIRTでAIテストを実施するまでの道のりサイボウズ株式会社品質保証支援 PSIRT 小西達也 1

Slide 2

Slide 2 text

自己紹介 • 小西達也（こにしたつや） • 開発本部品質保証支援 Cy-PSIRT • 2020年にサイボウズ株式会社入社 • 担当 ◼ モバイル製品全般 ◼ AIに関わる製品 • 趣味: ◼ 読書、模型製作、筋トレ

Slide 3

Slide 3 text

©️ Cybozu, Inc. 世の中的に生成AIを活用した機能が盛り上がっている昨今 3

Slide 4

Slide 4 text

PSIRTでAIテストを実施するまでの道のりサイボウズでもAI機能の促進や提供開始 4 サイボウズ、「kintone AIアシスタント（仮称）」β版利用ユーザーの募集を開始 https://topics.cybozu.co.jp/news/2024/11/07-18881.html

Slide 5

Slide 5 text

PSIRTでAIテストを実施するまでの道のりサイボウズのPSIRTでもAIの対応が必要に！ • AIに関係するセキュリティテストや製品チームをサポートするための体制が必要になりプロジェクトを開始しました。 • チーム体制: 2名の少数体制 • 今回は、サイボウズでAI周りのテストをするためにどのように対応していったのかを3つ共有します。 5 テスト対応サポート対応知見収集と整理

Slide 6

Slide 6 text

©️ Cybozu, Inc. 知見収集と整理 6

Slide 7

Slide 7 text

©️ Cybozu, Inc. テストできるようにしたいが、 AIセキュリティがわからない状態だった。。。 7

Slide 8

Slide 8 text

PSIRTでAIテストを実施するまでの道のり AI周りのセキュリティについて情報収集と整理を実施 • OWASP Top10 for LLM Applicationsを活用 • https://genaisecurityproject.com/resource/owasp-top-10-for-llm- applications-2025/ • AIを取り巻く攻撃の種類や観点を理解し、テストするための知見を整理する目的で活用 • 活用の道のり: 1. 各章を読み、概要を整理 2. 擬似的なシステム図を元に攻撃の種類を整理 3. 整理したものから観点表を作成 4. テスト用のペイロード表の作成 8

Slide 9

Slide 9 text

PSIRTでAIテストを実施するまでの道のりシステム図を元に攻撃の種類を整理 • 擬似的なシステムを元にAIの攻撃を可視化 • 下記の観点で整理 • 攻撃のエントリポイントはどこか? ( ) • テストするべき点はどこか？ ( ) • どこに影響をもたらすか?( ) • 攻撃の種類や手法は何か？ (吹き出し) • AIを狙う攻撃の種類や観点を把握 9

Slide 10

Slide 10 text

PSIRTでAIテストを実施するまでの道のり攻撃観点表の作成 • 社内のテストで必要な項目のみに絞って、攻撃観点表を作成 • 下記の項目で整理 • 攻撃名 • 攻撃概要/攻撃手法 • 具体的な攻撃ペイロード • ターゲット • 何をされるのか(目的) • 防御策 10

Slide 11

Slide 11 text

PSIRTでAIテストを実施するまでの道のりテスト用ペイロード表の作成 • 各観点に合わせて調査を行い、テスト用のペイロード表を作成 11

Slide 12

Slide 12 text

PSIRTでAIテストを実施するまでの道のりその他の取り組み • やられアプリや外部トレーニングを受講し、実践的な知識を取得 • テスト方法を整理して社内DBで一元管理 12

Slide 13

Slide 13 text

©️ Cybozu, Inc. テスト対応 13

Slide 14

Slide 14 text

PSIRTでAIテストを実施するまでの道のりパターン1 パターン2 ・・・パターンN AIテストでの問題 • AIのテストは自然言語かつ表現によって結果に変化が発生する。 • 闇雲にやると膨大なテストパターンが必要となり、多くのリソースと時間がかかる。 • リスクを明確化し、重視したいテストを絞る必要がある。 14 リスク1 リスク１の方が影響度が大きいので重点的にやるテストが膨大で終わらない。。。パターン1 パターン2 ・・・パターンN リスク2 パターン1 パターン2 ・・・パターンN リスク1 パターン1 パターン2 ・・・パターンN リスク2

Slide 15

Slide 15 text

PSIRTでAIテストを実施するまでの道のり製品チームとの連携 • リスクの優先度や必要なテストを絞るために製品チームと連携 • 週に数回テストに向けての打ち合わせを実施 • 打ち合わせの中で以下の内容を確認 • 実装された機能の仕様確認 • 想定されるリスクと優先度の決定 • テスト項目の選定 • テスト期間の設定 15

Slide 16

Slide 16 text

PSIRTでAIテストを実施するまでの道のりテスト実施までの連携対応フローの例 16 PSIRT 製品チーム仕様書 1.仕様書を元に製品チームへヒアリングを実施 PSIRT 2.システム図からリスクの洗い出しとテストプランの作成テストプランを作成洗い出し [リスク1] [リスク2] 影響を受ける部分説明質問

Slide 17

Slide 17 text

PSIRTでAIテストを実施するまでの道のりテスト実施までの連携対応フローの例 17 PSIRT 製品チーム 3. 洗い出したリスクとテストプランを元に製品チームとテストが必要な項目を選定 4.選定した内容を元にテスト実施テスト実施 [リスク1] [リスク2] テストプランリスク1は設定から発生しないはずなので優先度が低いリスク2は重点的に見て欲しい 2.確認 1.共有テストプラン 3.修正テスト環境 PSIRT メモメモ

Slide 18

Slide 18 text

PSIRTでAIテストを実施するまでの道のりテスト実施時の取り組み • テストの終了条件としてゴールを設定する • AIのテストはペネトレーションテストに近い • 自然言語を扱うため、網羅性を担保しづらく終わりがない • 下記の手段を利用し、設定したゴールを達成できるか確認 • ペイロード表を参考にしつつ、機能に合わせた言い方の変更 • LLMの回答結果を元に文章の追加や変更 • 攻撃テクニックの利用 18 1. ゴールの設定 2.様々な手段を利用し、ゴールを達成できるかを確認プロンプトインジェクション経由で権限のない情報が漏洩しないかペイロード表・言い方の変更・文章の追加や変更・攻撃テクニック

Slide 19

Slide 19 text

PSIRTでAIテストを実施するまでの道のりテスト時に注意していること • テスト範囲の設定 • プラットフォームやLLM自体へのテストにならないように工夫 • DoSを引き起こすような攻撃などをテストの対象外にしている • テストでの記録を徹底 • 気になる挙動は画像や動画で残す • AIの挙動は再現性が低く、同じ手順でも再現しなくなるため 19

Slide 20

Slide 20 text

Slide 21

Slide 21 text

PSIRTでAIテストを実施するまでの道のり社内でのAIセキュリティのサポート活動 • 社内のAI関係チームと連携を強化 • AIに関する情報を共有 • AIセキュリティに関する窓口対応 • 社内メンバーへの勉強会の実施 • AIのセキュリティリスクについて解説 • OWASP Top10 for LLM Applications 2025の解説 • PSIRT内での勉強会の実施 • AIの基礎からAIのセキュリティリスクについて解説 • AIセキュリティに関する実践的なトレーニングの実施 21

Slide 22

Slide 22 text

PSIRTでAIテストを実施するまでの道のり対応する上で苦労した点と解決策 • AIセキュリティに関する情報の整理と理解 • 過渡期であるため、全体像を把握するのが難しい => [解決策] OWASP Top10 for LLM Applicationsを利用 • AIの社内でのテスト方法の検討 • 膨大なパターンがある中でどうやって対応するか? • テストの進め方や終了条件をどうするか？ => [解決策] 製品チームとの連携による選定やゴールの設定によるテスト 22

Slide 23

Slide 23 text

PSIRTでAIテストを実施するまでの道のり今後の改善 • AIのテストや評価に関わる基準を検討・定義 • AIのテストでの試行回数に関する基準 • 脆弱性の判断や評価に関する基準 • テスト手法の向上 • テスト手法のアップデート • 自動化ツールの利用の検討 • 製品チームとの連携の強化 • 社内向けにAIセキュリティについて知ってもらうための活動を実施 23

Slide 24

Slide 24 text

PSIRTでAIテストを実施するまでの道のりツールの紹介 • プロンプトの堅牢化をチェックするツールを公開しています。 • Prompt Hardener: https://github.com/cybozu/prompt-hardener • 弊社でAI担当をされている湯浅さんと北村さんが開発されています。 • CODE BLUE 2024のCyberTAMAGOでも発表されました。 • 発表に関して、弊社のブログ記事で公開しています。 • CODE BLUE 2024参加レポート https://blog.cybozu.io/entry/2025/01/15/080000 24

Slide 25

Slide 25 text

ご清聴いただき、ありがとうございました！ 25