Upgrade to Pro — share decks privately, control downloads, hide ads and more …

KB Orchestration for Customer

Avatar for Ryoma Shirakawa Ryoma Shirakawa
February 20, 2026
57

KB Orchestration for Customer

Avatar for Ryoma Shirakawa

Ryoma Shirakawa

February 20, 2026
Tweet

Transcript

  1. © 2025 Fujitsu Limited © 2025 Fujitsu Limited 1 第1回

    Japan AWS Jr. Champions Tech Ignite KB Orchestration for Customer ユーザー主導のRAGを実現する設計と実装 富士通株式会社 CEO室 DX Division 2025 Japan AWS Jr. Champions 白川 遼馬
  2. © 2025 Fujitsu Limited © 2025 Fujitsu Limited 1.自己紹介 2.導入

    3.発表の目的 4.RAG管理の問題 5.ソリューション概要 6.アーキテクチャ全体図 7.KB Pool の仕組み Agenda 8.Ingestion Job API による自動同期 9.データ分離戦略 10.KB 割り当てフロー 11.パフォーマンス比較 12.質疑応答
  3. © 2025 Fujitsu Limited © 2025 Fujitsu Limited 自己紹介 Shirakawa

    Ryoma 白川 遼馬 富士通株式会社 CEO室 DX Division コーポレートストラテジー Qiita https://qiita.com/srkwr ⚫ 業務内容 • 新規事業開発の推進 ⚫ コミュニティ活動 • Gov-JAWS • 富士通社内 AWSコミュニティ
  4. © 2025 Fujitsu Limited © 2025 Fujitsu Limited 導入 Amazon

    Bedrock Knowledge Base(KB) とは Amazon Bedrock Knowledge Baseを使用すると、会社のプライベー トデータソースからのコンテキスト情報を基盤モデルおよびエージェ ントに提供し、より正確で関連性の高い、カスタマイズされた応答を 生成できます
  5. © 2025 Fujitsu Limited © 2025 Fujitsu Limited 発表の目的 ユーザーが

    KB を管理するために、 どういう機能を提供すべきか? エンタープライズ環境における「自律的なRAG運用」を実現するための技術的アプローチ データ分離 複数ユーザーが混在する環境で、 セキュリティとアクセス制御を 担保した運用設計 性能 PoCで実装した内容を題材に、 スケーラビリティ について解説 運用 Bedrock KB × OpenSearch Serverlessで 「速い・安全・運用しやすい」 を両立させる実装パターン
  6. © 2025 Fujitsu Limited © 2025 Fujitsu Limited RAG管理の問題 データ分離の課題

    スケーラビリティの課題 運用管理の課題 データ混入のリスク 複数プロジェクト・複数ユーザーが同一 システムを利用する際、検索結果の混入 は許されない。 データアクセス制御 ユーザーごと、プロジェクトごとの厳密 な権限管理が必要不可欠。 KB作成待機時間 KBの動的作成には通常 かかる。 KB作成スパイク時の遅延 同時に複数プロジェクトが作成されると 待機時間が発生し、UXが悪化する。 手動同期の限界 ファイルアップロード後に手動でKB同期 を行うのは運用負荷が高い。 データ不整合 同期忘れにより、S3上のファイルと検索 結果に差異が生じるリスクがある。
  7. © 2025 Fujitsu Limited © 2025 Fujitsu Limited ソリューション概要 コア機能

    KB Pool方式 事前にKBをプールし、プロジェクト作成時に即座にアサイン。 自動同期 ファイルアップロードをトリガーに、取り込み(Ingestion)を自 動開始。ユーザー操作不要で最新化。 データ分離 プロジェクトごとにS3パスとメタデータを分離。マルチテナン ト環境でもデータの混入を防止。 ベクトル検索 主要サービス仕様 (Tech Stack) Amazon Bedrock Knowledge Base Embedding Model Titan Em bed Text v2 1024 Dimensions LLM Claude 3.5 Sonnet Max Tokens: 16k OpenSearch Serverless Vector Store Index TypeFixed Index (Shared) AlgorithmHNSW / Cosine CapabilityFiltering & Auto-scaling Serverless Backend App Layer Lambda DynamoDB API Gateway Cognito
  8. © 2025 Fujitsu Limited © 2025 Fujitsu Limited KB Pool

    の仕組み Pool Lifecycle KB POOL (Available) KB-01 KB-02 EventBridge Replenish Allocation (~1s) ACTIVE PROJECT KB-99 S3 Path Updated Sync Started Implementation Highlights StartIngestionJobによる事前同期 共通ナレッジはKB作成時に同期済みのため、割り当て後すぐに検索可能。 メタデータ分離 単一の固定インデックスを全KBで共有し、メタデータで論理的に分離。 リサイクル (Release) 削除時はデータをクリアしてプールへ返却し、コスト効率を最大化。
  9. © 2025 Fujitsu Limited © 2025 Fujitsu Limited KB Pool

    の仕組み Pool Lifecycle KB POOL (Available) KB-01 KB-02 EventBridge Replenish Allocation (~1s) ACTIVE PROJECT KB-99 S3 Path Updated Sync Started Implementation Highlights StartIngestionJobによる事前同期 共通ナレッジはKB作成時に同期済みのため、割り当て後すぐに検索可能。 メタデータ分離 単一の固定インデックスを全KBで共有し、メタデータで論理的に分離。 リサイクル (Release) 削除時はデータをクリアしてプールへ返却し、コスト効率を最大化。
  10. © 2025 Fujitsu Limited © 2025 Fujitsu Limited Ingestion Job

    API による自動同期 データ取り込みパイプライン詳細 1 S3 File Access Permissions: s3:GetObject, s3:ListBucket 2 Parsing & Chunking PDF/Word/Excel extraction -> Fixed-size chunks 3 Embedding Generation Model: Titan Embed Text v2 (1024 dims) 4 Vector Storage Target: OpenSearch Serverless (AOSS)
  11. © 2025 Fujitsu Limited © 2025 Fujitsu Limited パフォーマンス比較 99%

    Setup Time Reduction Speed 100% Auto-Synced Automation