Slide 1

Slide 1 text

2025/12/11 re:Growth 2025 福岡 酒井 貴央 RAG/Agent開発のアップデートまとめ

Slide 2

Slide 2 text

⾃⼰紹介 2 ● 2023年11⽉ ○ クラスメソッド⼊社 ● 2024年10⽉〜  ○ ⽣成AIを中⼼に技術⽀援やプリセールスを担当 ● 部署 ○ クラウド事業本部コンサルティング部 ● 名前 ○ 酒井 貴央 ● 出⾝‧住まい ○ 神奈川 → 福岡 ● ブログ ○ DevelopersIO(酒井貴央) ● 好きな技術 ○ ⽣成AI全般

Slide 3

Slide 3 text

re:Invent 2025のRAG/Agent関連アップデートを広く浅く紹介します 1つでも「試してみたい」と思える機能が⾒つかれば嬉しい限りです 今⽇の⽬標 3

Slide 4

Slide 4 text

今⽇紹介するアップデート

Slide 5

Slide 5 text

今⽇紹介するアップデート 5 ● 2025-11-30 ○ Multimodal retrieval for Bedrock Knowledge Bases now generally available ● 2025-12-02 ○ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ○ Amazon S3 Vectors is now generally available with 40 times the scale of preview ○ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ○ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more ● 2025-12-03 ○ Announcing TypeScript support in Strands Agents (preview) and more

Slide 6

Slide 6 text

RAG

Slide 7

Slide 7 text

RAG関連のアップデート 7 ● 2025-11-30 ○ Multimodal retrieval for Bedrock Knowledge Bases now generally available ● 2025-12-02 ○ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ○ Amazon S3 Vectors is now generally available with 40 times the scale of preview ○ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ○ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more ● 2025-12-03 ○ Announcing TypeScript support in Strands Agents (preview) and more

Slide 8

Slide 8 text

Amazon Bedrock Knowledge Basesのマルチモーダル検索 8 マルチモーダル検索をサポート 画像‧⾳声‧動画に対応 処理⽅式は2種類から選択 ● Nova Multimodal Embeddings ○ ネイティブ形式を保持し直接埋め込 み ● Bedrock Data Automation (BDA) ○ テキスト表現に変換して埋め込み https://dev.classmethod.jp/articles/bedrock-kb- multimodal-search-ga/

Slide 9

Slide 9 text

Amazon OpenSearch Serviceの機能強化① 9 GPU acceleration ● インデックス構築速度が最⼤10倍向上 ● インデックスコストが1/4に削減 ● Serverless GPUが動的に起動、使⽤時 のみ課⾦ ● 対応バージョン ○ OpenSearch 3.1以降、Serverless collections https://dev.classmethod.jp/articles/20251203-am azon-opensearch-service-gpu-acceleration-auto- optimize/

Slide 10

Slide 10 text

Amazon OpenSearch Serviceの機能強化② 10 Auto-optimization ● k-NNアルゴリズム、量⼦化、エンジン 設定を⾃動評価 ● レイテンシとリコール要件を指定するだ けで最適化推奨を⽣成 ● 対応バージョン ○ OpenSearch 2.17以降、Serverless collections https://dev.classmethod.jp/articles/20251203-am azon-opensearch-service-gpu-acceleration-auto- optimize/

Slide 11

Slide 11 text

Amazon S3 Vectorsの機能強化と⼀般提供開始 11 スケールとパフォーマンスが向上 最⼤90%コスト削減可能 ● スケール ○ インデックスあたり最⼤20億ベクトル (プレビュー⽐40倍) ○ バケットあたり最⼤20兆ベクトル ○ クエリあたり最⼤100件(プレビュー: 30件) ● パフォーマンス ○ 書き込み: 1,000 PUT/秒 ○ クエリ遅延: 100ms〜1秒(⾼頻度ほど ⾼速) https://dev.classmethod.jp/articles/s3-vector-ga- tokyo-region-available-aws-reinvent/

Slide 12

Slide 12 text

Agent

Slide 13

Slide 13 text

Agent関連のアップデート 13 ● 2025-11-30 ○ Multimodal retrieval for Bedrock Knowledge Bases now generally available ● 2025-12-02 ○ Amazon OpenSearch Service adds GPU-accelerated and auto-optimized vector indexes ○ Amazon S3 Vectors is now generally available with 40 times the scale of preview ○ Amazon Bedrock AgentCore Runtime now supports bi-directional streaming ○ Amazon Bedrock AgentCore now includes Policy (preview), Evaluations (preview) and more ● 2025-12-03 ○ Announcing TypeScript support in Strands Agents (preview) and more

Slide 14

Slide 14 text

Amazon Bedrock AgentCore Runtimeが双⽅向ストリーミングに対応 14 従来の⼀⽅向レスポンス → 対話的な エージェントへ ● リアルタイム双⽅向通信を実現する WebSocketベースの機能 ● ユーザーとエージェントが同時に発話、 受信可能 ● 会話中の中断、訂正、⽅向転換をシーム レスに処理 ● コンテキストを維持したまま継続的な対 話が可能 ● ⾳声エージェント向けに最適化 https://dev.classmethod.jp/articles/bedrock-age ntcore-websocket-bidirectional-streaming/

Slide 15

Slide 15 text

Amazon Bedrock AgentCore Evaluations 15 Agentの挙動を継続的に評価‧モニタリ ング ● 13種類の組み込み評価指標とカスタム 評価が利⽤可能 ● LLM-as-a-Judgeによる⾃動評価 ● 評価タイプ ○ オンライン評価: 本番トラフィック を継続的に監視 ○ オンデマンド評価:特定のインタラ クションを対象 https://dev.classmethod.jp/articles/agentcore-ev aluations/

Slide 16

Slide 16 text

Policy in Amazon Bedrock AgentCore 16 ツールの呼び出しを制御 ● ⾃然⾔語またはCedar(AWS製オープン ソースポリシー⾔語)でポリシー作成 ● OAuthクレーム(JWT)とツール⼊⼒パ ラメータに基づくきめ細かいアクセス制 御 ● 2つの適⽤モード: LOG_ONLY(テスト ⽤)と ENFORCE(本番⽤) https://dev.classmethod.jp/articles/amazon-bedr ock-agentcore-policy-awsreinvent/

Slide 17

Slide 17 text

Amazon Bedrock AgentCore Memory エピソード記憶 17 過去の経験から学習し類似タスクに適⽤ ● 3ステップの処理パイプライ ○ Extraction: エピソード完了検出‧重 要情報抽出 ○ Consolidation: 構造化レコードへの 統合 ○ Reflection: パターン‧洞察の⽣成 https://dev.classmethod.jp/articles/amazon-bedr ock-agentcore-episodic-memory-strategy/

Slide 18

Slide 18 text

Strands Agents SDKのアップデート① 18 Strands Agents がTypeScriptをサポー ト ● ネイティブなTypeScript体験 ○ 型安全性 ○ async/await ○ Zodによる⼊⼒スキーマ検証 ● 多様な実⾏環境

Slide 19

Slide 19 text

Strands Agents SDKのアップデート② 19 Strands Agents SOPs ● マークダウン形式でStandard Operating Procedures(作業⼿順)を 定義 ● RFC 2119制約(MUST/SHOULD/MAY) で動作を精密制御 ● MCP / Claude Skills / Strands Agents な ど多様な環境で利⽤可能

Slide 20

Slide 20 text

Strands Agents SDKのアップデート③ 20 Strands Agents Steering ● 課題: プロンプトの肥⼤化 ○ 指⽰の無視やハルシネーションの発⽣ ● 解決策: 段階的開⽰(Progressive Disclosure) ○ 適切なタイミングでガイダンスを提供 ● SteeringAction ○ Proceed: そのまま実⾏ ○ Guide: キャンセル + フィードバック ○ Interrupt: ⼈間の⼊⼒待ち

Slide 21

Slide 21 text

Strands Agents SDKのアップデート④ 21 Strands Agents Evaluations ● Strands Agentsのサブパッケージとして 提供 ● ビルトインとカスタムメトリクス両対応 ● 使い分け ○ ⼿軽に始めたい ■ AgentCore Evals ○ ⾃由度が欲しい ■ Strands Agents Evaluations

Slide 22

Slide 22 text

エッジデバイスで⾳声会話エージェント 22 Strands Agents 双⽅向ストリーミング ● ユーザーとエージェントが同時に話せる ⾃然な会話 ● 割り込みを⾃動検出‧処理(VAD) ● 会話中にツール使⽤可能(並⾏実⾏) ● エッジデバイスサポート ○ llama.cppなどローカルモデル対応 ○ ⼩規模デバイスでの⾳声AI実⾏

Slide 23

Slide 23 text

まとめ

Slide 24

Slide 24 text

まとめ 24 ● RAG - ベクトル検索が速く‧安く‧簡単に ○ Amazon OpenSearch Service: GPU 10倍⾼速化 + Auto-optimization ○ Amazon S3 Vectors: 最⼤コスト90%削減、20億ベクトル ○ Amazon Bedrock KnowledgeBase: マルチモーダル対応(画像/⾳声/動画) ● AgentCore - 本番運⽤基盤が充実 ○ 双⽅向ストリーミング、評価、ポリシー、記憶 ● Strands Agents- OSSでより柔軟に ○ TypeScript対応 ○ SOP、Steering、評価、双⽅向ストリーミング

Slide 25

Slide 25 text

No content