Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock で検索エージェントを再現しようとした話
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Naoki Yoshitake
September 17, 2025
Technology
3
500
Bedrock で検索エージェントを再現しようとした話
2025.09.17 JAWS-UG AI/ML #31:Generative AI / ML LT大会
Naoki Yoshitake
September 17, 2025
Tweet
Share
More Decks by Naoki Yoshitake
See All by Naoki Yoshitake
TechPM ってどんな仕事?
ny7760
0
150
開発者から見たLLMの進化 202511
ny7760
1
240
開発者から見たLLMの進化
ny7760
2
87
re:Invent 2024 Keynoteに対する所感と考察 | My Take on the Keynote
ny7760
0
120
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
1
1.2k
ロングコンテキストLLMにリポジトリを読み込ませてみる
ny7760
0
930
The Twelve-Factor App とクラウドアプリケーションのコスト
ny7760
4
730
re:Invent期間に発表されたCloudWatch Logsのアップデートを金融エンジニアの目線で試してみる
ny7760
1
1.1k
Other Decks in Technology
See All in Technology
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
0
590
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
フロントエンド開発者のための「厄払い」
optim
0
180
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
1
420
開発メンバーが語るFindy Conferenceの裏側とこれから
sontixyou
2
410
What happened to RubyGems and what can we learn?
mikemcquaid
0
130
IaaS/SaaS管理における SREの実践 - SRE Kaigi 2026
bbqallstars
2
690
システムのアラート調査をサポートするAI Agentの紹介/Introduction to an AI Agent for System Alert Investigation
taddy_919
1
1.1k
全員が「作り手」になる。職能の壁を溶かすプロトタイプ開発。
hokuo
1
640
DatabricksホストモデルでAIコーディング環境を構築する
databricksjapan
0
210
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
170
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
110
Featured
See All Featured
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
120
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
87
AI: The stuff that nobody shows you
jnunemaker
PRO
2
220
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
Practical Orchestrator
shlominoach
191
11k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
76
The Invisible Side of Design
smashingmag
302
51k
Building AI with AI
inesmontani
PRO
1
660
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
36k
Accessibility Awareness
sabderemane
0
45
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
120
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
900
Transcript
CONF ID ENTIA L 1 © 2025 Japan Digital Design,
Inc. Bedrock で検索エージェントを 再現しようとした話 Naoki Yoshitake 2025.09.17
2 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自己紹介 •
2023/11 JDD 入社 • Technical Project Manager • Bedrockを使ったRAGアプリの開発・運用 プロフィール • 2022 APN AWS Top Engineer • 『AWS認定資格試験テキスト AWS認定SysOpsアドミニスト レーター – アソシエイト』 • 『AWS vs Google Cloud アプリ開発七番勝負』 ※同人誌 出版等 Naoki Yoshitake 左後ろです
3 CONFIDENTIAL © 2024 Japan Digital Design, Inc. Japan Digital
Design株式会社 2017年10月2日 代表取締役 CEO 浜根 吉男 85名(2023年9月末時点) 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 社名 設立 代表者 従業員数 株主構成 会社概要
4 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫Agentic Workflow?
⚫自律型エージェント? 人によってイメージするものはさまざま 検索エージェントとは? 検索エージェントとは
5 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫個人的には ChatGPT
の GPT-5 Thinking(o3)が とても使える検索エージェント ⚫Bedrockでもこんなアプリを再現してみたいなあ… このLTではGPT-5 Thinkingをイメージ 検索エージェントとは
6 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/
7 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/ OpenAIの検索エージェントの仕組みを学びながら Bedrockで同じようなことをやるには?と考えてみる
8 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 検索エージェント ⚫そのままAPIコールしてもChatGPTと
同じ動きにはならない ⚫ChatGPTとAPIでは挙動が異なる。 ⚫ このLTでは3つの挙動を再現してみる ⚫ 自律的に『思考』する ⚫ ツールを活用する ⚫ 推論プロセスが可視化される 『検索エージェント』の再現 ChatGPT からGPT-5 Thinkingを利用した画面
9 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自律的に推論する ⚫
推論モデルはReasoning Token(推論 トークン)を使い『思考』する ⚫ APIでは思考の「深さ」をパラメータ で指定できる 自律的に『思考』する 推論で利用するパラメータ パラメータ 概要 reasoning.effort 推論の深さ。デフォルトはmedium。highを指定 するとより深く推論する reasoning.summary モデルが実行した推論プロセスの要約を出力する
10 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
ChatGPT上ではモデルが使えるツー ルが Built-in で提供されている ⚫ モデルは問題を解くために思考して、 自律的にツールを使うか判断する ⚫ LLMが苦手な問題に対応できる ⚫ 学習範囲外の知識を利用 ⚫ 計算問題をコードで解く 等 ツールを活用する GPTで使えるツール例 ツール例 概要 効果 Web Search インターネット検索の結果を 生成に利用できる 学習範囲外の情報をコンテキ ストに含められる File Search アップロードされたファイル 内を検索できる ファイル内の情報をコンテキ ストに含められる Code Interpreter 隔離された環境でモデルが コードを実行できる 計算問題など、LLMが苦手な 処理をコードで計算して回答 できる
11 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
実行環境により3種類のツール ⚫ Built-in tools ⚫ MCP Tools ⚫ Function calls(Function calling) ⚫ モデルが自律的にツールを使うには、 Built-in tools か MCP Tools ⚫ Function calling ではクライアント側で明 示的に呼び出し処理が必要 ツールの様々な実行環境 ツール実行環境のイメージ クライアント LLMモデル リモートMCP Built-in tools MCP Tools Function calls OpenAI のサーバー サードパーティ等
12 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 推論プロセスが可視化される ⚫
SSE(Server-Sent Events)で様々な イベントが送られる ⚫ クライアント側でイベントをハンドリン グすれば、推論処理を可視化できる ⚫ エージェントのブラックボックス化防止 ⚫ ユーザーのUX向上 Stream応答ではイベントが発行 イベント例 イベントの発行タイミング reasoning_summary_text.done 推論の要約テキストの生成が完了した時 output_text.done モデルのテキスト回答が確定した時 completed モデルの応答が完了した時 GPTのイベント例 サンプルコード(carbon)
13 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
14 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
同じことがBedrockのgpt-ossでもできたら 検索エージェントが作れるのでは…!
15 CONFIDENTIAL © 2025 Japan Digital Design, Inc. できませんでした
16 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock で gpt-oss を使う方法 ⚫ Bedrock API(Converse API 等) ⚫ OpenAI SDK ⚫ OpenAI の Responses AI は未対応 ⚫ 対応はChat Completions APIのみ ⚫ gpt-oss × Bedrock API (Converse API) で検証する必要あり ⚫ 統一的なAPIで呼び出す思想のため? ⚫ 個人的にはResponses APIにも対応して欲しい… Bedrockのgpt-ossは Responses API 未対応 https://docs.aws.amazon.com/bedrock/latest/userguide/inference-chat-completions.html Chat Completions APIの記載はある がResponses APIは無い
17 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html
18 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html モデルに互換性があるからと言って安易に考えず Bedrockの考え方を理解する必要あり
19 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫便利な検索エージェントの仕組みを知ろう ⚫OpenAI,
Bedrock(+Anthropic )のAPI違いを知ると勉強になる ⚫Bedrock で gpt-oss 使うにはハードルあり ⚫次はBedrock × Claude で実装してみたい まとめ まとめ ※本日の内容は個人の見解に基づくものであり、所属企業を代表するものではありません。
20 CONFIDENTIAL © 2025 Japan Digital Design, Inc. おわりに ⚫本日の内容のほとんどは→の記事にも
書いています。 ⚫こちらも読んでみてください。 Qiitaやってます https://qiita.com/ny7760/items/ae4143b40cc1d594855b
Thank you. 21 CONFIDENTIAL © 2025 Japan Digital Design, Inc.