Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock で検索エージェントを再現しようとした話
Search
Naoki Yoshitake
September 17, 2025
Technology
3
470
Bedrock で検索エージェントを再現しようとした話
2025.09.17 JAWS-UG AI/ML #31:Generative AI / ML LT大会
Naoki Yoshitake
September 17, 2025
Tweet
Share
More Decks by Naoki Yoshitake
See All by Naoki Yoshitake
開発者から見たLLMの進化 202511
ny7760
1
220
開発者から見たLLMの進化
ny7760
2
87
re:Invent 2024 Keynoteに対する所感と考察 | My Take on the Keynote
ny7760
0
120
来年もre:Invent2024 に行きたいあなたへ - “集中”と“つながり”で楽しむ -
ny7760
1
1.2k
ロングコンテキストLLMにリポジトリを読み込ませてみる
ny7760
0
920
The Twelve-Factor App とクラウドアプリケーションのコスト
ny7760
4
720
re:Invent期間に発表されたCloudWatch Logsのアップデートを金融エンジニアの目線で試してみる
ny7760
1
1k
Other Decks in Technology
See All in Technology
ESXi のAIOps だ!2025冬
unnowataru
0
470
Redshift認可、アップデートでどう変わった?
handy
1
120
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
59k
First-Principles-of-Scrum
hiranabe
2
800
小さく、早く、可能性を多産する。生成AIプロジェクト / prAIrie-dog
visional_engineering_and_design
0
310
田舎で20年スクラム(後編):一個人が企業で長期戦アジャイルに挑む意味
chinmo
1
690
複雑さを受け入れるか、拒むか? - 事業成長とともに育ったモノリスを前に私が考えたこと #RSGT2026
murabayashi
0
890
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
110
Agentic AIが変革するAWSの開発・運用・セキュリティ ~Frontier Agentsを試してみた~ / Agentic AI transforms AWS development, operations, and security I tried Frontier Agents
yuj1osm
0
190
松尾研LLM講座2025 応用編Day3「軽量化」 講義資料
aratako
15
4.8k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
AI時代のアジャイルチームを目指して ー スクラムというコンフォートゾーンからの脱却 ー / Toward Agile Teams in the Age of AI
takaking22
8
2k
Featured
See All Featured
[SF Ruby Conf 2025] Rails X
palkan
0
660
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
71
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
130
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
Visualization
eitanlees
150
16k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
280
Rebuilding a faster, lazier Slack
samanthasiow
85
9.3k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
2
76
Mind Mapping
helmedeiros
PRO
0
45
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
300
Transcript
CONF ID ENTIA L 1 © 2025 Japan Digital Design,
Inc. Bedrock で検索エージェントを 再現しようとした話 Naoki Yoshitake 2025.09.17
2 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自己紹介 •
2023/11 JDD 入社 • Technical Project Manager • Bedrockを使ったRAGアプリの開発・運用 プロフィール • 2022 APN AWS Top Engineer • 『AWS認定資格試験テキスト AWS認定SysOpsアドミニスト レーター – アソシエイト』 • 『AWS vs Google Cloud アプリ開発七番勝負』 ※同人誌 出版等 Naoki Yoshitake 左後ろです
3 CONFIDENTIAL © 2024 Japan Digital Design, Inc. Japan Digital
Design株式会社 2017年10月2日 代表取締役 CEO 浜根 吉男 85名(2023年9月末時点) 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 社名 設立 代表者 従業員数 株主構成 会社概要
4 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫Agentic Workflow?
⚫自律型エージェント? 人によってイメージするものはさまざま 検索エージェントとは? 検索エージェントとは
5 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫個人的には ChatGPT
の GPT-5 Thinking(o3)が とても使える検索エージェント ⚫Bedrockでもこんなアプリを再現してみたいなあ… このLTではGPT-5 Thinkingをイメージ 検索エージェントとは
6 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/
7 CONFIDENTIAL © 2025 Japan Digital Design, Inc. gpt-oss ⚫
2025/8 にOpenAIがオープンウェイト モデルのgpt-ossを公開 ⚫ gpt-oss-120b / gpt-oss-20b ⚫ 推論タスクにも対応 ⚫ API も互換 ⚫ Bedrock, SageMaker JumpStart で利用可 ⚫ Bedrockでは2025/9/15時点で us-west-2(オレゴン)のみ BedrockでもGPTが使える https://aws.amazon.com/jp/blogs/news/openai-open-weight-models-now-available-on-aws/ OpenAIの検索エージェントの仕組みを学びながら Bedrockで同じようなことをやるには?と考えてみる
8 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 検索エージェント ⚫そのままAPIコールしてもChatGPTと
同じ動きにはならない ⚫ChatGPTとAPIでは挙動が異なる。 ⚫ このLTでは3つの挙動を再現してみる ⚫ 自律的に『思考』する ⚫ ツールを活用する ⚫ 推論プロセスが可視化される 『検索エージェント』の再現 ChatGPT からGPT-5 Thinkingを利用した画面
9 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 自律的に推論する ⚫
推論モデルはReasoning Token(推論 トークン)を使い『思考』する ⚫ APIでは思考の「深さ」をパラメータ で指定できる 自律的に『思考』する 推論で利用するパラメータ パラメータ 概要 reasoning.effort 推論の深さ。デフォルトはmedium。highを指定 するとより深く推論する reasoning.summary モデルが実行した推論プロセスの要約を出力する
10 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
ChatGPT上ではモデルが使えるツー ルが Built-in で提供されている ⚫ モデルは問題を解くために思考して、 自律的にツールを使うか判断する ⚫ LLMが苦手な問題に対応できる ⚫ 学習範囲外の知識を利用 ⚫ 計算問題をコードで解く 等 ツールを活用する GPTで使えるツール例 ツール例 概要 効果 Web Search インターネット検索の結果を 生成に利用できる 学習範囲外の情報をコンテキ ストに含められる File Search アップロードされたファイル 内を検索できる ファイル内の情報をコンテキ ストに含められる Code Interpreter 隔離された環境でモデルが コードを実行できる 計算問題など、LLMが苦手な 処理をコードで計算して回答 できる
11 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ツールを活用する ⚫
実行環境により3種類のツール ⚫ Built-in tools ⚫ MCP Tools ⚫ Function calls(Function calling) ⚫ モデルが自律的にツールを使うには、 Built-in tools か MCP Tools ⚫ Function calling ではクライアント側で明 示的に呼び出し処理が必要 ツールの様々な実行環境 ツール実行環境のイメージ クライアント LLMモデル リモートMCP Built-in tools MCP Tools Function calls OpenAI のサーバー サードパーティ等
12 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 推論プロセスが可視化される ⚫
SSE(Server-Sent Events)で様々な イベントが送られる ⚫ クライアント側でイベントをハンドリン グすれば、推論処理を可視化できる ⚫ エージェントのブラックボックス化防止 ⚫ ユーザーのUX向上 Stream応答ではイベントが発行 イベント例 イベントの発行タイミング reasoning_summary_text.done 推論の要約テキストの生成が完了した時 output_text.done モデルのテキスト回答が確定した時 completed モデルの応答が完了した時 GPTのイベント例 サンプルコード(carbon)
13 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
14 CONFIDENTIAL © 2025 Japan Digital Design, Inc. サンプルコードと実行結果 ※イベントのハンドリングは前ページ参照
同じことがBedrockのgpt-ossでもできたら 検索エージェントが作れるのでは…!
15 CONFIDENTIAL © 2025 Japan Digital Design, Inc. できませんでした
16 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock で gpt-oss を使う方法 ⚫ Bedrock API(Converse API 等) ⚫ OpenAI SDK ⚫ OpenAI の Responses AI は未対応 ⚫ 対応はChat Completions APIのみ ⚫ gpt-oss × Bedrock API (Converse API) で検証する必要あり ⚫ 統一的なAPIで呼び出す思想のため? ⚫ 個人的にはResponses APIにも対応して欲しい… Bedrockのgpt-ossは Responses API 未対応 https://docs.aws.amazon.com/bedrock/latest/userguide/inference-chat-completions.html Chat Completions APIの記載はある がResponses APIは無い
17 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html
18 CONFIDENTIAL © 2025 Japan Digital Design, Inc. Bedrock ×
gpt-oss の制約 ⚫ Bedrock AgentCore で Built-in toolsが 提供される ⚫ Code Interpreter ⚫ Browser Tool ⚫ Strandsを使えば簡単に呼び出し可能 ⚫ Web search のツールは未提供 ⚫ TavilyなどサードパーティAPIを使って、 toolとしてモデルに必要あり ※gpt-oss関係なくBedrock全般の話 ツール利用の考え方にも差異がある Strandsを使ったサンプルコード https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/code-interpreter-building-agents.html モデルに互換性があるからと言って安易に考えず Bedrockの考え方を理解する必要あり
19 CONFIDENTIAL © 2025 Japan Digital Design, Inc. ⚫便利な検索エージェントの仕組みを知ろう ⚫OpenAI,
Bedrock(+Anthropic )のAPI違いを知ると勉強になる ⚫Bedrock で gpt-oss 使うにはハードルあり ⚫次はBedrock × Claude で実装してみたい まとめ まとめ ※本日の内容は個人の見解に基づくものであり、所属企業を代表するものではありません。
20 CONFIDENTIAL © 2025 Japan Digital Design, Inc. おわりに ⚫本日の内容のほとんどは→の記事にも
書いています。 ⚫こちらも読んでみてください。 Qiitaやってます https://qiita.com/ny7760/items/ae4143b40cc1d594855b
Thank you. 21 CONFIDENTIAL © 2025 Japan Digital Design, Inc.