Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
社内RAGの導入で気を付けたポイント
Search
やくも
May 20, 2026
Technology
170
3
Share
社内RAGの導入で気を付けたポイント
クラウド食堂 #8 ~クラウド初心者応援LT会~
https://cloud-shokudo.connpass.com/event/391531/
やくも
May 20, 2026
More Decks by やくも
See All by やくも
おいらのAWSアップデートの追い方〜Slack×AgentCore〜
yakumo
2
140
AgentCore Managed Harness を使ってみよう
yakumo
2
400
AgentCoreがWindowsで動かなかった原因を調べてみた
yakumo
1
97
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
400
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
2
580
なんとなくの実装を抜け出す!10分でおさらいするAgentCoreの認証・認可
yakumo
2
570
AWSと生成AIで学ぶ!実行計画の読み解き方とSQLチューニングの実践
yakumo
3
1.5k
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
200
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
5
3.8k
Other Decks in Technology
See All in Technology
OpenID Connectによるサービス間連携
takesection
0
160
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.8k
脅威をエンジニアリングの糧にして:恐怖を乗り越えた先にあったもの / Turn threats into fuel for engineering: what lay beyond overcoming fear
nrslib
1
380
サイバーセキュリティ概論 / Introduction to Cybersecurity
ks91
PRO
0
130
チームで実践する AI-DLC 思考の軌跡を残すチェックポイント設計
belongadmin
0
2.1k
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
240
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
140
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
230
Dynamic Workersについて
yusukebe
2
580
エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から
verypluming
3
340
oracle-to-databricks-migration-with-llm-and-dbt
casek
1
430
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
160
Featured
See All Featured
GitHub's CSS Performance
jonrohan
1033
470k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.3k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
310
The browser strikes back
jonoalderson
0
1.1k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Visualization
eitanlees
152
17k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
The SEO Collaboration Effect
kristinabergwall1
1
470
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
400
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
720
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Transcript
社内RAGを導入するまで気を付けたポイント 八雲 慎之助/Shinnosuke Yakumo 2026/5/19 クラウド食堂 #8
クラウド食堂、本日初めてお邪魔します!
八雲 慎之助(やくも しんのすけ) • 所属:株式会社クレスコ / JAWS-UG 新潟支部 • 業務:R&D(AI分野)
• AWS Community Builder – AI Engineering • 2025 Japan AWS Jr.Champions Who am I
アジェンダ •前提 •技術的制約について(話せる範囲で) •現状と今後のアーキテクチャ •技術選定の判断
まず出発点として…(今回はRAGの話だけど..) •チームや組織内に知見はありますか? •使用する技術の制約はありますか? •コスト等の条件は? →個人で検証するのとは違ってチームや組織によっ て条件は様々ありますよね…!
モデル選定 ー OpenAI互換のモデルを使いたい! え!?AWSのナレッジベースなのに OpenAI互換のモデルを使わないとい けないの? →OpenAIはfunction callingを利用 すればツールの選択ができます。
コストの最適化の検討 ー ベクトルストアの選択 • OpenSearchではなく基本的にS3 Vectorsを利用する。 • 9割近いコスト削減が可能 ※シナリオによる
リテラシー、ナレッジの蓄積の課題 • Bedrockに送ると情報全部見られるの? • マルチモーダルなRAGも作りたいなあ • 応答精度があんまし高くないんだよなあ.. • この他にも複数の課題が放置されている
今後(現在)の展望:RAG部分の再利用化
RAG部分の再利用化 hogehoge… この部分を…
RAG部分の再利用化 hogehoge… 切り出す!
RAG部分の再利用化 いろんなアプリから使いたい!
Bedrock AgentCoreの利用 •便利な機能がたくさんあるので飛びつきたくなるが •そもそも現状では組織内にナレッジ不足すぎる •正直RAG単体での実装でAgentCore Gatewayは オーバースペックかな… →メンバーのAgentCoreの知見を先にためていく
まとめ •流行りのAgentCoreもいいけど、慎重に技術選定を 行う •制約は前提として取り組む •RAG単発で終わらせずに、切り出すことで再利用を 見据えたアーキテクチャとする
告知とか
宣伝:JAWS-UG 新潟支部 BuilderCards 体験会 • 日時:2026/6/6(土) 13:30~17:30 • 会場:新潟駅 NINNO
3 A Room • Bulider Cards 体験会