Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGの構築は脳死でやれ
Search
Asahi
June 11, 2025
0
110
RAGの構築は脳死でやれ
Asahi
June 11, 2025
Tweet
Share
More Decks by Asahi
See All by Asahi
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.1k
Cloudflareアップデート予想
asahiiwm
0
100
記事を書いた成功体験
asahiiwm
0
9
CloudflareStack でRAGに入門
asahiiwm
0
230
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
250
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Docker and Python
trallard
45
3.5k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Art, The Web, and Tiny UX
lynnandtonic
301
21k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
The Pragmatic Product Professional
lauravandoore
35
6.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Transcript
RAGの構築は脳死でやれ あさひ
株式会社Gemcook あさひ(@asahiXXXXXXXXX) • 領域 ◦ バックエンド/インフラ • 運営
◦ TSKaigi ◦ Cloudflare Meet-up Tokyo ◦ AIAU • 好きなモノ ◦ Cloudflare ◦ Hono ◦ Devin ◦ Cursor, Windsurf 自己紹介
宣伝
• 会社が拡大期!! ◦ 一緒に働ける人を募集しています! ▪ フロントエンド ▪ バックエンド / インフラ
• お仕事の依頼もお待ちしております! ◦ 開発力不足でしたらお声がけください。
AutoRAG
• RAG構築の面倒なところをCloudflareで巻いてくれているも の。RAGに必要なCloudflare Stackのラップサービス。 • RAGの構築、RAGへの検索をフルマネージドにしてくれる サービス。 ◦ 厳密には内部でLLM生成する際にベクトル検索が必要 かは判断しているかも……
Cloudflare AutoRAGって?
通常のRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成
広義AutoRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成 検 索 が 必 要 か 判 断
Cloudflare AutoRAGって?
何が嬉しいの?
• 格段に簡単に構築できる、検索も容易 • 競合他社で似たようなことしようと思うともっと高額 ◦ AWS Bedrock KnowledgeBaseとか • テナント機能でリクエストに対しての出し分けが可能
◦ metadataを使って分類できる ◦ 部署ごとに参照データを分けることを想定 本来のRAGとの比較
設定 回答の生成 実装例
とはいえ…
• そもそも要件的にAutoRAGが求められるか? • エージェンティックなRAGの方が嬉しくない? ◦ tool callingでAgentが解決してくれる方が嬉しい ◦ MCPに組み込むとか? •
日本語への対応は…… とはいえ…
• 日本語への対応は…… ◦ 現状良くない。(あんままともなものはない) ▪ 軽量なモデルしか扱えない制約がある • LLM ◦ ない
• Embedding ◦ 多言語モデル:bge-m3 Workers AIの日本語について
• LLM ◦ shisa-v2-llama3.1-405b ▪ 上記はどう?って意見聞かれたやつ ◦ gemma-3n-E2B ▪ Google
I/Oで発表されたやつ このへんが採用されたら夢あり Workers AIの日本語について
まとめ
• RAGの構築が簡単、使うのも簡単 • AutoRAG自体はいいが用途が難しい • AutoRAGはAgents SDKと絡めて使うのが良さそう まとめ
ついで