Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGの構築は脳死でやれ
Search
Asahi
June 11, 2025
0
100
RAGの構築は脳死でやれ
Asahi
June 11, 2025
Tweet
Share
More Decks by Asahi
See All by Asahi
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.1k
Cloudflareアップデート予想
asahiiwm
0
100
記事を書いた成功体験
asahiiwm
0
8
CloudflareStack でRAGに入門
asahiiwm
0
220
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
230
Featured
See All Featured
Speed Design
sergeychernyshev
32
1k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Become a Pro
speakerdeck
PRO
28
5.4k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
How GitHub (no longer) Works
holman
314
140k
Git: the NoSQL Database
bkeepers
PRO
430
65k
Side Projects
sachag
455
42k
4 Signs Your Business is Dying
shpigford
184
22k
Music & Morning Musume
bryan
46
6.6k
Bash Introduction
62gerente
614
210k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.9k
Transcript
RAGの構築は脳死でやれ あさひ
株式会社Gemcook あさひ(@asahiXXXXXXXXX) • 領域 ◦ バックエンド/インフラ • 運営
◦ TSKaigi ◦ Cloudflare Meet-up Tokyo ◦ AIAU • 好きなモノ ◦ Cloudflare ◦ Hono ◦ Devin ◦ Cursor, Windsurf 自己紹介
宣伝
• 会社が拡大期!! ◦ 一緒に働ける人を募集しています! ▪ フロントエンド ▪ バックエンド / インフラ
• お仕事の依頼もお待ちしております! ◦ 開発力不足でしたらお声がけください。
AutoRAG
• RAG構築の面倒なところをCloudflareで巻いてくれているも の。RAGに必要なCloudflare Stackのラップサービス。 • RAGの構築、RAGへの検索をフルマネージドにしてくれる サービス。 ◦ 厳密には内部でLLM生成する際にベクトル検索が必要 かは判断しているかも……
Cloudflare AutoRAGって?
通常のRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成
広義AutoRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成 検 索 が 必 要 か 判 断
Cloudflare AutoRAGって?
何が嬉しいの?
• 格段に簡単に構築できる、検索も容易 • 競合他社で似たようなことしようと思うともっと高額 ◦ AWS Bedrock KnowledgeBaseとか • テナント機能でリクエストに対しての出し分けが可能
◦ metadataを使って分類できる ◦ 部署ごとに参照データを分けることを想定 本来のRAGとの比較
設定 回答の生成 実装例
とはいえ…
• そもそも要件的にAutoRAGが求められるか? • エージェンティックなRAGの方が嬉しくない? ◦ tool callingでAgentが解決してくれる方が嬉しい ◦ MCPに組み込むとか? •
日本語への対応は…… とはいえ…
• 日本語への対応は…… ◦ 現状良くない。(あんままともなものはない) ▪ 軽量なモデルしか扱えない制約がある • LLM ◦ ない
• Embedding ◦ 多言語モデル:bge-m3 Workers AIの日本語について
• LLM ◦ shisa-v2-llama3.1-405b ▪ 上記はどう?って意見聞かれたやつ ◦ gemma-3n-E2B ▪ Google
I/Oで発表されたやつ このへんが採用されたら夢あり Workers AIの日本語について
まとめ
• RAGの構築が簡単、使うのも簡単 • AutoRAG自体はいいが用途が難しい • AutoRAGはAgents SDKと絡めて使うのが良さそう まとめ
ついで