Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGの構築は脳死でやれ
Search
Asahi
June 11, 2025
170
0
Share
RAGの構築は脳死でやれ
Asahi
June 11, 2025
More Decks by Asahi
See All by Asahi
そろそろCursorに戻ってきてもええんちゃう?
asahiiwm
1
960
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.3k
Cloudflareアップデート予想
asahiiwm
0
120
記事を書いた成功体験
asahiiwm
0
13
CloudflareStack でRAGに入門
asahiiwm
0
270
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
340
Featured
See All Featured
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
The Language of Interfaces
destraynor
162
26k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Deep Space Network (abreviated)
tonyrice
0
110
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
230
My Coaching Mixtape
mlcsv
0
97
Become a Pro
speakerdeck
PRO
31
5.9k
Designing for Timeless Needs
cassininazir
0
190
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
150
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
190
Speed Design
sergeychernyshev
33
1.6k
Ruling the World: When Life Gets Gamed
codingconduct
0
190
Transcript
RAGの構築は脳死でやれ あさひ
株式会社Gemcook あさひ(@asahiXXXXXXXXX) • 領域 ◦ バックエンド/インフラ • 運営
◦ TSKaigi ◦ Cloudflare Meet-up Tokyo ◦ AIAU • 好きなモノ ◦ Cloudflare ◦ Hono ◦ Devin ◦ Cursor, Windsurf 自己紹介
宣伝
• 会社が拡大期!! ◦ 一緒に働ける人を募集しています! ▪ フロントエンド ▪ バックエンド / インフラ
• お仕事の依頼もお待ちしております! ◦ 開発力不足でしたらお声がけください。
AutoRAG
• RAG構築の面倒なところをCloudflareで巻いてくれているも の。RAGに必要なCloudflare Stackのラップサービス。 • RAGの構築、RAGへの検索をフルマネージドにしてくれる サービス。 ◦ 厳密には内部でLLM生成する際にベクトル検索が必要 かは判断しているかも……
Cloudflare AutoRAGって?
通常のRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成
広義AutoRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成 検 索 が 必 要 か 判 断
Cloudflare AutoRAGって?
何が嬉しいの?
• 格段に簡単に構築できる、検索も容易 • 競合他社で似たようなことしようと思うともっと高額 ◦ AWS Bedrock KnowledgeBaseとか • テナント機能でリクエストに対しての出し分けが可能
◦ metadataを使って分類できる ◦ 部署ごとに参照データを分けることを想定 本来のRAGとの比較
設定 回答の生成 実装例
とはいえ…
• そもそも要件的にAutoRAGが求められるか? • エージェンティックなRAGの方が嬉しくない? ◦ tool callingでAgentが解決してくれる方が嬉しい ◦ MCPに組み込むとか? •
日本語への対応は…… とはいえ…
• 日本語への対応は…… ◦ 現状良くない。(あんままともなものはない) ▪ 軽量なモデルしか扱えない制約がある • LLM ◦ ない
• Embedding ◦ 多言語モデル:bge-m3 Workers AIの日本語について
• LLM ◦ shisa-v2-llama3.1-405b ▪ 上記はどう?って意見聞かれたやつ ◦ gemma-3n-E2B ▪ Google
I/Oで発表されたやつ このへんが採用されたら夢あり Workers AIの日本語について
まとめ
• RAGの構築が簡単、使うのも簡単 • AutoRAG自体はいいが用途が難しい • AutoRAGはAgents SDKと絡めて使うのが良さそう まとめ
ついで