Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CloudflareStack でRAGに入門
Search
Asahi
December 12, 2024
Programming
0
260
CloudflareStack でRAGに入門
Asahi
December 12, 2024
Tweet
Share
More Decks by Asahi
See All by Asahi
そろそろCursorに戻ってきてもええんちゃう?
asahiiwm
1
930
RAGの構築は脳死でやれ
asahiiwm
0
160
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.2k
Cloudflareアップデート予想
asahiiwm
0
120
記事を書いた成功体験
asahiiwm
0
10
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
340
Other Decks in Programming
See All in Programming
MDN Web Docs に日本語翻訳でコントリビュート
ohmori_yusuke
0
500
[AI Engineering Summit Tokyo 2025] LLMは計画業務のゲームチェンジャーか? 最適化業務における活⽤の可能性と限界
terryu16
2
340
dchart: charts from deck markup
ajstarks
3
960
PostgreSQLで手軽にDuckDBを使う!DuckDB&pg_duckdb入門/osc25hi-duckdb
takahashiikki
0
250
Unicodeどうしてる? PHPから見たUnicode対応と他言語での対応についてのお伺い
youkidearitai
PRO
0
580
Giselleで作るAI QAアシスタント 〜 Pull Requestレビューに継続的QAを
codenote
0
340
ThorVG Viewer In VS Code
nors
0
690
QAフローを最適化し、品質水準を満たしながらリリースまでの期間を最短化する #RSGT2026
shibayu36
1
2.2k
AI 駆動開発ライフサイクル(AI-DLC):ソフトウェアエンジニアリングの再構築 / AI-DLC Introduction
kanamasa
11
5.4k
Grafana:建立系統全知視角的捷徑
blueswen
0
290
0→1 フロントエンド開発 Tips🚀 #レバテックMeetup
bengo4com
0
490
SQL Server 2025 LT
odashinsuke
0
160
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
432
66k
Fireside Chat
paigeccino
41
3.8k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
290
The Limits of Empathy - UXLibs8
cassininazir
1
200
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
42
What's in a price? How to price your products and services
michaelherold
246
13k
Faster Mobile Websites
deanohume
310
31k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
Heart Work Chapter 1 - Part 1
lfama
PRO
5
35k
Designing for Timeless Needs
cassininazir
0
120
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
410
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
Transcript
CloudflareStackでRAGに入門 いわみ あさひ
• 自己紹介 • Cloudflare Stackについて • RAGについて • 構成 •
できたもの • 今後やってみたいこと • まとめ アジェンダ
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介 Zennで 週刊Cloudflare という記事を 毎週出しています。 Zenn: あさひ@asahi_iwm
Cloudflare Stack
• Cloudflare DeveloperのYoutubeで紹介されていた ◦ The Cloudflare Stack • どこかで説明されてるわけでは ないがCloudflareのサービスを
スタックとして理解 Cloudflare Stackって?
RAG
• RAG(Retrieval Augmented Generation) ◦ 事前情報を与えてそれを踏まえて回答を生成して くれるやつ ◦ 通常のLLMだとそのモデルが学習した時点まで の情報でしか回答を生成してくれない
RAGって何?
今回の構成
• Workers ◦ Hono ◦ Drizzle • Workers AI •
D1 • Vectorize 今回の構成
D1にナレッジを保存する コンテンツをベクトル化 ナレッジ(事前情報)を保存する流れ VectorizeにD1のIDと一緒に保存
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
回答を生成する流れ 質問をベクトルデータにする 類似するベクトルデータを探してナレッジを探す ナレッジをコンテキストとし AIに回答を生成させる
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
できたもの
• Demo ◦ めっちゃ簡単にやります できたもの
今後やってみたいこと
• AI Gatewayを使って日本語対応 ◦ Workers AIに日本語モデルがない… • Streamingレスポンス対応 • 画面を用意する
• D1以外の採用(KVとかR2) • RAGを活用して何かを作ってみる 今後やってみたいこと
まとめ
• Cloudflare Stackで RAGに入門することができた • 基礎的なRAGの仕組みは理解できた • 日本語対応モデルがないのが残念 まとめ