Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CloudflareStack でRAGに入門
Search
Asahi
December 12, 2024
Programming
0
220
CloudflareStack でRAGに入門
Asahi
December 12, 2024
Tweet
Share
More Decks by Asahi
See All by Asahi
RAGの構築は脳死でやれ
asahiiwm
0
110
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.1k
Cloudflareアップデート予想
asahiiwm
0
100
記事を書いた成功体験
asahiiwm
0
9
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
230
Other Decks in Programming
See All in Programming
Select API from Kotlin Coroutine
jmatsu
1
230
ふつうの技術スタックでアート作品を作ってみる
akira888
0
450
ペアプロ × 生成AI 現場での実践と課題について / generative-ai-in-pair-programming
codmoninc
1
14k
WebViewの現在地 - SwiftUI時代のWebKit - / The Current State Of WebView
marcy731
0
110
Railsアプリケーションと パフォーマンスチューニング ー 秒間5万リクエストの モバイルオーダーシステムを支える事例 ー Rubyセミナー 大阪
falcon8823
5
1.1k
VS Code Update for GitHub Copilot
74th
2
620
チームのテスト力を総合的に鍛えて品質、スピード、レジリエンスを共立させる/Testing approach that improves quality, speed, and resilience
goyoki
3
440
Node-RED を(HTTP で)つなげる MCP サーバーを作ってみた
highu
0
120
たった 1 枚の PHP ファイルで実装する MCP サーバ / MCP Server with Vanilla PHP
okashoi
1
230
猫と暮らす Google Nest Cam生活🐈 / WebRTC with Google Nest Cam
yutailang0119
0
110
地方に住むエンジニアの残酷な現実とキャリア論
ichimichi
5
1.5k
すべてのコンテキストを、 ユーザー価値に変える
applism118
3
1.2k
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
How to Ace a Technical Interview
jacobian
277
23k
Docker and Python
trallard
44
3.5k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
GraphQLとの向き合い方2022年版
quramy
49
14k
Designing for humans not robots
tammielis
253
25k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Agile that works and the tools we love
rasmusluckow
329
21k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
Transcript
CloudflareStackでRAGに入門 いわみ あさひ
• 自己紹介 • Cloudflare Stackについて • RAGについて • 構成 •
できたもの • 今後やってみたいこと • まとめ アジェンダ
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介 Zennで 週刊Cloudflare という記事を 毎週出しています。 Zenn: あさひ@asahi_iwm
Cloudflare Stack
• Cloudflare DeveloperのYoutubeで紹介されていた ◦ The Cloudflare Stack • どこかで説明されてるわけでは ないがCloudflareのサービスを
スタックとして理解 Cloudflare Stackって?
RAG
• RAG(Retrieval Augmented Generation) ◦ 事前情報を与えてそれを踏まえて回答を生成して くれるやつ ◦ 通常のLLMだとそのモデルが学習した時点まで の情報でしか回答を生成してくれない
RAGって何?
今回の構成
• Workers ◦ Hono ◦ Drizzle • Workers AI •
D1 • Vectorize 今回の構成
D1にナレッジを保存する コンテンツをベクトル化 ナレッジ(事前情報)を保存する流れ VectorizeにD1のIDと一緒に保存
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
回答を生成する流れ 質問をベクトルデータにする 類似するベクトルデータを探してナレッジを探す ナレッジをコンテキストとし AIに回答を生成させる
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
できたもの
• Demo ◦ めっちゃ簡単にやります できたもの
今後やってみたいこと
• AI Gatewayを使って日本語対応 ◦ Workers AIに日本語モデルがない… • Streamingレスポンス対応 • 画面を用意する
• D1以外の採用(KVとかR2) • RAGを活用して何かを作ってみる 今後やってみたいこと
まとめ
• Cloudflare Stackで RAGに入門することができた • 基礎的なRAGの仕組みは理解できた • 日本語対応モデルがないのが残念 まとめ