Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今日からRAGを 始めることを考える
Search
shibuiwilliam
May 22, 2024
Technology
1.7k
3
Share
今日からRAGを 始めることを考える
https://mlops.connpass.com/event/315387/
shibuiwilliam
May 22, 2024
More Decks by shibuiwilliam
See All by shibuiwilliam
Rule repository
shibuiwilliam
3
30
LLM時代の検索アーキテクチャと技術的意思決定
shibuiwilliam
4
2.2k
Why Open Dataspacesのまとめ
shibuiwilliam
2
43
マルチモーダル非構造データとの闘い
shibuiwilliam
2
520
飽くなき自動生成への挑戦
shibuiwilliam
1
77
AIエージェントのメモリについて
shibuiwilliam
1
630
画像生成AIについて
shibuiwilliam
1
58
2026年はチャンキングを極める!
shibuiwilliam
9
2.3k
R&Dチームを起ち上げる
shibuiwilliam
1
250
Other Decks in Technology
See All in Technology
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
220
Directions Asia 2026 | Beyond Buildable AI Agents: Let’s Visualize Partner Value in the AI Era
ryoheig0405
0
120
O'Reilly Infrastructure & Ops Superstream: Platform Engineering for Developers, Architects & the Rest of Us
syntasso
0
310
分断された OT と IT を繋ぐ架け橋 -Kubernetes が切り拓く 産業用組み込み製品の現在地 -
yudaiono
1
130
AI-Assisted Contributions and Maintainer Load - PyCon US 2026
pauloxnet
1
190
論文紹介:Pixal3D (SIGGRAPH 2026)
tenten0727
0
610
Redmine次期バージョン7.0の注目新機能解説 — UI/UX強化と連携強化を中心に
vividtone
1
190
Cortex(Code) を ML モデルの 精度改善サイクルに組み込む.pdf
oimo23
0
250
R&D 祭 2024 アニメエフェクト作成の効率化
olmdrd
PRO
0
100
実践 TanStack Start ― 新規プロダクトを開発して確立した、サーバーとクライアント境界の設計パターン / Practical TanStack Start Server-Client Boundary Patterns
kaminashi
1
130
業務に残された「良くない型」で考える「TypeScriptの難しさ」
sajikix
2
690
【関西製造業祭り2026春】現場を変える技術はここまで来た〜世界最大の製造業見本市から持って帰ってきたもの〜
tanakaseiya
0
190
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
290
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
My Coaching Mixtape
mlcsv
0
130
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
180
Typedesign – Prime Four
hannesfritz
42
3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.9k
Abbi's Birthday
coloredviolet
2
7.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
BBQ
matthewcrist
89
10k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.4k
The World Runs on Bad Software
bkeepers
PRO
72
12k
Transcript
今日からRAGを 始めることを考える 2024/05/22
自己紹介 shibui yusuke • 文学修士→いろいろ → Stability AI Japan •
主にデータエンジニア • もともとクラウド基盤の開発、運用 • ここ7年くらいMLOpsとバックエンドとインフラと データ関連で仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • 最近の趣味:ルービックキューブ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2 • 本日の資料:
• 発売中! • https://www.amazon.co.jp/dp/4798173401/ • 発売中! • https://www.amazon.co.jp/dp/4798169447/
技術評論社Software & Designで MLOpsについて連載しました! • 2023年8月号 MLOpsの概要 • 2023年9月号 MLOpsのためのスキルセットとチーム構成
• 2023年10月号 方針策定とMLOpsのためのツール • 2023年11月号 MLOpsのための技術選定 • 2023年12月号 LLMのためのDevOps • 2024年1月号 MLOpsと評価 • 2024年2月号 推論システム(予定) • 2024年3月号 機械学習システムの引き継ぎ • 2024年4月号 LLMのデータエンジニアリング • 2024年5月号 機械学習の使い途と未来 MLOpsについてあまり他では取り上げられないテーマを 中心に記事を書きました!
RAGとは
RAGの流れ 検索 統合 生成 UI 今日の天 気を教えて 天気予報 を検索 集めた情
報を整理 文章生成 今日は晴れる でしょう🌞
実際には大体こんな感じ 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 UI
どこまで自作するか? 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 要自作 ロジックは 要自作 自作は 超大変 自作 不可能 検索Indexは要自作 検索基盤はOSS等を 使うことが多い プロンプトは 要自作 ワークフローの インテグレーションは??? UI ツール 次第
そもそもなにが目的? RAG不要 RAG必要 要検討 検索 コーディン グ補助 社内 情報 情報
整理 文章 要約 自動 応答 分析 最新の 情報で LLM RAGでは解決できなさそうなこと: 営業活動、社内調整、プレゼン、出張、 自分の意見を言う、家を買う、受験、 ボランティア、就職活動、世界平和 LLMに 相談 翻訳
簡単な課題を便利なツールで始めるのが良さそう • 簡単 ◦ Dify.ai • コーディングが必要 ◦ Langchain ◦
LlamaIndex • クラウドの知見が必要 ◦ AWS ◦ Azure ◦ GCP • LLMから自作 • そもそもRAGを使わない ◦ OpenAI ◦ Gemini ◦ Claude 簡単 拡張性
RAG LT大会を お楽しみください!