Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今日からRAGを 始めることを考える
Search
shibuiwilliam
May 22, 2024
Technology
2
1.4k
今日からRAGを 始めることを考える
https://mlops.connpass.com/event/315387/
shibuiwilliam
May 22, 2024
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
1
290
2024年生成AI新年会登壇資料
shibuiwilliam
0
210
Creative as Software Engineering
shibuiwilliam
2
540
Kubernetesクラスターを引き継ぐ技術
shibuiwilliam
3
220
機械学習システム構築実践ガイド
shibuiwilliam
1
730
GPT, Langchain, Faiss, FastAPIを組み合わせた Chat検索システム開発
shibuiwilliam
4
4.2k
機械学習を実用化するエンジニアリングスキル
shibuiwilliam
12
4.3k
Generative AIと検索を組み合わせた新たな体験の模索
shibuiwilliam
3
980
Machine learning system development
shibuiwilliam
1
420
Other Decks in Technology
See All in Technology
技術負債による事業の失敗はなぜ起こるのか / Why do business failures due to technical debt occur?
i35_267
0
190
データベース研修 分析向けSQL入門【MIXI 24新卒技術研修】
mixi_engineers
PRO
0
110
AIアシスタントの活用で品質の向上と開発ワークフローのスピードアップ
nagix
1
190
サービス開発を前に進めるために 新米リードエンジニアが 取り組んだこと / Steps Taken by a Novice Lead Engineer to Advance Service Development
nologyance
0
180
クラウド利用者の「責任」をどう果たす?AWSセキュリティ対策のススメ #AWSSummit
hiashisan
0
270
コンテナ・K8s研修 - 後半 Kubernetes 基礎&ハンズオン【MIXI 24新卒技術研修】
mixi_engineers
PRO
1
120
セキュリティ研修 Day1【MIXI 24新卒技術研修】
mixi_engineers
PRO
0
150
ギークの理想が7つ集まるエムスリーで夢を叶えよう - エムスリー株式会社
m3_engineering
1
260
RAGのサービスをリリースして1年3ヶ月が経ちました
segavvy
4
900
DDDにおける認可の扱いとKotlinにおける実装パターン / authorization-for-ddd-and-kotlin-implement-pattern
urmot
4
390
コンテナ・K8s研修 - 前半 コンテナ基礎・ハンズオン【MIXI 24新卒技術研修】
mixi_engineers
PRO
0
170
AWSで”最小権限の原則”を実現するための考え方 /20240722-ssmjp-aws-least-privilege
opelab
10
4.3k
Featured
See All Featured
Docker and Python
trallard
37
2.9k
Code Reviewing Like a Champion
maltzj
517
39k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
78
15k
Designing for humans not robots
tammielis
247
25k
The Straight Up "How To Draw Better" Workshop
denniskardys
229
130k
GitHub's CSS Performance
jonrohan
1026
450k
Adopting Sorbet at Scale
ufuk
71
8.8k
The World Runs on Bad Software
bkeepers
PRO
63
11k
Building Flexible Design Systems
yeseniaperezcruz
323
37k
Facilitating Awesome Meetings
lara
46
5.8k
Faster Mobile Websites
deanohume
303
30k
Imperfection Machines: The Place of Print at Facebook
scottboms
262
13k
Transcript
今日からRAGを 始めることを考える 2024/05/22
自己紹介 shibui yusuke • 文学修士→いろいろ → Stability AI Japan •
主にデータエンジニア • もともとクラウド基盤の開発、運用 • ここ7年くらいMLOpsとバックエンドとインフラと データ関連で仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • 最近の趣味:ルービックキューブ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2 • 本日の資料:
• 発売中! • https://www.amazon.co.jp/dp/4798173401/ • 発売中! • https://www.amazon.co.jp/dp/4798169447/
技術評論社Software & Designで MLOpsについて連載しました! • 2023年8月号 MLOpsの概要 • 2023年9月号 MLOpsのためのスキルセットとチーム構成
• 2023年10月号 方針策定とMLOpsのためのツール • 2023年11月号 MLOpsのための技術選定 • 2023年12月号 LLMのためのDevOps • 2024年1月号 MLOpsと評価 • 2024年2月号 推論システム(予定) • 2024年3月号 機械学習システムの引き継ぎ • 2024年4月号 LLMのデータエンジニアリング • 2024年5月号 機械学習の使い途と未来 MLOpsについてあまり他では取り上げられないテーマを 中心に記事を書きました!
RAGとは
RAGの流れ 検索 統合 生成 UI 今日の天 気を教えて 天気予報 を検索 集めた情
報を整理 文章生成 今日は晴れる でしょう🌞
実際には大体こんな感じ 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 UI
どこまで自作するか? 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 要自作 ロジックは 要自作 自作は 超大変 自作 不可能 検索Indexは要自作 検索基盤はOSS等を 使うことが多い プロンプトは 要自作 ワークフローの インテグレーションは??? UI ツール 次第
そもそもなにが目的? RAG不要 RAG必要 要検討 検索 コーディン グ補助 社内 情報 情報
整理 文章 要約 自動 応答 分析 最新の 情報で LLM RAGでは解決できなさそうなこと: 営業活動、社内調整、プレゼン、出張、 自分の意見を言う、家を買う、受験、 ボランティア、就職活動、世界平和 LLMに 相談 翻訳
簡単な課題を便利なツールで始めるのが良さそう • 簡単 ◦ Dify.ai • コーディングが必要 ◦ Langchain ◦
LlamaIndex • クラウドの知見が必要 ◦ AWS ◦ Azure ◦ GCP • LLMから自作 • そもそもRAGを使わない ◦ OpenAI ◦ Gemini ◦ Claude 簡単 拡張性
RAG LT大会を お楽しみください!