Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
About RAG & Agent
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
oggata
November 02, 2024
Technology
110
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
About RAG & Agent
oggata
November 02, 2024
More Decks by oggata
See All by oggata
セルから世界へ ------Life Gameからパックマン、そしてWorld Modelまでの世界生成シミュレーション入門
oggata
0
390
MESAワールドモデルとマルチエージェントによる人間行動シミュレーション :仮想から現実世界への架け橋
oggata
0
27
ecological_niche_reward_function_v3
oggata
0
13
NextGen Chore
oggata
0
12
MESA_MINI_DINOv2_Pipeline
oggata
0
13
Self-Introduction
oggata
0
32
Gaming & PhisicalAI
oggata
0
68
savanna_sim.py
oggata
0
6
Beyond LLM:世界モデルが切り拓くフィジカルAIの時代
oggata
0
29
Other Decks in Technology
See All in Technology
チームで実践する AI-DLC 思考の軌跡を残すチェックポイント設計
belongadmin
0
3.2k
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
190
個人最適 から 全体最適 へ AI情報共有会・AIギルド・AI-DLC で進める カンリーの組織展開
rfdnxbro
0
2.1k
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
550
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
570
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
240
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
130
新規事業を牽引する技術選定 〜フルスタックTypeScript開発の実践事例〜
nullnull
3
380
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
150
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
1
1.5k
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
200
チームで進めるAI駆動アジャイル×ウォーターフォール
kumaiu
0
140
Featured
See All Featured
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Building the Perfect Custom Keyboard
takai
2
790
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.6k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
210
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Faster Mobile Websites
deanohume
310
31k
A designer walks into a library…
pauljervisheath
211
24k
Writing Fast Ruby
sferik
630
63k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Transcript
RAG & Agent Study Group
number of years it took for each product to gain
50 million users Airlines ... 68yrs Automobiles ... 62yrs Telephone ... 50yrs Credit Card ... 28yrs Television ... 22yrs ATM ... 18yrs Computer ... 14yrs CellPhone ... 12yrs Internet ... 7yrs Youtube ... 4yrs Facebook ... 3yrs Twitter ... 2yrs Pokemon Go 19days ChatGPT Sprints to One Million Users Netflix 3.5yrs Airbnb 2.5years Facebook 10month Dropbox 7month Spotify 5month ChatGPT 5days prompt LLM 2022.12 ChatGPT
RAG Agent prompt LLM LLM LLM memory tools reasoning prompt
prompt
RAG LLM prompt
Open Book/ Closed Book LLMがより正確な方法で質問に答えるために専門的な知識体系を構築
大規模言語モデル 検索システム Application 1.Question 3.Generation 2.Retrieval 4.Answer フルテキスト検索 ベクトル検索 セマンティック検索
ハイブリッド検索 Application Server Ochastrator About RAG(Retrieval Augmented Generation)
RDB VectorDB 製品事例 データ構造 最大サイズ データの種別 クエリの仕組み クエリタイプ Oracle MySQL
etc.. table 容量が増えると遅くなる 構造化データがメイン キーワード検索 テーブルjoin を使った 複雑なクエリも可能 Chroma Pinecorn Vector 容量が増えても遅くならない 非構造化データ(画像、動画、音声など) ベクトルの類似度 セマンティック検索、類似度検索が主 RDB / VectorDB
Word2Vec
(20,20) (22,18) (20,20) (20,20) (20,20) (3,25) C( , ) =
0.999 C( , ) = 0.754 Cos類似度
PPT テキストデータ チャンク分割 チャンク分割 チャンク分割 チャンク分割 Embeddingの生成に使用できるモデルでは、入力されるトークン数に上限があるため、トークン制限を上回るドキュメントの場合には、チャンク分割が 必要となってきます。 単にチャンク上限で分割するだけではなく、前後のチャンクでワードを20%程度被せるなど 工夫が一般的な方法となります。
Embedding
None
通常のRAGの場合…主人公の彼女は誰? = >回答できる ペンションで働いている人物を全員教えて => 回答できない(可能性がある) GraphRAG
[0.012,0,34,0.5,0.1956,0.345] GPT4o > Multimodal Vector Embeddings Vector Database Embedding Model
Image text video audio 都会の景色 林間学校 山登り
GPT4o
None
Agent LLM memory tools reasoning prompt
AI Agent ? 自律的にタスクをプランニングする 外部ツールを活用 実行結果をもとに、自身で行動を修正
Google Palm Say Can LLMは凄まじい成果を発揮しているが、推論(Chain of Thoughtなど)と行動(検索・計画 の生成などなど)については別テーマとして研究されてきた。本論文では、LLMを使用して推 論と行動の両者を活用し、2つの相乗効果を生む方法(ReAct)を提案する。 ReActを様々な言語タスクと意思決定タスクに適用し、効率性を実証する。具体的には、質
疑応答と事実検証においてWikipediaAPIを活用して種々の問題を克服する。更に、2つの対話 型の意思決定ベンチマーク(ALFWorldとWebShop)について、promptに1つか2つの例を入 れるのみで、模倣学習と強化学習に対して34%と10%の成功率の向上を上げた。 https://arxiv.org/abs/2210.03629 CoT & ReAct > Reasoning
None
google_search = GoogleSearchAPIWrapper() llm_math_chain = LLMMathChain(llm=llm, verbose=True) tools = [
Tool( name = "Google Search", func=google_search.run, description="最新の話題について答える場合に利用することができます。ま た、今日の日付や今日の気温、天気、為替レートなど現在の状況についても確認す ることができます。入力は検索内容です。" ), Tool( name="Calculator", func=llm_math_chain.run, description="計算をする場合に利用することができます。" ) ] agent = initialize_agent(tools, llm, agent="zero-shot-react-description", verbose=True) agent.run("レオナルド・ディカプリオの恋人は誰?そして彼女の年齢を0.43乗す ると何歳になる?") LangChain
iPaaS(Integration Platform as a Service)
レシピサイト->買い物->配送 プランニング->旅行サイト->チケット購入 Meal kit Delivery Agent Trip Adivisor Agent
None
None
None
GitHub Codespaces / GitHub Spark …
https://youtu.be/22wlLy7hKP4?si=lMps7Hq1C3g8KJRg Jesse Lyu - Founder and CEO - rabbit inc.