Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQuery と LangChainで実現するRAGパイプライン
Search
Kotaro
July 26, 2024
Technology
0
190
BigQuery と LangChainで実現するRAGパイプライン
機械学習の社会実装勉強会第37回の発表内容です。
https://machine-learning-workshop.connpass.com/event/324630/
Kotaro
July 26, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
Oracle Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
1
420
Agentic AIが変革するAWSの開発・運用・セキュリティ ~Frontier Agentsを試してみた~ / Agentic AI transforms AWS development, operations, and security I tried Frontier Agents
yuj1osm
0
100
[Data & AI Summit '25 Fall] AIでデータ活用を進化させる!Google Cloudで作るデータ活用の未来
kirimaru
0
4k
MySQLのSpatial(GIS)機能をもっと充実させたい ~ MyNA望年会2025LT
sakaik
0
130
AWSに革命を起こすかもしれない新サービス・アップデートについてのお話
yama3133
0
510
Snowflake導入から1年、LayerXのデータ活用の現在 / One Year into Snowflake: How LayerX Uses Data Today
civitaspo
0
2.5k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9.9k
『君の名は』と聞く君の名は。 / Your name, you who asks for mine.
nttcom
1
120
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
210
Connection-based OAuthから学ぶOAuth for AI Agents
flatt_security
0
390
オープンソースKeycloakのMCP認可サーバの仕様の対応状況 / 20251219 OpenID BizDay #18 LT Keycloak
oidfj
0
190
AgentCoreとStrandsで社内d払いナレッジボットを作った話
motojimayu
1
990
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
980
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
0
22
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
We Have a Design System, Now What?
morganepeng
54
7.9k
Paper Plane
katiecoart
PRO
0
44k
Scaling GitHub
holman
464
140k
Exploring anti-patterns in Rails
aemeredith
2
210
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
0
67
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
31
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
51
47k
How Software Deployment tools have changed in the past 20 years
geshan
0
30k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
200
Transcript
BigQuery と LangChain で実現する RAG パイプライン 2024/07/27 機械学習の社会実装勉強会 第37回
LLMの課題 Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs https://arxiv.org/abs/2312.05934
不正確な回答 トレーニングデータにない情報は知らない - 最新情報 - 機密情報 - … LLM ? RAG 追加の情報を外部ソースから与える ファインチューニング LLMを再学習させる LLMの知識を拡張させる方法 「昨日の東京の天気は?」
RAGとは RAG (Retrieval-Augmented Generation) - 外部データベースから関連する情報を検索(Retrieval) - 質問文を拡張(Augument) - それを基に回答を生成(Generation)
RAGの基本構造 社内文書等 Vector DB Embedding Embedding LLM 4. 質問文: 有給休暇は何日?
+ 参考情報: 有給休暇は20日 1. 質問文: 有給休暇は何日? 5. 回答文: 有給休暇は20日です 0. Vector DBに保存 3. 参考情報取得 2. ベクトル検索
RAGの基本構造 外部情報 ベクトル 6月23日は創立記念日 [0.3, 0.23, …] 開発部署の内線番号は 57 [0.2,
0.67, …] 有給休暇は年間20日 [0.4, 0.4, …] 社内文書等 Vector DB Embedding 0. Embedding した外部データをVector DBに保存 [0.3, 0.23, …] [0.1, 0.3, …] [0.3, 0.5, …] ... Store
RAGの基本構造 入力プロンプト (質問文) ベクトル 有給休暇は年間何日ですか? [0.3, 0.23, …] VectorDBの情報 入力プロンプトとの類似度
6月23日は創立記念日 [0.3, 0.23, …] 0.3 有給休暇は年間 20日 [0.2, 0.67, …] 0.8 開発部署の内線番号は57 [0.4, 0.4, …] 0.2 1. 質問文をEmbedding 2. ベクトル検索により類似度の高い文章を 3. 参考情報として取得
RAGの基本構造 入力プロンプト (質問文+参考情報 ) 有給休暇は年間何日ですか? 参考情報:有給休暇は年間 20日 LLMの回答 有給休暇は年間20日です。 4.
拡張した質問文を生成し 5.LLMの回答を得る
効率的な情報検索 必要な情報を外部データベースから検索し、最新の情報を提供する 計算リソースの節約 必要な情報を都度検索するため、すべての知識をモデルに持たせる必要がない RAGの利点 比較的低コストで信頼性の高い回答が期待できる
RAGの実装 (今回のデモ ) 1. VertexAIEmbeddingsを使用してテキストデータをembeddingする https://api.python.langchain.com/en/latest/embeddings/langchain_google_vertexai.embeddings.VertexAIEmbeddings.html 2. BigQueryVectorStoreを用いてBigQueryに格納する https://api.python.langchain.com/en/latest/bq_storage_vectorstores/langchain_google_community.bq_storage_vectorstores.bigquer y.BigQueryVectorStore.html
3. create_retrieval_chain で 一連のRetrieval の処理を実行する https://api.python.langchain.com/en/latest/chains/langchain.chains.retrieval.create_retrieval_chain.html 使用したNotebook: https://github.com/kootr/ml-study-session/tree/main/20240727_bq_rag_langchain 参考にした記事: https://cloud.google.com/blog/ja/products/ai-machine-learning/rag-with-bigquery-and-langchain-in-cloud ↑少しライブラリの情報が古いです
DEMO
課題 ベクトル検索の精度が回答品質に直結 - ドキュメントの適切な分割単位 - 誤字脱字・表記揺れ - 継続的なメンテナンス
まとめ - RAG は LLM の回答の精度を向上させる有用な手法 - ベクトル検索の精度を高めることが重要 - Langchain
で BigQuery を Vector DB として利用できる - RAG パイプラインを実現できる
Tutorial: ChatGPT Over Your Data (langchain) 検索拡張生成(RAG)とは (Google Cloud) 元論文
https://arxiv.org/pdf/2005.11401 サーベイ論文 https://arxiv.org/pdf/2312.10997v5 参考文献