Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
10分で学ぶ、RAGの仕組みと実践
Search
Marimo
April 30, 2025
Technology
0
1.1k
10分で学ぶ、RAGの仕組みと実践
2025/4/24 CDLE北海道主催RAGを実装してみよう!ミニハンズオン会のセミナー資料です
Marimo
April 30, 2025
Tweet
Share
More Decks by Marimo
See All by Marimo
ゼロから学ぶ! MCP入門ハンズオン
supermarimobros
1
880
Other Decks in Technology
See All in Technology
united airlines ™®️ USA Contact Numbers: Complete 2025 Support Guide
flyunitedhelp
1
470
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.2k
AWS 怖い話 WAF編 @fillz_noh #AWSStartup #AWSStartup_Kansai
fillznoh
0
130
AI Ready API ─ AI時代に求められるAPI設計とは?/ AI-Ready API - Designing MCP and APIs in the AI Era
yokawasa
8
2.3k
OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例 / SRE NEXT 2025
mackerelio
3
2k
[SRE NEXT] ARR150億円_エンジニア140名_27チーム_17プロダクトから始めるSLO.pdf
satos
5
3k
Autify Company Deck
autifyhq
2
44k
QuickSight SPICE の効果的な運用戦略~S3 + Athena 構成での実践ノウハウ~/quicksight-spice-s3-athena-best-practices
emiki
0
290
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
820
american aa airlines®️ USA Contact Numbers: Complete 2025 Support Guide
aaguide
0
500
shake-upを科学する
rsakata
7
1k
Data Engineering Study#30 LT資料
tetsuroito
1
200
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
47
9.6k
Visualization
eitanlees
146
16k
Writing Fast Ruby
sferik
628
62k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
970
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.9k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.5k
Gamification - CAS2011
davidbonilla
81
5.4k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Adopting Sorbet at Scale
ufuk
77
9.5k
Transcript
RAGを実装してみよう!ミニハンズオン会 10分で学ぶ、RAGの仕組みと実践 CDLE北海道 池田広樹
自己紹介 池田 広樹 札幌市在住のエンジニア 大学時代に生化学分野で多変量解析を経験 代謝物の網羅的解析の分野 昨年、 「E資格チャレンジ」でE資格取得 その他、AIコンペのKaggleや松尾研LLM2024など に参加してます
①RAGの概要
①RAGの概要 LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます 池田広樹って何者? 問い合わせ(クエリ) DB 外部知識 池田広樹は札幌在住のエン ジニアで・・・
池田広樹はPython/Flutter が得意です・・ 関連した文章 検索部位 (Retriever) RAG (Retrieval-Augmented Generation: 検索拡張生成)
①RAGの概要 池田広樹は札幌在住のエン ジニアで・・・ 池田広樹はPython/Flutter が得意です・・ 関連した文章 池田広樹って何者? 以下の情報を参照して答えてく ださい 池田広樹は札幌在住のエン
ジニアで・・・ 池 田 広 樹 は Python/Flutter が得意です・・ 池田広樹は札幌在住 のエンジニアで、 Python/Flutterが得 意です。 生成部分 (Generation) RAG (Retrieval-Augmented Generation: 検索拡張生成) LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます
②検索部位(Retriever)
RAGは検索が重要 → どれだけ問い合わせ(クエリ)に関連した文章を見つけられるか ②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム) ... キーワード検索
単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 知識グラフ GraphRAG
②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム)... 意味的に似てる 意味的に似てない 池田広樹って何者? [0.0228, -0.1749,
0.1850, -0.1225, 0.1583, -0.6414, -0.0728, 0.6913] 埋め込みモデルによってベクトル変換 池田広樹は札幌在住のエンジニアで・・・ 池田広樹って何者? CDLE北海道では、北海道でAIに興味のある方々を・・・
②検索部位(Retriever) キーワード検索 単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 池田広樹って何者? [池田, 広樹, 何者] 池田広樹は札幌在住のエンジニアで・・・
[池田, 広樹, 札幌, 在住, エンジニア...] CDLE北海道では、北海道でAIに興味のある方々を・・・ [CDLE北海道, 北海道, AI, 興味, ある, 方々...] 単語が一致するほどスコアが高く、 珍しい単語はスコアが高い 高スコア 低スコア
③ハンズオンの流れ
③ハンズオンの流れ 1部:RAGの基本原理を学ぶ (30分) 埋め込みベクトルに触れる RAGの検索部分(Retriever)に触れる インデックス検索の基礎 キーワード検索の基礎 ハイブリット検索(インデックス検索とキーワード検索の融合)に触れる 2部:langchainを使って、実践的なRAGに触れる (20分)
Chunking: 文章を小さな単位(チャンク)に分割するプロセス langchainの「チェイン」を使ったRAGの構築 RAGの定量的な評価(RAGAS)
🎯 それでは実際に手を動かしてみましょう!