Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
10分で学ぶ、RAGの仕組みと実践
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Marimo
April 30, 2025
Technology
0
1.3k
10分で学ぶ、RAGの仕組みと実践
2025/4/24 CDLE北海道主催RAGを実装してみよう!ミニハンズオン会のセミナー資料です
Marimo
April 30, 2025
Tweet
Share
More Decks by Marimo
See All by Marimo
いま注目のAIエージェントを作ってみよう
supermarimobros
0
560
ゼロから学ぶ! MCP入門ハンズオン
supermarimobros
1
1k
Other Decks in Technology
See All in Technology
フルスタックGoでスコア改ざんを防いだ話
ponyo877
0
460
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
5
800
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
360
AWSが推進するAI駆動開発ライフサイクル入門 〜 AI駆動開発時代に必要な人材とは 〜/ introduction_to_aidlc_and_skills
fatsushi
5
3.1k
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
500
AIエージェントに必要なのはデータではなく文脈だった/ai-agent-context-graph-mybest
jonnojun
1
650
SchooでVue.js/Nuxtを技術選定している理由
yamanoku
3
7.9k
衛星画像即時マッピングサービスの実現に向けて
lehupa
1
280
Three-Legged OAuth in AgentCore Gateway
hironobuiga
1
110
ブログの作成に音声AIツールを使って音声入力しようとした話
smt7174
1
120
ZOZO.swift #2
zozotech
PRO
0
280
pool.ntp.orgに ⾃宅サーバーで 参加してみたら...
tanyorg
1
2.9k
Featured
See All Featured
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
150
30 Presentation Tips
portentint
PRO
1
240
What does AI have to do with Human Rights?
axbom
PRO
0
2k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
340
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
Navigating Team Friction
lara
192
16k
Fireside Chat
paigeccino
41
3.8k
Exploring anti-patterns in Rails
aemeredith
2
270
Darren the Foodie - Storyboard
khoart
PRO
3
2.5k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.4k
sira's awesome portfolio website redesign presentation
elsirapls
0
160
Transcript
RAGを実装してみよう!ミニハンズオン会 10分で学ぶ、RAGの仕組みと実践 CDLE北海道 池田広樹
自己紹介 池田 広樹 札幌市在住のエンジニア 大学時代に生化学分野で多変量解析を経験 代謝物の網羅的解析の分野 昨年、 「E資格チャレンジ」でE資格取得 その他、AIコンペのKaggleや松尾研LLM2024など に参加してます
①RAGの概要
①RAGの概要 LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます 池田広樹って何者? 問い合わせ(クエリ) DB 外部知識 池田広樹は札幌在住のエン ジニアで・・・
池田広樹はPython/Flutter が得意です・・ 関連した文章 検索部位 (Retriever) RAG (Retrieval-Augmented Generation: 検索拡張生成)
①RAGの概要 池田広樹は札幌在住のエン ジニアで・・・ 池田広樹はPython/Flutter が得意です・・ 関連した文章 池田広樹って何者? 以下の情報を参照して答えてく ださい 池田広樹は札幌在住のエン
ジニアで・・・ 池 田 広 樹 は Python/Flutter が得意です・・ 池田広樹は札幌在住 のエンジニアで、 Python/Flutterが得 意です。 生成部分 (Generation) RAG (Retrieval-Augmented Generation: 検索拡張生成) LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます
②検索部位(Retriever)
RAGは検索が重要 → どれだけ問い合わせ(クエリ)に関連した文章を見つけられるか ②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム) ... キーワード検索
単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 知識グラフ GraphRAG
②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム)... 意味的に似てる 意味的に似てない 池田広樹って何者? [0.0228, -0.1749,
0.1850, -0.1225, 0.1583, -0.6414, -0.0728, 0.6913] 埋め込みモデルによってベクトル変換 池田広樹は札幌在住のエンジニアで・・・ 池田広樹って何者? CDLE北海道では、北海道でAIに興味のある方々を・・・
②検索部位(Retriever) キーワード検索 単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 池田広樹って何者? [池田, 広樹, 何者] 池田広樹は札幌在住のエンジニアで・・・
[池田, 広樹, 札幌, 在住, エンジニア...] CDLE北海道では、北海道でAIに興味のある方々を・・・ [CDLE北海道, 北海道, AI, 興味, ある, 方々...] 単語が一致するほどスコアが高く、 珍しい単語はスコアが高い 高スコア 低スコア
③ハンズオンの流れ
③ハンズオンの流れ 1部:RAGの基本原理を学ぶ (30分) 埋め込みベクトルに触れる RAGの検索部分(Retriever)に触れる インデックス検索の基礎 キーワード検索の基礎 ハイブリット検索(インデックス検索とキーワード検索の融合)に触れる 2部:langchainを使って、実践的なRAGに触れる (20分)
Chunking: 文章を小さな単位(チャンク)に分割するプロセス langchainの「チェイン」を使ったRAGの構築 RAGの定量的な評価(RAGAS)
🎯 それでは実際に手を動かしてみましょう!