Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
10分で学ぶ、RAGの仕組みと実践
Search
Marimo
April 30, 2025
Technology
0
1.2k
10分で学ぶ、RAGの仕組みと実践
2025/4/24 CDLE北海道主催RAGを実装してみよう!ミニハンズオン会のセミナー資料です
Marimo
April 30, 2025
Tweet
Share
More Decks by Marimo
See All by Marimo
いま注目のAIエージェントを作ってみよう
supermarimobros
0
530
ゼロから学ぶ! MCP入門ハンズオン
supermarimobros
1
1k
Other Decks in Technology
See All in Technology
Next.js 16の新機能 Cache Components について
sutetotanuki
0
210
田舎で20年スクラム(後編):一個人が企業で長期戦アジャイルに挑む意味
chinmo
1
1.1k
ルネサンス開発者を育てる 1on1支援AIエージェント
yusukeshimizu
0
130
2025年の医用画像AI/AI×medical_imaging_in_2025_generated_by_AI
tdys13
0
300
AI駆動開発ライフサイクル(AI-DLC)の始め方
ryansbcho79
0
290
Oracle Cloud Infrastructure:2025年12月度サービス・アップデート
oracle4engineer
PRO
0
190
形式手法特論:コンパイラの「正しさ」は証明できるか? #burikaigi / BuriKaigi 2026
ytaka23
15
4k
Claude Codeを使った情報整理術
knishioka
20
12k
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
17k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.6k
ソフトウェアエンジニアとAIエンジニアの役割分担についてのある事例
kworkdev
PRO
1
360
松尾研LLM講座2025 応用編Day3「軽量化」 講義資料
aratako
15
4.9k
Featured
See All Featured
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
300
Producing Creativity
orderedlist
PRO
348
40k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
0
84
Designing for Timeless Needs
cassininazir
0
110
The agentic SEO stack - context over prompts
schlessera
0
580
Balancing Empowerment & Direction
lara
5
830
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
It's Worth the Effort
3n
187
29k
The Cult of Friendly URLs
andyhume
79
6.7k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.4k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
780
Transcript
RAGを実装してみよう!ミニハンズオン会 10分で学ぶ、RAGの仕組みと実践 CDLE北海道 池田広樹
自己紹介 池田 広樹 札幌市在住のエンジニア 大学時代に生化学分野で多変量解析を経験 代謝物の網羅的解析の分野 昨年、 「E資格チャレンジ」でE資格取得 その他、AIコンペのKaggleや松尾研LLM2024など に参加してます
①RAGの概要
①RAGの概要 LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます 池田広樹って何者? 問い合わせ(クエリ) DB 外部知識 池田広樹は札幌在住のエン ジニアで・・・
池田広樹はPython/Flutter が得意です・・ 関連した文章 検索部位 (Retriever) RAG (Retrieval-Augmented Generation: 検索拡張生成)
①RAGの概要 池田広樹は札幌在住のエン ジニアで・・・ 池田広樹はPython/Flutter が得意です・・ 関連した文章 池田広樹って何者? 以下の情報を参照して答えてく ださい 池田広樹は札幌在住のエン
ジニアで・・・ 池 田 広 樹 は Python/Flutter が得意です・・ 池田広樹は札幌在住 のエンジニアで、 Python/Flutterが得 意です。 生成部分 (Generation) RAG (Retrieval-Augmented Generation: 検索拡張生成) LLMが外部知識に基づき回答する技術 最新の知識を反映、ハルシネーションを抑えるなどの効果 検索部位(Retriever)と生成部位(Generation)に分かれます
②検索部位(Retriever)
RAGは検索が重要 → どれだけ問い合わせ(クエリ)に関連した文章を見つけられるか ②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム) ... キーワード検索
単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 知識グラフ GraphRAG
②検索部位(Retriever) インデックス検索 埋め込みベクトルの類似度・距離計算 コサイン類似度, ユークリッド距離(L2ノルム)... 意味的に似てる 意味的に似てない 池田広樹って何者? [0.0228, -0.1749,
0.1850, -0.1225, 0.1583, -0.6414, -0.0728, 0.6913] 埋め込みモデルによってベクトル変換 池田広樹は札幌在住のエンジニアで・・・ 池田広樹って何者? CDLE北海道では、北海道でAIに興味のある方々を・・・
②検索部位(Retriever) キーワード検索 単語の出現頻度に基づいて類似度を計算 TF-IDF, BM25 池田広樹って何者? [池田, 広樹, 何者] 池田広樹は札幌在住のエンジニアで・・・
[池田, 広樹, 札幌, 在住, エンジニア...] CDLE北海道では、北海道でAIに興味のある方々を・・・ [CDLE北海道, 北海道, AI, 興味, ある, 方々...] 単語が一致するほどスコアが高く、 珍しい単語はスコアが高い 高スコア 低スコア
③ハンズオンの流れ
③ハンズオンの流れ 1部:RAGの基本原理を学ぶ (30分) 埋め込みベクトルに触れる RAGの検索部分(Retriever)に触れる インデックス検索の基礎 キーワード検索の基礎 ハイブリット検索(インデックス検索とキーワード検索の融合)に触れる 2部:langchainを使って、実践的なRAGに触れる (20分)
Chunking: 文章を小さな単位(チャンク)に分割するプロセス langchainの「チェイン」を使ったRAGの構築 RAGの定量的な評価(RAGAS)
🎯 それでは実際に手を動かしてみましょう!