Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini ...
Search
tsho
March 20, 2026
Technology
190
0
Share
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini Embedding 2 の紹介
Build with AI 2026 高松のイベント資料です
https://gdgshikoku.connpass.com/event/386377/
tsho
March 20, 2026
More Decks by tsho
See All by tsho
AI Agentにおける評価指標とAgent GPA
tsho
1
420
Scale SciPy with jax.shard_map - jax.shard_mapで SciPy をスケール
tsho
0
110
Developer Advocate / Community Managerなるには?
tsho
0
720
25/04/12 - Build with AI Hands-on Appendix
tsho
1
77
Unit testしてますか?
tsho
1
660
Other Decks in Technology
See All in Technology
OCI技術資料 : 証明書サービス概要
ocise
1
7.2k
バックオフィスPJのPjMをコーポレートITが担うとうまくいく3つの理由
yueda256
1
290
Strands Agents × Amazon Bedrock AgentCoreで パーソナルAIエージェントを作ろう
yokomachi
2
230
あるアーキテクチャ決定と その結果/architecture-decision-and-its-result
hanhan1978
2
520
Network Firewall Proxyで 自前プロキシを消し去ることができるのか
gusandayo
0
200
Podcast配信で広がったアウトプットの輪~70人と音声発信してきた7年間~/outputconf_01
fortegp05
0
230
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
77k
"まず試す"ためのDatabricks Apps活用法 / Databricks Apps for Early Experiments and Validation
nttcom
1
200
機能・非機能の学びを一つに!Agent Skillsで月間レポート作成始めてみた / Unifying Bug & Infra Insights — Building Monthly Quality Reports with Agent Skills
bun913
5
3.5k
建設的な現実逃避のしかた / How to practice constructive escapism
pauli
4
280
マルチモーダル非構造データとの闘い
shibuiwilliam
1
180
Microsoft Fabricで考える非構造データのAI活用
ryomaru0825
0
710
Featured
See All Featured
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
190
KATA
mclloyd
PRO
35
15k
Paper Plane (Part 1)
katiecoart
PRO
0
6.4k
Context Engineering - Making Every Token Count
addyosmani
9
800
New Earth Scene 8
popppiees
2
2k
Raft: Consensus for Rubyists
vanstee
141
7.4k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
68
38k
Mind Mapping
helmedeiros
PRO
1
140
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
94
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
Transcript
Build with AI, GDG 四国 エンベディングってなに?RAGってなに? エンベディングの説明と Gemini Embedding 2
の紹介
- Lead Developer Advocate @ Snowflake - ex-Google gTech Ads,
ML/Data - MLOps community 運営 (2020~) - Google Developer Expert, AI/ML - 事業会社などにて分析からML/AIの適用な どについて取り組む tsho / 田中 翔 (Sho Tanaka) Linkedin.com/in/tsho
エンベディング (Embedding) とは?
Source: xxxxx エンベディング(埋め込み) とは、テキストの意味を数値で表現したもので、AI が単語間の文脈や関連性を理解できるようにする技術です。 { 0.6, 0.8 } Dimensions
(次元)
Source: xxxxx “王様” { 0.6, 0.8 }
王様 女王様
王様 女王様 車
遠 い =似 てい ない 近 い =似 て い
る
エンベディングの 適用例とRAG
Source: xxxxx 文章内のすべての単語のエンベディングを 単純に平均化したい誘惑に駆られるかもし れませんが、単語の順序や文法を無視する ためあまり有用ではありません。なぜなら 「犬が人間を舐める」という文は、「人間が犬 を舐める」という文と同じではないからです。 Embeddings 文章には繊細なアプローチが必要
Source: xxxxx 大規模なデータセットでトレーニングされており、単語 間の複雑なパターンや関係性を理解することができま す。これらのモデルは、元の入力テキストのニュアンス や意味を正確に表現するエンベディングを生成するよ うに構築されています。 Embeddings Embedding models
dog licks man [0.47, …] [0.31, …] [0.96, …] subject verb object man licks dog [0.96, …] [0.31, …] [0.47, …] subject verb object is not
Source: xxxxx セマンティック検索 キーワードだけでなく、意味によって結果を見 つけます。(例:「夏の服」で検索すると、 「ショートパンツ」や「Tシャツ」が見つかりま す。) レコメンデーションエンジン 類似のアイテム、記事、または曲を提案しま す。(「これを読んだユーザーはこれも気に入り
ました」など。) クラスタリング & 分類 類似のドキュメントをグループ化したり、テキス トを自動的に分類したりします(例:サポートチ ケットを「請求」または「技術」に分類するな ど)。 Retrieval-Augmented Generation (RAG) 検索拡張生成 LLMを事実に根付かせ、「持ち込み可の試験 (オープンブック形式の試験)」を受けさせる。 Embeddings 適用例
Source: xxxxx Embeddings Retrieval-Augmented Generation (RAG) エンベディングモデルの支援を受けて検索さ れた外部情報に基づいてLLM(大規模言語モ デル)の回答を根拠づけることで、LLMを強化 します。
Source: xxxxx システム User モデル Response 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。 Prompt
2026/3月時点誰が 首相ですか? 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。
Source: xxxxx システム User モデル Response My knowledge cutoff was
March 2024, so... I don’t know. RAG system Embedding Model Database RAG system lookup request Prompt + RAG system function declarations RAG system response 2026/3月時点誰が 首相ですか? 高市さんです
チュートリアル
Source: xxxxx 高性能なテキストエンベディングを作成するため の、強力なホスト型モデルです。MRL(Matryoshka Representation Learning)機能を備えており、柔 軟な出力次元に対応し、より小さなエンベディング (1536、768)を含む3072次元のエンベディングを生 成します。 Embeddings
Gemini Embedding 2 Mar 10, 2026・hosted model ブログ: Gemini Embedding 2: Our first natively multimodal embedding model
Source: xxxxx Embeddings | Gemini Embedding 2 Embedding チュートリアル このチュートリアルでは、Gemini
Embedding 2を使用して、画 像、動画などの一連のベクトル化、類似度計算を確認していく チュートリアルです。 https://github.com/t sho/2026-bwai-ge mini-embeddings
Source: xxxxx Embeddings まとめ • エンベディングは、テキストのセマンティックな意味を数値で表現したも のです。 • RAGは、LLMを最新にし、事実に根付かせる (groundings)
強力な技 術です。 • Googleは、エンベディングに関する幅広いソリューションを提供してお り、特に Gemini Embedding 2が現在最新のソリューションです。
Build with AI Thank you