Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini ...
Search
tsho
March 20, 2026
Technology
230
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini Embedding 2 の紹介
Build with AI 2026 高松のイベント資料です
https://gdgshikoku.connpass.com/event/386377/
tsho
March 20, 2026
More Decks by tsho
See All by tsho
AI Agentにおける評価指標とAgent GPA
tsho
1
480
Scale SciPy with jax.shard_map - jax.shard_mapで SciPy をスケール
tsho
0
140
Developer Advocate / Community Managerなるには?
tsho
0
780
25/04/12 - Build with AI Hands-on Appendix
tsho
1
89
Unit testしてますか?
tsho
1
670
Other Decks in Technology
See All in Technology
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
270
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
270
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
1.6k
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
0
300
AI駆動開発が変える、大規模開発の前提 ーHuman in the Loop から Human on the Loop へ / AIE2026
visional_engineering_and_design
30
22k
チームで実践する AI-DLC 思考の軌跡を残すチェックポイント設計
belongadmin
0
3.1k
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
270
Mastering Ruby Box
tagomoris
3
150
新規事業を牽引する技術選定 〜フルスタックTypeScript開発の実践事例〜
nullnull
3
370
Microsoft Build Keynoteふりかえり
tomokusaba
0
120
Chart.js が簡単に使えるようになっていたので OGP 画像生成に使った話
kamekyame
0
170
Agentic Web
dynamis
1
190
Featured
See All Featured
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
380
The Mindset for Success: Future Career Progression
greggifford
PRO
0
360
Large-scale JavaScript Application Architecture
addyosmani
515
110k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
71
40k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
940
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Design in an AI World
tapps
1
230
How GitHub (no longer) Works
holman
316
150k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
160
Transcript
Build with AI, GDG 四国 エンベディングってなに?RAGってなに? エンベディングの説明と Gemini Embedding 2
の紹介
- Lead Developer Advocate @ Snowflake - ex-Google gTech Ads,
ML/Data - MLOps community 運営 (2020~) - Google Developer Expert, AI/ML - 事業会社などにて分析からML/AIの適用な どについて取り組む tsho / 田中 翔 (Sho Tanaka) Linkedin.com/in/tsho
エンベディング (Embedding) とは?
Source: xxxxx エンベディング(埋め込み) とは、テキストの意味を数値で表現したもので、AI が単語間の文脈や関連性を理解できるようにする技術です。 { 0.6, 0.8 } Dimensions
(次元)
Source: xxxxx “王様” { 0.6, 0.8 }
王様 女王様
王様 女王様 車
遠 い =似 てい ない 近 い =似 て い
る
エンベディングの 適用例とRAG
Source: xxxxx 文章内のすべての単語のエンベディングを 単純に平均化したい誘惑に駆られるかもし れませんが、単語の順序や文法を無視する ためあまり有用ではありません。なぜなら 「犬が人間を舐める」という文は、「人間が犬 を舐める」という文と同じではないからです。 Embeddings 文章には繊細なアプローチが必要
Source: xxxxx 大規模なデータセットでトレーニングされており、単語 間の複雑なパターンや関係性を理解することができま す。これらのモデルは、元の入力テキストのニュアンス や意味を正確に表現するエンベディングを生成するよ うに構築されています。 Embeddings Embedding models
dog licks man [0.47, …] [0.31, …] [0.96, …] subject verb object man licks dog [0.96, …] [0.31, …] [0.47, …] subject verb object is not
Source: xxxxx セマンティック検索 キーワードだけでなく、意味によって結果を見 つけます。(例:「夏の服」で検索すると、 「ショートパンツ」や「Tシャツ」が見つかりま す。) レコメンデーションエンジン 類似のアイテム、記事、または曲を提案しま す。(「これを読んだユーザーはこれも気に入り
ました」など。) クラスタリング & 分類 類似のドキュメントをグループ化したり、テキス トを自動的に分類したりします(例:サポートチ ケットを「請求」または「技術」に分類するな ど)。 Retrieval-Augmented Generation (RAG) 検索拡張生成 LLMを事実に根付かせ、「持ち込み可の試験 (オープンブック形式の試験)」を受けさせる。 Embeddings 適用例
Source: xxxxx Embeddings Retrieval-Augmented Generation (RAG) エンベディングモデルの支援を受けて検索さ れた外部情報に基づいてLLM(大規模言語モ デル)の回答を根拠づけることで、LLMを強化 します。
Source: xxxxx システム User モデル Response 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。 Prompt
2026/3月時点誰が 首相ですか? 私は現時点で2025 3月までの知識しか 持っておりませんので回答できません。
Source: xxxxx システム User モデル Response My knowledge cutoff was
March 2024, so... I don’t know. RAG system Embedding Model Database RAG system lookup request Prompt + RAG system function declarations RAG system response 2026/3月時点誰が 首相ですか? 高市さんです
チュートリアル
Source: xxxxx 高性能なテキストエンベディングを作成するため の、強力なホスト型モデルです。MRL(Matryoshka Representation Learning)機能を備えており、柔 軟な出力次元に対応し、より小さなエンベディング (1536、768)を含む3072次元のエンベディングを生 成します。 Embeddings
Gemini Embedding 2 Mar 10, 2026・hosted model ブログ: Gemini Embedding 2: Our first natively multimodal embedding model
Source: xxxxx Embeddings | Gemini Embedding 2 Embedding チュートリアル このチュートリアルでは、Gemini
Embedding 2を使用して、画 像、動画などの一連のベクトル化、類似度計算を確認していく チュートリアルです。 https://github.com/t sho/2026-bwai-ge mini-embeddings
Source: xxxxx Embeddings まとめ • エンベディングは、テキストのセマンティックな意味を数値で表現したも のです。 • RAGは、LLMを最新にし、事実に根付かせる (groundings)
強力な技 術です。 • Googleは、エンベディングに関する幅広いソリューションを提供してお り、特に Gemini Embedding 2が現在最新のソリューションです。
Build with AI Thank you