Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Metric Learning入門
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
nishikimi
September 22, 2019
Research
4.7k
6
Share
Metric Learning入門
Metric Learningについて基礎的な内容とArcFaceについて内容をまとめた資料です。
nishikimi
September 22, 2019
Other Decks in Research
See All in Research
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
590
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
shunk031
4
900
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
220
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
正規分布と最適化について
koide3
0
150
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
170
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
130
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
180
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
570
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.6k
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
120
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
6
1.6k
Featured
See All Featured
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
270
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
190
Designing Powerful Visuals for Engaging Learning
tmiket
1
360
Design in an AI World
tapps
1
210
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
360
Building Applications with DynamoDB
mza
96
7k
Practical Orchestrator
shlominoach
191
11k
Technical Leadership for Architectural Decision Making
baasie
3
350
Balancing Empowerment & Direction
lara
6
1.1k
The Language of Interfaces
destraynor
162
26k
Unsuck your backbone
ammeep
672
58k
Transcript
Metric Learning入門 2019/9/25 Rev0
本資料の位置づけ ❏ 読者の想定: Deep LearningでCNNによる画像分類の知識があるが、 Metric Learningに関する知識がない方 ❏ 最終的には、原論文を読んで欲しいですが、 基礎となる情報をスライドにまとめました。
❏ 資料は今後修正&更新していく予定です。
解こうとしているタスク 犬 人 猫 Aさん Bさん Cさん 一般物体認識 (通常の画像分類) 特徴
1クラスあたりのデータ数が少ない より詳細な物体認識 (通常の画像分類) 過学習を起こしやすい
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ
metric learningの全体像 特徴量抽出器 (モデル) 学習時 利用時 ①同じクラスは 距離が近くなるように 学習 *実際には、n次元のベクトルです
②距離(類似度)を算出 検索したい データ 学習時には 1クラス複数枚の 画像が必要 利用時には 1クラス1枚の画像でも よい
metric learningの種類 siamese network triplet network L2 softmax network 発表年
2006年〜 2014年〜 2017年〜 入力形式 2つペアを入力 3つペアを入力 ペア無しで入力 モデルの 概要 ancher
L2 softmax networkの代表的なモデル ・CosFace ・SphereFace ・ArcFace ・AdaCos
ArcFace (列ごとに)正規化 正規化 ① を とみなす ②正解ラベルに対する のみ mのペナルティを与える ① ②
③ ③logitsの値が小さいので logitをs倍する
Toyデータでの結果
None
メリット・デメリット ・通常のクラス分類のモデルに拡張する形なので実装が容易 ・クラス数が多いとパラメータ数が多くなる。 ・(学習時になかった)新しいクラスのデータに対する 予測精度が低い メリット デメリット
ArcFaceのクラス化 ・正規化 ・arcCos ・+mのペナルティ ・s倍のスケール などの一連の処理をクラス化 https://github.com/4uiiurz1/pytorch-adacos
通常の分類モデル の後にmetricモデルの 処理をつなげる インスタンス化
活用できそうなケース ・商品検索 - 例:自動販売機のジュース、コンビニにあるタバコ - 新商品が発売されても、画像が1枚あれば対応可能 ・レコメンド(ランキング) - 例:洋服のECサイトで選択した商品に似たアイテムを表示
参考リンク ・Metric Learning 入門 https://copypaste-ds.hatenablog.com/entry/2019/03/01/164155 ・モダンな深層距離学習 (deep metric learning) 手法:
SphereFace, CosFace, ArcFace https://qiita.com/yu4u/items/078054dfb5592cbb80cc ・ArcFaceの論文 https://arxiv.org/abs/1801.07698 ・Pytorchの実装コード https://github.com/4uiiurz1/pytorch-adacos