Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Ensemble Feature for Person Re-Identification
Search
Masanori YANO
April 19, 2019
Science
1
550
Ensemble Feature for Person Re-Identification
論文LT会で作成したPerson Re-Identification論文の説明資料です。
Masanori YANO
April 19, 2019
Tweet
Share
More Decks by Masanori YANO
See All by Masanori YANO
Novelty Detection Via Blurring
msnr
0
370
Y-Net: Joint Segmentation and Classification for Diagnosis of Breast Biopsy Images
msnr
0
450
Pyramid-Based Fully Convolutional Networks for Cell Segmentation
msnr
0
400
Free-Form Image Inpainting with Gated Convolution
msnr
0
780
Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised Anomaly Detection
msnr
0
540
Move Evaluation in Go Using Deep Convolutional Neural Networks
msnr
1
740
AlphaX: eXploring Neural Architectures with Deep Neural Networks and Monte Carlo Tree Search
msnr
0
1.1k
Towards Understanding Chinese Checkers with Heuristics, Monte Carlo Tree Search, and Deep Reinforcement Learning
msnr
0
390
SRCNN: Image Super Resolution Using CNN
msnr
0
470
Other Decks in Science
See All in Science
遺伝子発現プロファイルに基づく新しい薬物間相互作用予測法
tagtag
0
100
Machine Learning for Materials (Lecture 3)
aronwalsh
0
820
統計的因果探索の方法
sshimizu2006
0
850
ABEMAの効果検証事例〜効果の異質性を考える〜
s1ok69oo
3
1.5k
Cross-Media Information Spaces and Architectures (CISA)
signer
PRO
3
24k
勉強会資料 / “Asymptotic Statistics” Section 2.1
asymptotic_minato
0
210
Design of three-dimensional binary manipulators based on the KS statistic and maximum empty circles (IECON2023)
konakalab
0
220
Introduction to Graph Neural Networks
joisino
4
1.3k
論文を批判的に読むときのチェックリスト
koro485
1
22k
名古屋市立大学データサイエンス学部 秋のオープンキャンパス模擬授業20231111
trycycle
1
1.1k
How we developed a data exchange format: Lessons learned from Camtrap DP
peterdesmet
1
140
Machine Learning for Materials (Lecture 9)
aronwalsh
0
120
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
330
56k
StorybookのUI Testing Handbookを読んだ
zakiyama
10
4.5k
Code Reviewing Like a Champion
maltzj
513
39k
Side Projects
sachag
451
41k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
272
12k
The Cost Of JavaScript in 2023
addyosmani
13
3.8k
Facilitating Awesome Meetings
lara
40
5.6k
YesSQL, Process and Tooling at Scale
rocio
161
13k
Building Adaptive Systems
keathley
29
1.8k
The Illustrated Children's Guide to Kubernetes
chrisshort
28
46k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
225
51k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
74
41k
Transcript
画像処理&機械学習 論文LT会 #1 Ensemble Feature for Person Re-Identification 2019年4月19日(金) 矢農
正紀 (Masanori YANO)
論文 2 Ensemble Feature for Person Re-Identification 論文のURL: https://arxiv.org/abs/1901.05798 ⇒
Person Re-IdentificationのタスクでSOTAと主張 著者は、中国のArmy Engineering University of PLA 2019年のACMの会議に投稿している模様 選んだ理由 ・Person Re-Identificationのタスクに関心があった ・arXiv論文を検索してみたら上位で、新しかった ・手法を見たら、他のタスクへの応用の可能性もありそう
Person Re-Identificationとは 3 異なるカメラ間の同一人物の認識 ⇒ 入力された人物の画像が、既知のデータの誰に近いか? 引用元: https://www.sciencedirect.com/science/article/pii/S0262885614000262 http://www.ee.cuhk.edu.hk/~xgwang/CUHK_identification.html CUHK03データセットのサンプル
異なるカメラの配置の例
Person Re-Identificationの課題 4 画像によって、人の映り方が変化する [1] カメラの画角 ・人は移動するので、カメラと人の位置関係が変化 ・撮影したカメラが異なると、画角は(当然)変化 [2] 人の姿勢
・人は歩いているので、手足などポーズが変化する (人の画像) = (背格好など人の特徴)+(画角・姿勢の情報) ⇒ 画角・姿勢に引きずられず 人の特徴を抽出したい 引用元: https://arxiv.org/abs/1807.05284
Person Re-Identificationのアプローチ 5 二枚の画像を入力し、同じか違うか判定するCNN ⇒ 既知のデータが多くなると、判定が必要な回数が増大 一枚の画像の特徴ベクトルを出力するCNNを学習 [1] 距離学習 Triplet
Loss, Contrastive Loss, Cosine Lossなど ⇒ 似ている画像は近い特徴ベクトルに、違う画像は遠く [2] 生成モデル GAN, GAN及びVAE ⇒ 生成モデルを活用して、人の姿勢に依存しない出力に [3] アンサンブル学習 本論文の提案手法
本論文のアイデア 6 複数のCNNを個別に学習させ、合わせて使うと性能が向上 ただし、学習の時間や管理にかかるコストが増大して不便 ⇒ 途中で分岐する、一つのCNNによって解決を図る ResNet-50べ―スの同じモデルを最大8個アンサンブル学習させた結果
本論文が提案するEnsembleNet 7 一つのCNNを、途中から複数のブランチに分岐 ・論文ではResNet-50のres_conv5_1レイヤーから分岐 ・ブランチごとに、Average Poolingの処理が違う(後述) ・Reductionでは、全結合ではなく1×1の畳み込みで削減 ・損失関数は、論文では、単純なsoftmax log-loss(後述) EnsembleNetのアーキテクチャ
EnsembleNetで実装した内容(1/2) 8 各々のブランチで、特徴ベクトルの本数を変える [1] 一番目は、Global Average Poolingで1本 [2] 二番目では、2DのAdaptive Average
Poolingで2本 [3] 三番目では、2DのAdaptive Average Poolingで3本 ⇒ 例えば、二番目で「上半身と下半身」の特徴が得られる EnsembleNetのアーキテクチャ
EnsembleNetで実装した内容(2/2) 9 損失関数は、クラス数に対するsoftmax log-loss = − =1 log exp(
( ) + ) σ =1 exp( ( ) + ) Market, Duke, CUHK03のデータセットでSOTA EnsembleNetの評価結果 横軸はブランチの数で「3」の結果を採用
まとめ 10 本論文では、EnsembleNetを提案 ・途中で分岐する、一つのCNNで学習・推論が可能 ・ResNet-50ベースでPerson Re-IdentificationのSOTA ・今後は、アテンションモデルとの結合を試みるとのこと 所感 ・シンプルなため、本当に効果があるなら役立ちそう ・実装も難しくなさそう(論文はPyTorchで実装とのこと)
・初めて見たときから「本当?」と、汎用性に少し疑問