Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Ensemble Feature for Person Re-Identification
Search
Masanori YANO
April 19, 2019
Science
1
600
Ensemble Feature for Person Re-Identification
論文LT会で作成したPerson Re-Identification論文の説明資料です。
Masanori YANO
April 19, 2019
Tweet
Share
More Decks by Masanori YANO
See All by Masanori YANO
Novelty Detection Via Blurring
msnr
0
540
Y-Net: Joint Segmentation and Classification for Diagnosis of Breast Biopsy Images
msnr
0
590
Pyramid-Based Fully Convolutional Networks for Cell Segmentation
msnr
0
590
Free-Form Image Inpainting with Gated Convolution
msnr
0
1.1k
Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised Anomaly Detection
msnr
0
720
Move Evaluation in Go Using Deep Convolutional Neural Networks
msnr
1
880
AlphaX: eXploring Neural Architectures with Deep Neural Networks and Monte Carlo Tree Search
msnr
0
1.2k
Towards Understanding Chinese Checkers with Heuristics, Monte Carlo Tree Search, and Deep Reinforcement Learning
msnr
0
530
SRCNN: Image Super Resolution Using CNN
msnr
0
780
Other Decks in Science
See All in Science
データベース10: 拡張実体関連モデル
trycycle
PRO
0
1.1k
People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text
rudorudo11
0
190
[Paper Introduction] From Bytes to Ideas:Language Modeling with Autoregressive U-Nets
haruumiomoto
0
190
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
1
230
AIに仕事を奪われる 最初の医師たちへ
ikora128
0
1k
データベース14: B+木 & ハッシュ索引
trycycle
PRO
0
660
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
940
イロレーティングを活用した関東大学サッカーの定量的実力評価 / A quantitative performance evaluation of Kanto University Football Association using Elo rating
konakalab
0
190
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
450
NDCG is NOT All I Need
statditto
2
2.8k
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
0
140
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
470
Featured
See All Featured
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
780
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
110
Code Review Best Practice
trishagee
74
20k
Facilitating Awesome Meetings
lara
57
6.8k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
93
Designing for Performance
lara
610
70k
Making Projects Easy
brettharned
120
6.6k
Faster Mobile Websites
deanohume
310
31k
Speed Design
sergeychernyshev
33
1.5k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
Transcript
画像処理&機械学習 論文LT会 #1 Ensemble Feature for Person Re-Identification 2019年4月19日(金) 矢農
正紀 (Masanori YANO)
論文 2 Ensemble Feature for Person Re-Identification 論文のURL: https://arxiv.org/abs/1901.05798 ⇒
Person Re-IdentificationのタスクでSOTAと主張 著者は、中国のArmy Engineering University of PLA 2019年のACMの会議に投稿している模様 選んだ理由 ・Person Re-Identificationのタスクに関心があった ・arXiv論文を検索してみたら上位で、新しかった ・手法を見たら、他のタスクへの応用の可能性もありそう
Person Re-Identificationとは 3 異なるカメラ間の同一人物の認識 ⇒ 入力された人物の画像が、既知のデータの誰に近いか? 引用元: https://www.sciencedirect.com/science/article/pii/S0262885614000262 http://www.ee.cuhk.edu.hk/~xgwang/CUHK_identification.html CUHK03データセットのサンプル
異なるカメラの配置の例
Person Re-Identificationの課題 4 画像によって、人の映り方が変化する [1] カメラの画角 ・人は移動するので、カメラと人の位置関係が変化 ・撮影したカメラが異なると、画角は(当然)変化 [2] 人の姿勢
・人は歩いているので、手足などポーズが変化する (人の画像) = (背格好など人の特徴)+(画角・姿勢の情報) ⇒ 画角・姿勢に引きずられず 人の特徴を抽出したい 引用元: https://arxiv.org/abs/1807.05284
Person Re-Identificationのアプローチ 5 二枚の画像を入力し、同じか違うか判定するCNN ⇒ 既知のデータが多くなると、判定が必要な回数が増大 一枚の画像の特徴ベクトルを出力するCNNを学習 [1] 距離学習 Triplet
Loss, Contrastive Loss, Cosine Lossなど ⇒ 似ている画像は近い特徴ベクトルに、違う画像は遠く [2] 生成モデル GAN, GAN及びVAE ⇒ 生成モデルを活用して、人の姿勢に依存しない出力に [3] アンサンブル学習 本論文の提案手法
本論文のアイデア 6 複数のCNNを個別に学習させ、合わせて使うと性能が向上 ただし、学習の時間や管理にかかるコストが増大して不便 ⇒ 途中で分岐する、一つのCNNによって解決を図る ResNet-50べ―スの同じモデルを最大8個アンサンブル学習させた結果
本論文が提案するEnsembleNet 7 一つのCNNを、途中から複数のブランチに分岐 ・論文ではResNet-50のres_conv5_1レイヤーから分岐 ・ブランチごとに、Average Poolingの処理が違う(後述) ・Reductionでは、全結合ではなく1×1の畳み込みで削減 ・損失関数は、論文では、単純なsoftmax log-loss(後述) EnsembleNetのアーキテクチャ
EnsembleNetで実装した内容(1/2) 8 各々のブランチで、特徴ベクトルの本数を変える [1] 一番目は、Global Average Poolingで1本 [2] 二番目では、2DのAdaptive Average
Poolingで2本 [3] 三番目では、2DのAdaptive Average Poolingで3本 ⇒ 例えば、二番目で「上半身と下半身」の特徴が得られる EnsembleNetのアーキテクチャ
EnsembleNetで実装した内容(2/2) 9 損失関数は、クラス数に対するsoftmax log-loss = − =1 log exp(
( ) + ) σ =1 exp( ( ) + ) Market, Duke, CUHK03のデータセットでSOTA EnsembleNetの評価結果 横軸はブランチの数で「3」の結果を採用
まとめ 10 本論文では、EnsembleNetを提案 ・途中で分岐する、一つのCNNで学習・推論が可能 ・ResNet-50ベースでPerson Re-IdentificationのSOTA ・今後は、アテンションモデルとの結合を試みるとのこと 所感 ・シンプルなため、本当に効果があるなら役立ちそう ・実装も難しくなさそう(論文はPyTorchで実装とのこと)
・初めて見たときから「本当?」と、汎用性に少し疑問