Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Pose Estimationの汎用的な評価指標について
Search
Syouya Tobita
January 26, 2024
Programming
0
670
Pose Estimationの汎用的な評価指標について
Python勉強会#100にてLT登壇した際の資料
Syouya Tobita
January 26, 2024
Tweet
Share
More Decks by Syouya Tobita
See All by Syouya Tobita
Siamese neural networks in recommendation
tobi_kite
0
200
Matching theory based recommender systems in online dating
tobi_kite
0
84
Other Decks in Programming
See All in Programming
AkarengaLT vol.38
hashimoto_kei
1
130
Go言語はstack overflowの夢を見るか?
logica0419
0
620
Devoxx BE - Local Development in the AI Era
kdubois
0
140
バッチ処理を「状態の記録」から「事実の記録」へ
panda728
PRO
0
190
Google Opalで使える37のライブラリ
mickey_kubo
3
150
CSC305 Lecture 10
javiergs
PRO
0
270
CSC305 Lecture 11
javiergs
PRO
0
280
What Spring Developers Should Know About Jakarta EE
ivargrimstad
0
510
alien-signals と自作 OSS で実現する フレームワーク非依存な ロジック共通化の探求 / Exploring Framework-Agnostic Logic Sharing with alien-signals and Custom OSS
aoseyuu
2
710
Six and a half ridiculous things to do with Quarkus
hollycummins
0
220
CSC305 Lecture 12
javiergs
PRO
0
230
kiroとCodexで最高のSpec駆動開発を!!数時間で web3ネイティブなミニゲームを作ってみたよ!
mashharuki
0
940
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.1k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
930
For a Future-Friendly Web
brad_frost
180
10k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
22k
Build your cross-platform service in a week with App Engine
jlugia
233
18k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6k
The Language of Interfaces
destraynor
162
25k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Raft: Consensus for Rubyists
vanstee
140
7.2k
Transcript
© 2023 FastLabel Inc. All Rights Reserved. 1 Pose Estimationの汎用的な評価指標について2024/1/25みんなのPython勉強会#100FastLabelInc.飛田祥弥
カスタムキーポイントのための評価指標
• フレーム内に映る人間や物体に対し、対象の各部位(キーポイント)を識別する技術 ◦ 行動認識や物体追跡などのタスクに向いており、スポーツや医療など幅広い分野で利用される Pose Estimationについて 2
• 人間を対象とした評価指標の一つで、推定-正解キーポイント距離が閾値内であるか評価する 1. 各キーポイントの推定座標と正解座標の間の距離を算出する 2. 算出した距離を頭部長や胴体長をもとに正規化する 3. 正規化された距離が閾値以下(τ * l以内)であるキーポイントの割合を算出
既存の評価指標 -PCK(Percentage of correct keypoints)- 3
既存の評価指標 -OKS(Object Keypoint Similarity)- 4 • 人間を対象とした評価指標で、キーポイント間距離、検出しやすさ、大きさから類似度を評価する 1. 検出できている各キーポイントの推定-正解座標間の距離を算出する 2.
座標のmin, maxから大きさを推定し、キーポイントの正規化を行う 3. 正規化した距離に検出しやすさを表す係数を加味し平均した値を類似度とする
カスタムキーポイントにおける問題 5 • PCKやOKSは代表的なデータセットのキーポイントを基準としており、カスタムで学習した結果を評価しづらい ◦ PCKでは頭部長や胴体長で正規化してるけど、どちらも視認しずらい場合はどうする? ◦ OKSで検出のしやすさを表す変数があるけど、人間以外のキーポイントだと適用しづらくない?
汎用的な評価指標 6 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 7 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 8 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 9 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を信頼度とする
• まとめ ◦ PCKやOKSを用いた評価指標は人間以外の物体やカスタムキーポイントに適用しづらい ◦ 今回の評価指標は、物体の大きさを考慮し、推定-正解間座標の相対距離から簡潔に精度を求められる ◦ 人間以外の物体などに対しても適用可能な評価指標である • 課題
◦ Multi Pose Estimationなどの複数物体が映る場合にどう個々へ適用するか ▪ ボトムアップの場合にはクラスタリングなどが必要? ◦ 本来は大きな物体を小さいと仮定して精度を厳しく(その逆も)算出してしまう可能性がある ▪ 体を丸くしている場合などは過小評価してしまう ◦ 複雑な姿勢に対する推定の難しさ(オクルージョン推定が寄与しない)を考慮できていない ▪ 視認できていないキーポイントを推定できていても、精度へ影響を与えなくなってしまう まとめと課題 10
© 2022 FastLabel Inc. All Rights Reserved. 11 End of
File