Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Pose Estimationの汎用的な評価指標について
Search
Syouya Tobita
January 26, 2024
Programming
0
710
Pose Estimationの汎用的な評価指標について
Python勉強会#100にてLT登壇した際の資料
Syouya Tobita
January 26, 2024
Tweet
Share
More Decks by Syouya Tobita
See All by Syouya Tobita
Siamese neural networks in recommendation
tobi_kite
0
220
Matching theory based recommender systems in online dating
tobi_kite
0
90
Other Decks in Programming
See All in Programming
最初からAWS CDKで技術検証してもいいんじゃない?
akihisaikeda
4
170
AWS×クラウドネイティブソフトウェア設計 / AWS x Cloud-Native Software Design
nrslib
16
3.4k
見せてもらおうか、 OpenSearchの性能とやらを!
shunta27
1
140
ロボットのための工場に灯りは要らない
watany
12
3.2k
「接続」—パフォーマンスチューニングの最後の一手 〜点と点を結ぶ、その一瞬のために〜
kentaroutakeda
3
1.9k
DevinとClaude Code、SREの現場で使い倒してみた件
karia
1
1.1k
[SF Ruby Feb'26] The Silicon Heel
palkan
0
130
PHPのバージョンアップ時にも役立ったAST(2026年版)
matsuo_atsushi
0
250
生成 AI 時代のスナップショットテストってやつを見せてあげますよ(α版)
ojun9
0
300
条件判定に名前、つけてますか? #phperkaigi #c
77web
2
810
Java 21/25 Virtual Threads 소개
debop
0
270
CS教育のDX AIによる育成の効率化
niftycorp
PRO
0
160
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Designing for humans not robots
tammielis
254
26k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.9k
Into the Great Unknown - MozCon
thekraken
40
2.3k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
140
Color Theory Basics | Prateek | Gurzu
gurzu
0
260
Ethics towards AI in product and experience design
skipperchong
2
240
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Transcript
© 2023 FastLabel Inc. All Rights Reserved. 1 Pose Estimationの汎用的な評価指標について2024/1/25みんなのPython勉強会#100FastLabelInc.飛田祥弥
カスタムキーポイントのための評価指標
• フレーム内に映る人間や物体に対し、対象の各部位(キーポイント)を識別する技術 ◦ 行動認識や物体追跡などのタスクに向いており、スポーツや医療など幅広い分野で利用される Pose Estimationについて 2
• 人間を対象とした評価指標の一つで、推定-正解キーポイント距離が閾値内であるか評価する 1. 各キーポイントの推定座標と正解座標の間の距離を算出する 2. 算出した距離を頭部長や胴体長をもとに正規化する 3. 正規化された距離が閾値以下(τ * l以内)であるキーポイントの割合を算出
既存の評価指標 -PCK(Percentage of correct keypoints)- 3
既存の評価指標 -OKS(Object Keypoint Similarity)- 4 • 人間を対象とした評価指標で、キーポイント間距離、検出しやすさ、大きさから類似度を評価する 1. 検出できている各キーポイントの推定-正解座標間の距離を算出する 2.
座標のmin, maxから大きさを推定し、キーポイントの正規化を行う 3. 正規化した距離に検出しやすさを表す係数を加味し平均した値を類似度とする
カスタムキーポイントにおける問題 5 • PCKやOKSは代表的なデータセットのキーポイントを基準としており、カスタムで学習した結果を評価しづらい ◦ PCKでは頭部長や胴体長で正規化してるけど、どちらも視認しずらい場合はどうする? ◦ OKSで検出のしやすさを表す変数があるけど、人間以外のキーポイントだと適用しづらくない?
汎用的な評価指標 6 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 7 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 8 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 9 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を信頼度とする
• まとめ ◦ PCKやOKSを用いた評価指標は人間以外の物体やカスタムキーポイントに適用しづらい ◦ 今回の評価指標は、物体の大きさを考慮し、推定-正解間座標の相対距離から簡潔に精度を求められる ◦ 人間以外の物体などに対しても適用可能な評価指標である • 課題
◦ Multi Pose Estimationなどの複数物体が映る場合にどう個々へ適用するか ▪ ボトムアップの場合にはクラスタリングなどが必要? ◦ 本来は大きな物体を小さいと仮定して精度を厳しく(その逆も)算出してしまう可能性がある ▪ 体を丸くしている場合などは過小評価してしまう ◦ 複雑な姿勢に対する推定の難しさ(オクルージョン推定が寄与しない)を考慮できていない ▪ 視認できていないキーポイントを推定できていても、精度へ影響を与えなくなってしまう まとめと課題 10
© 2022 FastLabel Inc. All Rights Reserved. 11 End of
File