Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Pose Estimationの汎用的な評価指標について
Search
Syouya Tobita
January 26, 2024
Programming
0
700
Pose Estimationの汎用的な評価指標について
Python勉強会#100にてLT登壇した際の資料
Syouya Tobita
January 26, 2024
Tweet
Share
More Decks by Syouya Tobita
See All by Syouya Tobita
Siamese neural networks in recommendation
tobi_kite
0
220
Matching theory based recommender systems in online dating
tobi_kite
0
89
Other Decks in Programming
See All in Programming
Swift ConcurrencyでよりSwiftyに
yuukiw00w
0
250
文字コードの話
qnighy
44
17k
CSC307 Lecture 11
javiergs
PRO
0
590
Fundamentals of Software Engineering In the Age of AI
therealdanvega
1
220
2026/02/04 AIキャラクター人格の実装論 口 調の模倣から、コンテキスト制御による 『思想』と『行動』の創発へ
sr2mg4
0
700
エージェント開発初心者の僕がエージェントを作った話と今後やりたいこと
thasu0123
0
230
AIコーディングの理想と現実 2026 | AI Coding: Expectations vs. Reality 2026
tomohisa
0
1.1k
AWS Infrastructure as Code の新機能 2025 総まとめ 〜SA 4人による怒涛のデモ祭り〜
konokenj
10
3.2k
TROCCOで実現するkintone+BigQueryによるオペレーション改善
ssxota
0
140
AI主導でFastAPIのWebサービスを作るときに 人間が構造化すべき境界線
okajun35
0
600
Takumiから考えるSecurity_Maturity_Model.pdf
gessy0129
1
120
今、アーキテクトとして 品質保証にどう関わるか
nealle
0
200
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Building Applications with DynamoDB
mza
96
6.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
130
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
81
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
YesSQL, Process and Tooling at Scale
rocio
174
15k
So, you think you're a good person
axbom
PRO
2
1.9k
Ethics towards AI in product and experience design
skipperchong
2
220
Why Our Code Smells
bkeepers
PRO
340
58k
Transcript
© 2023 FastLabel Inc. All Rights Reserved. 1 Pose Estimationの汎用的な評価指標について2024/1/25みんなのPython勉強会#100FastLabelInc.飛田祥弥
カスタムキーポイントのための評価指標
• フレーム内に映る人間や物体に対し、対象の各部位(キーポイント)を識別する技術 ◦ 行動認識や物体追跡などのタスクに向いており、スポーツや医療など幅広い分野で利用される Pose Estimationについて 2
• 人間を対象とした評価指標の一つで、推定-正解キーポイント距離が閾値内であるか評価する 1. 各キーポイントの推定座標と正解座標の間の距離を算出する 2. 算出した距離を頭部長や胴体長をもとに正規化する 3. 正規化された距離が閾値以下(τ * l以内)であるキーポイントの割合を算出
既存の評価指標 -PCK(Percentage of correct keypoints)- 3
既存の評価指標 -OKS(Object Keypoint Similarity)- 4 • 人間を対象とした評価指標で、キーポイント間距離、検出しやすさ、大きさから類似度を評価する 1. 検出できている各キーポイントの推定-正解座標間の距離を算出する 2.
座標のmin, maxから大きさを推定し、キーポイントの正規化を行う 3. 正規化した距離に検出しやすさを表す係数を加味し平均した値を類似度とする
カスタムキーポイントにおける問題 5 • PCKやOKSは代表的なデータセットのキーポイントを基準としており、カスタムで学習した結果を評価しづらい ◦ PCKでは頭部長や胴体長で正規化してるけど、どちらも視認しずらい場合はどうする? ◦ OKSで検出のしやすさを表す変数があるけど、人間以外のキーポイントだと適用しづらくない?
汎用的な評価指標 6 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 7 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 8 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を精度とする
汎用的な評価指標 9 • 以下の4点を考慮し、汎用的な評価指標を考える 1. 検出したキーポイントのx,yからmin, maxをとり、物体の大きさ(仮のBoundingBox)を推定する 2. 推定された大きさからx長,y長をとり、その長さに閾値(%)を掛け、距離誤差の許容範囲とする 3.
各キーポイントで推定-正解座標の距離誤差を算出し、許容範囲内のキーポイント数を数え上げる 4. 数え上げられたキーポイント数と全体のキーポイント数から割合を求め、その割合を信頼度とする
• まとめ ◦ PCKやOKSを用いた評価指標は人間以外の物体やカスタムキーポイントに適用しづらい ◦ 今回の評価指標は、物体の大きさを考慮し、推定-正解間座標の相対距離から簡潔に精度を求められる ◦ 人間以外の物体などに対しても適用可能な評価指標である • 課題
◦ Multi Pose Estimationなどの複数物体が映る場合にどう個々へ適用するか ▪ ボトムアップの場合にはクラスタリングなどが必要? ◦ 本来は大きな物体を小さいと仮定して精度を厳しく(その逆も)算出してしまう可能性がある ▪ 体を丸くしている場合などは過小評価してしまう ◦ 複雑な姿勢に対する推定の難しさ(オクルージョン推定が寄与しない)を考慮できていない ▪ 視認できていないキーポイントを推定できていても、精度へ影響を与えなくなってしまう まとめと課題 10
© 2022 FastLabel Inc. All Rights Reserved. 11 End of
File