Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ECCV2024現地参加報告
Search
hinako0123
August 29, 2025
23
0
Share
ECCV2024現地参加報告
hinako0123
August 29, 2025
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
110
ICCV2025現地参加報告
hinako0123
0
140
ICCV2025論文紹介:SAM2Long
hinako0123
0
150
CVPR2025現地参加報告
hinako0123
0
120
CVPR2025論文紹介:動画像分類
hinako0123
0
88
CVPR2025論文紹介:Segmentation
hinako0123
0
190
ECCV2024論文紹介:Vision & Language
hinako0123
0
150
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
180
ECCV2024論文紹介:SAM
hinako0123
0
170
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
A better future with KSS
kneath
240
18k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
110
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.5k
GitHub's CSS Performance
jonrohan
1032
470k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.4k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.1k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
310
Claude Code のすすめ
schroneko
67
220k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Transcript
ECCV2024 Workshop M1 古川 陽一
会場
ECCV
Workshop 75件 ・3D vision ・Applications ・Art ・Autonomous Driving and Robotics
・Detection, Recognition, and Low-Level Vision ・Efficiency ・Human ・Medical and Bio-Inspired Vision ・Multimodal などなど
外に、
英語が苦手な人 ・あいさつから始める ⇒ ここで、日本から来たこと、世間話をしてくれる人もいる ⇒ ついでに、英語あんまり得意じゃないんだよっていう ⇒ だいじょうぶだよ?って言ってくれる ⇒ 全部聞き取れなくても、図から判断もできる
⇒ みんな優しい
BioImage Computing(BIC) 招待講演:評価指標に関する講演 背景と課題 (1)評価指標の限界 (2)指標間のミスマッチ (3)分散の欠如
招待講演:評価指標に関する講演
(1)評価指標の限界 一般的な評価指標(Accuracy, Dice係数, IoU) ⇒ 特定のタスクや状況で適切に機能しない場合がある ・Accuracy:クラス不均衡のデータセット ・Dice係数:クラス不均衡
Accuracy 例:2クラス分類タスク(陽性と陰性) Accuracyが95%でした!
Accuracy 例:2クラス分類タスク(陽性と陰性) ・シナリオ - 陰性クラス:950サンプル, 陽性クラス:50サンプル モデルがすべてのサンプルを陰性と予測した場合 陰性クラスのAccuracy:95% 陽性クラスのAccuracy:0%
Dice係数 例:腫瘍セグメンテーション ・シナリオ - 腫瘍A:大きな腫瘍(1000ピクセル) - 腫瘍B:小さな腫瘍(10ピクセル) タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 2 × 共通の面積 検出領域の面積
+ 正解領域の面積 = 2 × 900 900 + 100 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 2 × 9 9 + 10 = 0.947
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 0.947
全体のDice係数 𝐷𝑖𝑐𝑒𝑎𝑙𝑙 = 腫瘍𝐴の面積 × 𝐷𝑖𝑐𝑒𝐴 + 腫瘍𝐵の面積 × 𝐷𝑖𝑐𝑒𝐵 腫瘍𝐴の面積 + 腫瘍𝐵の面積 検出精度×対象の面積 ⇒面積が大きいクラスの変化に敏感
(2)指標のミスマッチ 一部の指標で良い ≠ 他の指標で性能が良い ・Accuracyが95% ⇒ PPV(陽性的中率)は0% ⇒ 陽性クラスを全く予測していない ・Balanced
Accuacyが85% ⇒ MCC(マシューズ相関係数)は5 𝑀𝐶𝐶 = 𝑇𝑃・𝑇𝑁 − 𝐹𝑃・𝐹𝑁 (𝑇𝑃 + 𝐹𝑃)・(𝑇𝑃 + 𝐹𝑁)・(𝑇𝑁 + 𝐹𝑃)・(𝑇𝑁 + 𝐹𝑁) 値の範囲 ・1:完全に正しい ・0:ランダムな予測 ・-1:完全に逆の予測
(3)分散の欠如 多くの論文:評価指標の平均値(Dice係数の平均値)のみ ⇒ 分散や信頼区間が示さていないことがある ・分散が大きい場合、モデルの性能やデータセットやタス ク間で一貫していない ⇒ それについての議論がないことが多い
Metrics Reload 目的:評価指標の選択、使用、解釈を体系的に整理する (1)平均と分散の空間での評価 (2)テストデータサイズと性能改善の関連性 (3)指標の複合的な使用 (4)シナリオ別の適切な指標提案
Metrics Reload (1)平均と分散の空間での評価 例:Dice係数の評価 X軸:平均性能(平均Dice係数) Y軸:分散の逆数(分散が小さいほど高評価)
Metrics Reload (2)テストデータサイズと性能改善の関連性 ・X軸:テストデータのサイズ(例:データポイント数) ・Y軸:精度の改善度(例:Dice係数の向上率) ⇒ テストデータが大規模でも性能改善が見られるモデル は、より信頼性が高いとされる
Metrics Reload (3)指標の複合的な使用 例①:Dice係数 + IoU + Haudorff距離 ・Haudorff距離:セグメンテーションの境界精度 例②:PPV(陽性的中率)+
Recall
Metrics Reload (4)シナリオ別の適切な指標提案 課題例 ①小さい腫瘍が全体のスコアにほとんど影響しない ②多数クラスに偏る評価指標 ③モデルの診断能力と誤診率のトレードオフ ⇒ 目的や主張に合った評価指標を選ぶべき
その他①
その他②
その他③
ご清聴ありがとうございました