Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ECCV2024現地参加報告
Search
hinako0123
August 29, 2025
0
1
ECCV2024現地参加報告
hinako0123
August 29, 2025
Tweet
Share
More Decks by hinako0123
See All by hinako0123
CVPR2025現地参加報告
hinako0123
0
48
CVPR2025論文紹介:動画像分類
hinako0123
0
43
CVPR2025論文紹介:Segmentation
hinako0123
0
140
ECCV2024論文紹介:Vision & Language
hinako0123
0
120
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
160
ECCV2024論文紹介:SAM
hinako0123
0
140
ECCV2024現地参加報告
hinako0123
0
140
CVPR2024論文紹介:Sparse Training, Continual learning, Object detection
hinako0123
0
230
CVPR2024現地参加報告
hinako0123
0
170
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Rails Girls Zürich Keynote
gr2m
95
14k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
A better future with KSS
kneath
239
17k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Designing for Performance
lara
610
69k
Git: the NoSQL Database
bkeepers
PRO
431
65k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Typedesign – Prime Four
hannesfritz
42
2.8k
Docker and Python
trallard
45
3.5k
Transcript
ECCV2024 Workshop M1 古川 陽一
会場
ECCV
Workshop 75件 ・3D vision ・Applications ・Art ・Autonomous Driving and Robotics
・Detection, Recognition, and Low-Level Vision ・Efficiency ・Human ・Medical and Bio-Inspired Vision ・Multimodal などなど
外に、
英語が苦手な人 ・あいさつから始める ⇒ ここで、日本から来たこと、世間話をしてくれる人もいる ⇒ ついでに、英語あんまり得意じゃないんだよっていう ⇒ だいじょうぶだよ?って言ってくれる ⇒ 全部聞き取れなくても、図から判断もできる
⇒ みんな優しい
BioImage Computing(BIC) 招待講演:評価指標に関する講演 背景と課題 (1)評価指標の限界 (2)指標間のミスマッチ (3)分散の欠如
招待講演:評価指標に関する講演
(1)評価指標の限界 一般的な評価指標(Accuracy, Dice係数, IoU) ⇒ 特定のタスクや状況で適切に機能しない場合がある ・Accuracy:クラス不均衡のデータセット ・Dice係数:クラス不均衡
Accuracy 例:2クラス分類タスク(陽性と陰性) Accuracyが95%でした!
Accuracy 例:2クラス分類タスク(陽性と陰性) ・シナリオ - 陰性クラス:950サンプル, 陽性クラス:50サンプル モデルがすべてのサンプルを陰性と予測した場合 陰性クラスのAccuracy:95% 陽性クラスのAccuracy:0%
Dice係数 例:腫瘍セグメンテーション ・シナリオ - 腫瘍A:大きな腫瘍(1000ピクセル) - 腫瘍B:小さな腫瘍(10ピクセル) タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 2 × 共通の面積 検出領域の面積
+ 正解領域の面積 = 2 × 900 900 + 100 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 2 × 9 9 + 10 = 0.947
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 0.947
全体のDice係数 𝐷𝑖𝑐𝑒𝑎𝑙𝑙 = 腫瘍𝐴の面積 × 𝐷𝑖𝑐𝑒𝐴 + 腫瘍𝐵の面積 × 𝐷𝑖𝑐𝑒𝐵 腫瘍𝐴の面積 + 腫瘍𝐵の面積 検出精度×対象の面積 ⇒面積が大きいクラスの変化に敏感
(2)指標のミスマッチ 一部の指標で良い ≠ 他の指標で性能が良い ・Accuracyが95% ⇒ PPV(陽性的中率)は0% ⇒ 陽性クラスを全く予測していない ・Balanced
Accuacyが85% ⇒ MCC(マシューズ相関係数)は5 𝑀𝐶𝐶 = 𝑇𝑃・𝑇𝑁 − 𝐹𝑃・𝐹𝑁 (𝑇𝑃 + 𝐹𝑃)・(𝑇𝑃 + 𝐹𝑁)・(𝑇𝑁 + 𝐹𝑃)・(𝑇𝑁 + 𝐹𝑁) 値の範囲 ・1:完全に正しい ・0:ランダムな予測 ・-1:完全に逆の予測
(3)分散の欠如 多くの論文:評価指標の平均値(Dice係数の平均値)のみ ⇒ 分散や信頼区間が示さていないことがある ・分散が大きい場合、モデルの性能やデータセットやタス ク間で一貫していない ⇒ それについての議論がないことが多い
Metrics Reload 目的:評価指標の選択、使用、解釈を体系的に整理する (1)平均と分散の空間での評価 (2)テストデータサイズと性能改善の関連性 (3)指標の複合的な使用 (4)シナリオ別の適切な指標提案
Metrics Reload (1)平均と分散の空間での評価 例:Dice係数の評価 X軸:平均性能(平均Dice係数) Y軸:分散の逆数(分散が小さいほど高評価)
Metrics Reload (2)テストデータサイズと性能改善の関連性 ・X軸:テストデータのサイズ(例:データポイント数) ・Y軸:精度の改善度(例:Dice係数の向上率) ⇒ テストデータが大規模でも性能改善が見られるモデル は、より信頼性が高いとされる
Metrics Reload (3)指標の複合的な使用 例①:Dice係数 + IoU + Haudorff距離 ・Haudorff距離:セグメンテーションの境界精度 例②:PPV(陽性的中率)+
Recall
Metrics Reload (4)シナリオ別の適切な指標提案 課題例 ①小さい腫瘍が全体のスコアにほとんど影響しない ②多数クラスに偏る評価指標 ③モデルの診断能力と誤診率のトレードオフ ⇒ 目的や主張に合った評価指標を選ぶべき
その他①
その他②
その他③
ご清聴ありがとうございました