Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ECCV2024現地参加報告
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
hinako0123
August 29, 2025
0
17
ECCV2024現地参加報告
hinako0123
August 29, 2025
Tweet
Share
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
93
ICCV2025現地参加報告
hinako0123
0
120
ICCV2025論文紹介:SAM2Long
hinako0123
0
130
CVPR2025現地参加報告
hinako0123
0
110
CVPR2025論文紹介:動画像分類
hinako0123
0
78
CVPR2025論文紹介:Segmentation
hinako0123
0
180
ECCV2024論文紹介:Vision & Language
hinako0123
0
150
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
180
ECCV2024論文紹介:SAM
hinako0123
0
160
Featured
See All Featured
The agentic SEO stack - context over prompts
schlessera
0
650
Done Done
chrislema
186
16k
Tell your own story through comics
letsgokoyo
1
810
Amusing Abliteration
ianozsvald
0
110
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Odyssey Design
rkendrick25
PRO
1
500
Typedesign – Prime Four
hannesfritz
42
3k
How Software Deployment tools have changed in the past 20 years
geshan
0
32k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
Transcript
ECCV2024 Workshop M1 古川 陽一
会場
ECCV
Workshop 75件 ・3D vision ・Applications ・Art ・Autonomous Driving and Robotics
・Detection, Recognition, and Low-Level Vision ・Efficiency ・Human ・Medical and Bio-Inspired Vision ・Multimodal などなど
外に、
英語が苦手な人 ・あいさつから始める ⇒ ここで、日本から来たこと、世間話をしてくれる人もいる ⇒ ついでに、英語あんまり得意じゃないんだよっていう ⇒ だいじょうぶだよ?って言ってくれる ⇒ 全部聞き取れなくても、図から判断もできる
⇒ みんな優しい
BioImage Computing(BIC) 招待講演:評価指標に関する講演 背景と課題 (1)評価指標の限界 (2)指標間のミスマッチ (3)分散の欠如
招待講演:評価指標に関する講演
(1)評価指標の限界 一般的な評価指標(Accuracy, Dice係数, IoU) ⇒ 特定のタスクや状況で適切に機能しない場合がある ・Accuracy:クラス不均衡のデータセット ・Dice係数:クラス不均衡
Accuracy 例:2クラス分類タスク(陽性と陰性) Accuracyが95%でした!
Accuracy 例:2クラス分類タスク(陽性と陰性) ・シナリオ - 陰性クラス:950サンプル, 陽性クラス:50サンプル モデルがすべてのサンプルを陰性と予測した場合 陰性クラスのAccuracy:95% 陽性クラスのAccuracy:0%
Dice係数 例:腫瘍セグメンテーション ・シナリオ - 腫瘍A:大きな腫瘍(1000ピクセル) - 腫瘍B:小さな腫瘍(10ピクセル) タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 2 × 共通の面積 検出領域の面積
+ 正解領域の面積 = 2 × 900 900 + 100 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 2 × 9 9 + 10 = 0.947
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 0.947
全体のDice係数 𝐷𝑖𝑐𝑒𝑎𝑙𝑙 = 腫瘍𝐴の面積 × 𝐷𝑖𝑐𝑒𝐴 + 腫瘍𝐵の面積 × 𝐷𝑖𝑐𝑒𝐵 腫瘍𝐴の面積 + 腫瘍𝐵の面積 検出精度×対象の面積 ⇒面積が大きいクラスの変化に敏感
(2)指標のミスマッチ 一部の指標で良い ≠ 他の指標で性能が良い ・Accuracyが95% ⇒ PPV(陽性的中率)は0% ⇒ 陽性クラスを全く予測していない ・Balanced
Accuacyが85% ⇒ MCC(マシューズ相関係数)は5 𝑀𝐶𝐶 = 𝑇𝑃・𝑇𝑁 − 𝐹𝑃・𝐹𝑁 (𝑇𝑃 + 𝐹𝑃)・(𝑇𝑃 + 𝐹𝑁)・(𝑇𝑁 + 𝐹𝑃)・(𝑇𝑁 + 𝐹𝑁) 値の範囲 ・1:完全に正しい ・0:ランダムな予測 ・-1:完全に逆の予測
(3)分散の欠如 多くの論文:評価指標の平均値(Dice係数の平均値)のみ ⇒ 分散や信頼区間が示さていないことがある ・分散が大きい場合、モデルの性能やデータセットやタス ク間で一貫していない ⇒ それについての議論がないことが多い
Metrics Reload 目的:評価指標の選択、使用、解釈を体系的に整理する (1)平均と分散の空間での評価 (2)テストデータサイズと性能改善の関連性 (3)指標の複合的な使用 (4)シナリオ別の適切な指標提案
Metrics Reload (1)平均と分散の空間での評価 例:Dice係数の評価 X軸:平均性能(平均Dice係数) Y軸:分散の逆数(分散が小さいほど高評価)
Metrics Reload (2)テストデータサイズと性能改善の関連性 ・X軸:テストデータのサイズ(例:データポイント数) ・Y軸:精度の改善度(例:Dice係数の向上率) ⇒ テストデータが大規模でも性能改善が見られるモデル は、より信頼性が高いとされる
Metrics Reload (3)指標の複合的な使用 例①:Dice係数 + IoU + Haudorff距離 ・Haudorff距離:セグメンテーションの境界精度 例②:PPV(陽性的中率)+
Recall
Metrics Reload (4)シナリオ別の適切な指標提案 課題例 ①小さい腫瘍が全体のスコアにほとんど影響しない ②多数クラスに偏る評価指標 ③モデルの診断能力と誤診率のトレードオフ ⇒ 目的や主張に合った評価指標を選ぶべき
その他①
その他②
その他③
ご清聴ありがとうございました