Business Value, and Innovation [Emma+, CHI2020] A Human-Centered Evaluation of a Deep Learning System Deployed in Clinics for the Detection of Diabetic Retinopathy [Cai+, CHI2019] Human-Centered Tools for Coping with Imperfect Algorithms During Medical Decision-Making 糖尿病性網膜症の画像診断 [Emma+, CHI2020] 前⽴腺癌の画像診断 [Cai+, CHI2019] 機械学習システムを⼈間の意思決定にどう活⽤していくか Webサービス 推薦システム [Gomez-Uribe+, ACM2015]
1996] 局所的な説明 (Local-interpretability) ある⼊⼒に対する予測の根拠を説明とする • ⼊⼒特徴量を説明として利⽤ LIME [Ribeiro+, SIGKDD2016], SHAP [Lundberg+, NIPS2017] • 画像内の注⽬箇所を勾配ベースでハイライト Saliency Map [Selvaraju+, ICCV2017]他 7 [Breiman+, 1996] Born Again Trees [Ribeiro+, SIGKDD2016] "Why Should I Trust You?": Explaining the Predictions of Any Classifier [Lundberg+, NIPS2017] A Unified Approach to Interpreting Model Predictions [Selvaraju+, ICCV2017] Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization
Explanation in Artificial Intelligence: Insights from the Social Sciences [Miller, J. Artificial Intelligence2017] The Mythos of Model Interpretability [Lipton, ICML WHI2016]
Map Explanations for Convolutional Neural Networks: A User Study [Lai+, CHI2020] "Why is 'Chicago' deceptive?" Towards Building Model-Driven Tutorials for Humans [Emma+, CHI2020] A Human-Centered Evaluation of a Deep Learning System Deployed in Clinics for the Detection of Diabetic Retinopathy 専⾨家の意思決定とMLシステム間の実証実験 • 糖尿病性網膜症の画像診断ツールへの⼈間中⼼の評価研究 [Emma+, CHI2020] • タイの病院に導⼊、7600⼈の患者についての⼤規模調査 • 前⽴腺癌の画像診断システム導⼊時に専⾨家が求める情報の調査 [Cai+, CSCW2019] 論⽂紹介② XAI⼿法のユーザ評価 汎⽤的なタスク・説明⼿法が多い • 物体認識における Saliency Map 提⽰有無による説明性評価 [Ahmed+, IUI2020] • 嘘レビュー検知の説明有無によるユーザの予測性能評価 [Lai+, CHI2020] 詳しくは 【論⽂調査】XAI技術の効能を ユーザ実験で評価する研究 , 原聡准教授 より実運⽤に近い研究も
⇒ 提案モデルと放射線科医の協調により、医師またはモデル単独の性 能を上回る可能性が⽰唆された。今後ユーザスタディが必要 [Tiulpin+, Scientific Reports2018] Automatic knee osteoarthritis diagnosis from plain radiographs: A deep learning-based approach. [Pierson+, NBER2019] Using machine learning to understand racial and socioeconomic differences in knee pain
CSCW2015] • Side channel from x → y • モデルに x → y からの直接のパスを追加することで不 完全な概念を考慮 • ボトルネック構造の理論的解析 27 [Cheng+, CSCW2015] Flock: Hybrid Crowd-Machine Learning Classifiers
Human‒AI Collaborative Decision-Making Carrie J. Cai, Samantha Winter, David Steiner, Lauren Wilcox, Michael Terry Google Research, Google Health CSCW 2019 29
既存のワークフローへの有⽤性を理解して おらず、システムの採⽤に抵抗する [Maddox+, JAMA2018] • システムの誤りを認知後に使⽤を⽌める (Algorithm aversion) [Keeffe+, Medical care2005] 31 CDSS: 医者の “第⼆の⽬” として意思決定を⽀援するシステム = HCI的な観点の⽋如 本研究 DNNを⽤いた診断⽀援システムの導⼊初期段階に焦点を当て、 病理医がどのような情報を必要とするかを調査 [Maddox+, JAMA2018] Questions for Artificial Intelligence in Health Care [Keeffe+, Medical care2005] Provider response to computer-based care suggestions for chronic heart failure 導⼊初期段階: 最初の印象の形成、適切な使⽤戦略の構築に鍵となる段階