Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
説明可能性と性能を両立させる深層学習の試み
Search
Henry Cui
October 23, 2021
Technology
0
170
説明可能性と性能を両立させる深層学習の試み
Henry Cui
October 23, 2021
Tweet
Share
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
0
130
Direct Preference Optimization
zchenry
0
330
Diffusion Model with Perceptual Loss
zchenry
0
300
レンズの下のLLM / LLM under the Lens
zchenry
0
160
Go with the Prompt Flow
zchenry
0
140
Mojo Dojo
zchenry
0
190
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
480
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
200
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
96
Other Decks in Technology
See All in Technology
JavaにおけるNull非許容性
skrb
2
2.7k
Oracle Database Technology Night #87-1 : Exadata Database Service on Exascale Infrastructure(ExaDB-XS)サービス詳細
oracle4engineer
PRO
1
220
Amazon Aurora のバージョンアップ手法について
smt7174
2
190
AI自体のOps 〜LLMアプリの運用、AWSサービスとOSSの使い分け〜
minorun365
PRO
9
1.1k
EMConf JP 2025 懇親会LT / EMConf JP 2025 social gathering
sugamasao
2
210
プルリクエストレビューを終わらせるためのチーム体制 / The Team for Completing Pull Request Reviews
nekonenene
3
1.5k
Aurora PostgreSQLがCloudWatch Logsに 出力するログの課金を削減してみる #jawsdays2025
non97
1
250
MLflowはどのようにLLMOpsの課題を解決するのか
taka_aki
0
140
AIエージェント元年@日本生成AIユーザ会
shukob
1
260
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
120
フォーイット_エンジニア向け会社紹介資料_Forit_Company_Profile.pdf
forit_tech
1
1.7k
LayerXにおけるAI活用事例とその裏側(2025年2月) バクラクの目指す “業務の自動運転” の例 / layerx-ai-deim2025
yuya4
4
790
Featured
See All Featured
The Cult of Friendly URLs
andyhume
78
6.2k
It's Worth the Effort
3n
184
28k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
380
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7.1k
Visualization
eitanlees
146
15k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.3k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
580
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
27
1.9k
Transcript
説明可能性と性能を両立させる 深層学習の試み Henry Cui 機械学習の社会実装勉強会 2021年10月23日
自己紹介 ▪ 2017年 東京大学理学部情報科学科 学士 ▪ 2019年 同大学大学院情報理工学系研究科 修士 ▪ 現在 同研究科 博士課程 ▪ 研究テーマ
• 弱教師付き学習・能動学習・相対比較データ ▪ 趣味テーマ • 物体検出・説明可能性・因果推論 • 画像処理・音声処理一般 ▪ 更に趣味 • Ruby on Rails, React, NextJS 2
説明可能性 ▪ 機械学習モデルは意思決定に使う • 原料価格予測モデル → 入荷数量・タイミング • 人にまつわる予測モデル →
その人の人生に大きな影響の決定 • ... ▪ 予測出す同時に、説明も聞いて納得して判断下す 3 Statistical Modeling: The Two Cultures, Breiman, Statistical Science, 2001, Vol. 16, No. 3, 199–231
事後局所近似で説明 ▪ 既知 • 深層モデルは性能が良いが、 説明できない • 線形モデルは性能が悪いが、 説明しやすい ▪
両方のいいところを • 深層モデルで性能の良い予測 • 予測の近傍で線形モデルでわ かりやすく解釈 ▪ これでいいのか 4 "Why Should I Trust You?": Explaining the Predictions of Any Classifier, Riberiro et al., ACM SIGKDD 2016
これではだめかも ▪ 代理モデルの説明が完全正解でしたら、元のモデルを代替で きるはず ▪ 性能と説明可能性が両立できないは迷信? 5 Stop explaining black
box machine learning models for high stakes decisions and use interpretable models instead, Rudin, Nat Mach Intell 1, 206–215 (2019)
次の方向 ▪ 両立した深層モデルを作りましょう ▪ 深層モデルが説明できる予測を出すためには • 線形モデルのように、特徴量の連結になる • 特徴量は説明できる •
連結も説明できる ▪ 初歩的に画像認識のタスクでのアイデア • 画像に写っているモノの分類タスク • 可視化できる特徴量による線形結合 ▪ モノのパーツを特徴量に ▪ 例:鳥の分類で、鳥の頭・足・翼のパッチ画像を特徴量に 6
内容 ▪ モチベーション ▪ ProtoPNet ▪ Concept Bottleneck Models 7
▪ NeurIPS 2019 ▪ 自然な論理過程に従ったモデルアーキテクチャを提案 8
モデルアーキテクチャ ▪ 明示的に3つに分けた構造 9
学習方法 1. Prototypes 及び 最終層以外の学習 • 従来の分類ロスに Prototype のためのロス 2.
Prototypes の更新 • Prototypes を可視化可能なパッチに更新 • 適切な仮定下で、この更新はモデルの予測に影響しない 3. 最終層の学習 • 凸最適化問題として解く • Sparsity の正規化でテスト時より自然な説明ができる 10
実験結果 ▪ 良い分類性能を保ちつつ、説明可能 11
内容 ▪ モチベーション ▪ ProtoPNet ▪ Concept Bottleneck Models 12
▪ ICML 2020 • https://slideslive.com/38928546/concept-bottleneck-models ▪ 説明可能 + 介入によるモデル変更可能 13
特徴 ▪ 学習時に concept ラベルが必要 ▪ Concept 層を介して二部のモデルに分ける • 学習時の順番を変えられる
▪ 高効率で高性能 14
▪ Concept に明らかな間違いがあるときに、結果修正 テスト時に介入できる 15
まとめ ▪ 説明可能性は大事 ▪ 局所近似による説明はおかしいかも ▪ 説明可能性と性能は両立できるかも ▪ 両立させた深層モデル •
ProtoNet・Concept Bottleneck Models 16