Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[ICML2021 論文読み会] Mandoline: Model Evaluation under Distribution Shift

[ICML2021 論文読み会] Mandoline: Model Evaluation under Distribution Shift

Shinichi Takayanagi

August 18, 2021
Tweet

More Decks by Shinichi Takayanagi

Other Decks in Research

Transcript

  1. - どんなもの? - ”検証(source) ↔ 本番(target)で分布が異なる”問題 - 共変量シフト(covariate shift) -

    疫学や国勢/世論調査の手法からインスパイアされた MANDOLINEでこの問題を解決! - [Austin, 2011] [Isakov and Kuriwaki, 2020] - 先行研究と比べてどこがすごい? - ”ノイズのある付加的な情報”を利用する方法を提案 - スライス(slice) 要約
  2. 要約 - 技術や手法のキモはどこ? - 「データに関するグルーピング(“スライス”)」という知識がある場合、 それを活かしてシフトを適切にガイド - スライス関数で分布を補正し、期待値計算(ML評価) - どうやって有効だと検証した?

    - 人工・画像(CelebA)・テキスト(CivilComments)データで検証 - 次に読むべき論文(Code)は? - 古典系(2000年代後半 ~ 2010年前半) - 株式会社ホクソエムのシャチョーのCode
  3. 既存・関連手法 - Kullback-Leibler importance estimation procedure(KLIEP) - 分布形を仮定 し、targetのKLを最小化 -

    [Sugiyama et al., 2008] - Classifier-based IW(CBIW) - density-ratio trickで密度比推定を2値分類問題に倒す - [Hastie et al., 2001, Sugiyama et al., 2012a, Mohamed and Lakshminarayanan, 2016] - Kernel mean matching (KMM) - 再生核ヒルベルト空間上でモーメントを一致させるよう推定 - [Gretton et al., 2009] - Least-squares importance fitting (LSIF) - 二乗誤差が小さくなるよう密度比を推定 - [Kanamori et al., 2009]
  4. 既存手法の課題感 - 高次元データ(High-dimensional data) - 高次元空間での関数推定は辛い - 台のシフト(Support Shift) -

    データの分布の”台”が違う場合は発散したりそもそも計算され なかったりしてしまう - ※台は数学で言う”台”
  5. 定式化 - 計算したい量(先ほどと表記が少々異なる) - g(x): Xを適当な部分空間に写像する関数(シフトを表現!) - “分布変化”に関する知識(これが変化するだろう) - Example

    2.3だと特徴量選択 - 完璧なgは不明なので\tilde{g}を定義してこれを推定して凌ぐ - グラフィカルモデリング前提の定義に見える - 論文中ではh, a, bという関数も出てくるが推定不能なので割愛 ML的な指標(ラベルの一致度合いとか)
  6. Slice Design - metaデータから作る - 記事のタグとか画像の分類とか - 雑にキーワードベースなヒューリスティックを使う - Figure1の例のように単語をがんばって分類

    - 自動化/ツールなどに関する周辺研究も発展 - [Goel et al., 2021, Chen et al., 2019, McCoy et al., 2019b, Ribeiro et al., 2020,Wang et al., 2018, Polyzotis et al., 2019, Sagadeeva and Boehm, 2021] - センチメント分析IMDBをNo tuningで使うも効果あり - [Maas et al., 2011]
  7. END