Upgrade to Pro — share decks privately, control downloads, hide ads and more …

論文紹介: Training Classifiers with Natural Languag...

Yuta Koreeda
September 04, 2019

論文紹介: Training Classifiers with Natural Language Explanations

論文紹介: Training Classifiers with Natural Language Explanations
TFUG, NN論文を肴に酒を飲む会#9
2019.9.4

All figures from now on are cited from “Hancock et al. 2018. Training Classifiers with Natural Language Explanations. ACL.” unless otherwise specified. All texts are distributed as CC-01. Get raw slides from https://drive.google.com/open?id=1YPi9gvTtd6OEvCWKtqYVxb2BJE4EPn9f .

Yuta Koreeda

September 04, 2019
Tweet

More Decks by Yuta Koreeda

Other Decks in Research

Transcript

  1. 提案手法 ③ ラベル集約 入力 ① ラベル関数 生成 ② 関数 フィルタ

    分類 ノート: Q. なぜラベル関数で直接分類してしまわないのか A. 機械学習を用いることでラベル関数には存在しない素性を活用できるため
  2. ② 提案手法: 関数フィルタ • ラベル関数生成で得られた関数 は高カバレッジだがノイジー • 2 つのフィルタで不必要な関数を 除去

    • Semantic ( 意味 ) filter – ラベル関数とアノテータのラベル付 与が不整合したら除去 • Pragmatic ( 実用 ) filter – 大多数のデータに同じラベルをつけ てしまう関数を除去 – 他の関数と ( ほぼ ) 同じ結果を返す 関数を除去 人物 1 ” の右に his wife” という単語列がある 人物 1 ” の真左に his wife” という単語列がある
  3. ③ 提案手法: ラベル集約 • 正解ラベルを とする(未知) • ラベル関数の信頼度 w と正解ラベル

    Y を 最尤推定する ラ ベ ル 関 数 j データ(文) j 重み(直感的には信頼度) ラベル関数による付与結果 特徴量
  4. 実験:方法 • 3 つのデータセットで実験 – Spouse: ハイライトされた 2 人の人物が配偶者同士か否か –

    Disease: ハイライトされた化学薬品がハイライトされた病理を引き起こすか否か – Protein: ハイライトされた kinase(?) がハイライトされたタンパク質に影響するか (?) • 分類器としてルール特徴量 + ロジスティック回帰を使用 • 30 個の正解データ+根拠をデータセットごとに取得 – 60 個の正解データを作るのと同程度の時間ですんだとのこと