Introduction_to_ZeroshotLearning

by payanotty

Slide 1

Slide 1 text

Zeroshot Text Classification  さっくり解説  早野康太 

Slide 2

Slide 2 text

自己紹介  ● 名前  ○ 早野康太  ● お仕事  ○ 自然言語モデルの改善  ● 趣味  ○ 猫、犬  ■ YouTube  ○ ゲーム  ■ 音ゲ、遊戯王MD  ○ アニメ  ■ リコリコやばくない？ 

Slide 3

Slide 3 text

Zeroshot Learningとは  ● 見たことないクラスのものを  正しく分類できるようなモデルを学習する 

Slide 4

Slide 4 text

Zeroshot Learningとは  ● 見たことないクラスのものを  正しく分類できるようなモデルを学習する 

Slide 5

Slide 5 text

Zeroshot Learningとは  ● 見たことないクラスのものを  正しく分類できるようなモデルを学習する 

Slide 6

Slide 6 text

Zeroshot Learningとは  ● 見たことないクラスのものを  正しく分類できるようなモデルを学習する  ● Zeroshot → 学習データにCATが全くない ● Fewshot → 学習データにCATが　めちゃくちゃ少ないけどある

Slide 7

Slide 7 text

Zeroshot Learningとは  ● 役に立ちそうな場面  ○ データのラベル付けが難しい場合 (専門知識が必要など)  ○ ラベル付けされたデータが大量に用意できない場合  ○ データ収集時点で想定していなかった  新しいラベルのデータに対して分類が求められる場合 

Slide 8

Slide 8 text

自然言語におけるZeroshot学習  ● 文章をモデルにぶちこんで  意味が”それっぽい”かどうかを判定させる (Entailment Approach)  ○ Benchmarking Zero-shot Text Classification: Datasets, Evaluation and Entailment Approach 

Slide 9

Slide 9 text

自然言語におけるZeroshot学習  吾輩は猫である。  分類したい文章  Hypothesis  これは犬の文だ。  Entailment Score  ＋  0.50  吾輩は猫である。  これは鳥の文だ。  ＋  0.12  ＝  ＝  これは{}の文だ。  Hypothesis Template 

Slide 10

Slide 10 text

自然言語におけるZeroshot学習  吾輩は猫である。  分類したい文章  Hypothesis  これは犬の文だ。  Entailment Score  ＋  0.50  吾輩は猫である。  これは鳥の文だ。  ＋  0.12  ＝  ＝  吾輩は猫である。  これは猫の文だ。  ＋  0.61  ＝  これは{}の文だ。  学習していないラベル: 猫  Hypothesis Template 

Slide 11

Slide 11 text

● Bidirectional Encoder Representations from Transformers  ○ BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding  ○ Transformerによる双方向のエンコード表現  ■ Transformerモデルの一部分を利用したモデル  ○ Googleが2018年に発表  ● 当時の自然言語処理タスクの最高記録を軒並み塗り替えた  ● fine-tuningにより   あらゆる自然言語処理タスクに応用可能な汎用性の高さ    Zeroshot ✕ BERT 

Slide 12

Slide 12 text

TransformersでZeroshot  ● Transformers  ○ さまざまな自然言語の事前学習済みモデルを  利用することができるライブラリ  ○ ZeroshotClassificationPipelineを使えば  簡単にZeroshot分類を試すことができる  ■ Pipelines — transformers 4.5.0.dev0 documentation  ■ が、日本語のPretrained ModelはModel Hubで全然公開されていない  ● 日本語でやる場合は自分でモデルを作る必要あり  ● 例えばこういうデータセットを使うなど  ○ 日本語SNLI(JSNLI)データセット - KUROHASHI-CHU-MURAWAKI LAB 

Slide 13

Slide 13 text

まとめ  ● Zeroshot Learningとは  ○ 学習していないラベルのデータを予測しようとする試み    ● 自然言語分野では、”これは{}の文だ”のように  テンプレートにラベル名を埋め込んでEntailmentスコアを計算する方法が  試されている  ○ TransformersライブラリでもZeroshotPipelineが利用可能なので  興味があれば試してみるのもおもしろいかも