最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会

最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy
Liang, Christopher D. Manning （株）Preferred Networks 海野裕也 2016/09/11 第8回最先端NLP勉強会

2 startからgoalになるような「指⽰」を⾃由に書く

3 きっと茶⾊を消したんだろう

4 完全に無視！！

5 候補の中から正しい⾏動の結果を選択

6 指⽰と操作のペアを学習

同じようにして何問か教える 7

8 さっき⾒たやつだ！

9 ちゃんと学習されてる！

概要 l  ⾔語理解関わる⾔語ゲームを設計した l  理解を促進するための排他的な理解を⾏うためのモデルを提案実装した l  クラウドワーカーに⾔語を教えるタスクをやってもらい、⾔語を教えてもらった l 
どのように⼈間が教えるのかも含めて興味深いデータを取った 10

所感 l  設計が優れている l  ⾔語の理解に関わるタスクはbAbIなど⾮現実的な⽂か、難しい「⼤⼈」の⽂が中⼼だった l  「簡単なタスク＋⾃然な⽂」の設計にすることで、現実的な⽂でありながら複雑な知識を利⽤しないタスクができた
l  ⾃⼰完結的である l  これまでの、「まずデータを作る、そして問題を解く」というタイプではなくて、「データを作りながら問題を解く」 l  学習する過程そのものに焦点があたっている 11

SHRDURNゲーム 12

変数 l  初期状態: s \in Y l  ⽬的状態: t \in
Y （⼈間だけに⾒せる） l  指⽰: x （⼈間が出す e.g. “remove red”） l  候補: Z = [z 1 , …, z K ] K個提⽰ l  次状態: Y = [y 1 , …, y K ] ただし、y i = [z i ]s l  ⼈間がy i を選択 13

Semantic parsing model l  x（指⽰）からz（⾏動）の対応は対数線形モデル l  特徴（φ）はありがちなもの l  指⽰x中のn-gram（skip-gram含む）
l  ⾏動z中のtree-gram 14

論理形式の⽣成 l  p(z|x)に基づいてzを⽣成する必要がある l  ⽂法規則を使って⽣成する l  ビームサーチを利⽤する 15

学習 l  AdaGradで最適化 16

排他的な理解のモデル化 l  “remove red”のあとに、”remove cyan”が来ると、普通は両者は別の指⽰だと思う l  現状の、特徴ベースの学習の場合、類似の特徴が発⽕するため両者を同じと判定してしまう l 
「指⽰は排他的である」という判断ができるようにしたい 17

事前分布による排他性の実現 l  Speaker（ユーザー）とListener（システム）の発話xと理解zの事前分布を⼊れる l  p(x)とp(z)のおかげで、各発⾔が別々の意味を持つように、補正される l  雑な印象は受ける・・・ 18

事前分布がuniformだとしたときの効果の例 19 1になるよう正規化 1になるよう正規化

学習⽅法 20

実験⽅法 l  Amazon Mechanical Turkで、100⼈に3ドルずつ l  ゲームは5段階の難易度で、10タスクずつ l  100⼈全部で6時間しかかからなかった l 
1⼈1時間程度 l  20⼈位は何したら良いのかわからなかった 21

⼈間の観察 l  だいたい英語だが、⼈によってバリエーションが有る l  5⼈だけ、謎の⾔語を開発 l  別の⾔語の⼈も l  多くは、⼀貫性のある表現を使う（removeだけ使う、など）
22

⾯⽩い例 23

まとめ 24

最先端NLP勉強会 “Learning Language Games through Inte...

最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会

Yuya Unno

More Decks by Yuya Unno

Other Decks in Technology

Featured

Transcript

最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy