Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
最先端NLP勉強会 “Learning Language Games through Inte...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Yuya Unno
September 11, 2016
Technology
15
0
Share
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
Yuya Unno
September 11, 2016
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
25
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
46
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
46
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
15
進化するChainer @JSAI2017
unnonouno
0
21
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
24
深層学習フレームワーク Chainerとその進化
unnonouno
0
21
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
32
Chainer, Cupy⼊⾨ @Chainer meetup #3
unnonouno
0
18
Other Decks in Technology
See All in Technology
ASTのGitHub CopilotとCopilot CLIの現在地をお話しします/How AST Operates GitHub Copilot and Copilot CLI
aeonpeople
1
210
Proxmox超入門
devops_vtj
0
160
レガシーシステムをどう次世代に受け継ぐか
tachiiri
0
330
ADOTで始めるサーバレスアーキテクチャのオブザーバビリティ
alchemy1115
2
270
DIPS2.0データに基づく森林管理における無人航空機の利用状況
naokimuroki
0
190
新規サービス開発におけるReact Nativeのリアル〜技術選定の裏側と実践的OSS活用〜
grandbig
2
180
ストライクウィッチーズ2期6話のエイラの行動が許せないのでPjMの観点から何をすべきだったのかを考える
ichimichi
1
320
2026年度新卒技術研修 サイバーエージェントのデータベース 活用事例とパフォーマンス調査入門
cyberagentdevelopers
PRO
6
7.3k
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
160
AgentCore RuntimeからS3 Filesをマウントしてみる
har1101
3
400
あるアーキテクチャ決定と その結果/architecture-decision-and-its-result
hanhan1978
2
570
GitHub Copilotを極める会 - 開発者のための活用術
findy_eventslides
6
3.9k
Featured
See All Featured
30 Presentation Tips
portentint
PRO
1
270
Crafting Experiences
bethany
1
110
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
160
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.6k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
340
YesSQL, Process and Tooling at Scale
rocio
174
15k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
96
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Prompt Engineering for Job Search
mfonobong
0
260
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
140
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy
Liang, Christopher D. Manning (株)Preferred Networks 海野 裕也 2016/09/11 第8回最先端NLP勉強会
2 startからgoalになるような 「指⽰」を⾃由に書く
3 きっと茶⾊を消したんだろう
4 完全に無視!!
5 候補の中から正し い⾏動の結果を選 択
6 指⽰と操作のペアを学習
同じようにして何問か教える 7
8 さっき⾒たやつだ!
9 ちゃんと学習されてる!
概要 l ⾔語理解関わる⾔語ゲームを設計した l 理解を促進するための排他的な理解を⾏うため のモデルを提案実装した l クラウドワーカーに⾔語を教えるタスクをやっ てもらい、⾔語を教えてもらった l
どのように⼈間が教えるのかも含めて興味深い データを取った 10
所感 l 設計が優れている l ⾔語の理解に関わるタスクはbAbIなど⾮現実的な⽂ か、難しい「⼤⼈」の⽂が中⼼だった l 「簡単なタスク+⾃然な⽂」の設計にすることで、 現実的な⽂でありながら複雑な知識を利⽤しないタ スクができた
l ⾃⼰完結的である l これまでの、「まずデータを作る、そして問題を解 く」というタイプではなくて、「データを作りなが ら問題を解く」 l 学習する過程そのものに焦点があたっている 11
SHRDURNゲーム 12
変数 l 初期状態: s \in Y l ⽬的状態: t \in
Y (⼈間だけに⾒せる) l 指⽰: x (⼈間が出す e.g. “remove red”) l 候補: Z = [z 1 , …, z K ] K個提⽰ l 次状態: Y = [y 1 , …, y K ] ただし、y i = [z i ]s l ⼈間がy i を選択 13
Semantic parsing model l x(指⽰)からz(⾏動)の対応は対数線形モデ ル l 特徴(φ)はありがちなもの l 指⽰x中のn-gram(skip-gram含む)
l ⾏動z中のtree-gram 14
論理形式の⽣成 l p(z|x)に基づいてzを⽣成する必要がある l ⽂法規則を使って⽣成する l ビームサーチを利⽤する 15
学習 l AdaGradで最適化 16
排他的な理解のモデル化 l “remove red”のあとに、”remove cyan”が来る と、普通は両者は別の指⽰だと思う l 現状の、特徴ベースの学習の場合、類似の特徴 が発⽕するため両者を同じと判定してしまう l
「指⽰は排他的である」という判断ができるよ うにしたい 17
事前分布による排他性の実現 l Speaker(ユーザー)とListener(システム)の 発話xと理解zの事前分布を⼊れる l p(x)とp(z)のおかげで、各発⾔が別々の意味を 持つように、補正される l 雑な印象は受ける・・・ 18
事前分布がuniformだとしたときの効果の例 19 1になるよ う正規化 1になるよ う正規化
学習⽅法 20
実験⽅法 l Amazon Mechanical Turkで、100⼈に3ドルずつ l ゲームは5段階の難易度で、10タスクずつ l 100⼈全部で6時間しかかからなかった l
1⼈1時間程度 l 20⼈位は何したら良いのかわからなかった 21
⼈間の観察 l だいたい英語だが、⼈によってバリエーションが有る l 5⼈だけ、謎の⾔語を開発 l 別の⾔語の⼈も l 多くは、⼀貫性のある表現を使う(removeだけ使う、 など)
22
⾯⽩い例 23
まとめ 24