Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介10月
Search
miyanishi
October 22, 2015
0
190
文献紹介10月
miyanishi
October 22, 2015
Tweet
Share
More Decks by miyanishi
See All by miyanishi
平成27年度最終ゼミ
miyanishi
0
86
文献紹介1月
miyanishi
0
190
文献紹介12月
miyanishi
0
250
文献紹介11月
miyanishi
0
250
文献紹介(2015/09)
miyanishi
0
220
文献紹介8月(PPDB)
miyanishi
0
340
文献紹介15年08月
miyanishi
0
240
15年7月文献紹介
miyanishi
0
260
文献紹介15年06月
miyanishi
0
260
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
SEO for Brand Visibility & Recognition
aleyda
0
4.1k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
From π to Pie charts
rasagy
0
100
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
120
Producing Creativity
orderedlist
PRO
348
40k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
140
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Designing for humans not robots
tammielis
254
26k
Transcript
文献紹介 自然言語処理研究室 修士2年 宮西 由貴 1
文献情報 Semantic Neighborhoods as Hypergraphs – 著者:Chris Quirk, Pallavi Choudhury
– 会議:Association for Computational Lingui stics 2013 – ページ: 222–227 2
概略 • Hypergraphsを用いて表現 – Hypergraphの自動構築 – 簡単な文章認識タスクで評価 文のバリエーションを許す表現方法の提案 3
文のバリエーションを許す表現 • 文の様々な曖昧性を保存 – 語 – フレーズ – 語順 •
機械翻訳評価や言い換え認識などで有効 • 従来:ラティスを使用 – 語順の曖昧性があると組み合わせが多くなる 4
例えば… • 同じ映像を見て書かれた文 – A man is sliding a cat
on the floor. – A boy cleaning the floor with the cat. – A cat is being pushed across the floor by a man. 5
ハイパーグラフの構築 • おおまかな流れ – 構文解析(Penn Treebankparser) – Split – Merge
– 完成した文法の評価 – スムージングと刈り取り(速度と精度の向上) 6 ルールの改良を 繰り返す
ハイパーグラフ • グラフを拡張した表現方法 – エッジが複数のノードを連結できる – 通常のグラフより自由度が高い • 文脈自由文法をハイパーグラフで描ける 7
Split • 深層格のアノテーション – 新たなシンボルを作る – 親・右の子・左の子とのルールを作る – 文法のパラメータはEMで最適化 (例)NP
から 主格を表すNP0 と目的格を表すNP1を作成 →NPのシンボルを持つ部分をNP0、NP1と置き換える →隣接した語とのルールを作成 8
Mergeと繰り返し • Splitで増えたシンボルやルールを削減する – 尤度の低いものは切り捨てる • SplitとMergeを直列に配置し繰り返す – 回数はタスクの精度によって決める 9
完成した文法の評価 • 以下の式で評価 – c(・・・)はカウント 10 P(Xi → Yj Zk)
= _____________ c(Xi , Yj, Zk) c(Xi)
処理の流れ inputと構文解析 11
処理の流れ splitとmerge 12
処理の流れ 完成した文法 13
実験 14 • タスク – いくつかの説明文の中から正しいものを選択 • トレーニングデータは正解:ノイズ=2:1の割合 – ベースラインはTFIDFを使用
– CAPTCHAsで評価
実験 • データ – ビデオと、複数の説明が対応したコーパス 15
結果 16 • S – splitで分割した数 • k – スムージングの閾値
例 17