Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介10月
Search
miyanishi
October 22, 2015
200
0
Share
文献紹介10月
miyanishi
October 22, 2015
More Decks by miyanishi
See All by miyanishi
平成27年度最終ゼミ
miyanishi
0
87
文献紹介1月
miyanishi
0
190
文献紹介12月
miyanishi
0
250
文献紹介11月
miyanishi
0
250
文献紹介(2015/09)
miyanishi
0
230
文献紹介8月(PPDB)
miyanishi
0
340
文献紹介15年08月
miyanishi
0
240
15年7月文献紹介
miyanishi
0
260
文献紹介15年06月
miyanishi
0
270
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
340
The Spectacular Lies of Maps
axbom
PRO
1
680
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
880
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.4k
How STYLIGHT went responsive
nonsquared
100
6k
エンジニアに許された特別な時間の終わり
watany
106
240k
Transcript
文献紹介 自然言語処理研究室 修士2年 宮西 由貴 1
文献情報 Semantic Neighborhoods as Hypergraphs – 著者:Chris Quirk, Pallavi Choudhury
– 会議:Association for Computational Lingui stics 2013 – ページ: 222–227 2
概略 • Hypergraphsを用いて表現 – Hypergraphの自動構築 – 簡単な文章認識タスクで評価 文のバリエーションを許す表現方法の提案 3
文のバリエーションを許す表現 • 文の様々な曖昧性を保存 – 語 – フレーズ – 語順 •
機械翻訳評価や言い換え認識などで有効 • 従来:ラティスを使用 – 語順の曖昧性があると組み合わせが多くなる 4
例えば… • 同じ映像を見て書かれた文 – A man is sliding a cat
on the floor. – A boy cleaning the floor with the cat. – A cat is being pushed across the floor by a man. 5
ハイパーグラフの構築 • おおまかな流れ – 構文解析(Penn Treebankparser) – Split – Merge
– 完成した文法の評価 – スムージングと刈り取り(速度と精度の向上) 6 ルールの改良を 繰り返す
ハイパーグラフ • グラフを拡張した表現方法 – エッジが複数のノードを連結できる – 通常のグラフより自由度が高い • 文脈自由文法をハイパーグラフで描ける 7
Split • 深層格のアノテーション – 新たなシンボルを作る – 親・右の子・左の子とのルールを作る – 文法のパラメータはEMで最適化 (例)NP
から 主格を表すNP0 と目的格を表すNP1を作成 →NPのシンボルを持つ部分をNP0、NP1と置き換える →隣接した語とのルールを作成 8
Mergeと繰り返し • Splitで増えたシンボルやルールを削減する – 尤度の低いものは切り捨てる • SplitとMergeを直列に配置し繰り返す – 回数はタスクの精度によって決める 9
完成した文法の評価 • 以下の式で評価 – c(・・・)はカウント 10 P(Xi → Yj Zk)
= _____________ c(Xi , Yj, Zk) c(Xi)
処理の流れ inputと構文解析 11
処理の流れ splitとmerge 12
処理の流れ 完成した文法 13
実験 14 • タスク – いくつかの説明文の中から正しいものを選択 • トレーニングデータは正解:ノイズ=2:1の割合 – ベースラインはTFIDFを使用
– CAPTCHAsで評価
実験 • データ – ビデオと、複数の説明が対応したコーパス 15
結果 16 • S – splitで分割した数 • k – スムージングの閾値
例 17