Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介10月
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
miyanishi
October 22, 2015
0
200
文献紹介10月
miyanishi
October 22, 2015
Tweet
Share
More Decks by miyanishi
See All by miyanishi
平成27年度最終ゼミ
miyanishi
0
86
文献紹介1月
miyanishi
0
190
文献紹介12月
miyanishi
0
250
文献紹介11月
miyanishi
0
250
文献紹介(2015/09)
miyanishi
0
220
文献紹介8月(PPDB)
miyanishi
0
340
文献紹介15年08月
miyanishi
0
240
15年7月文献紹介
miyanishi
0
260
文献紹介15年06月
miyanishi
0
260
Featured
See All Featured
BBQ
matthewcrist
89
10k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
170
Between Models and Reality
mayunak
1
200
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
180
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
Being A Developer After 40
akosma
91
590k
A better future with KSS
kneath
240
18k
Unsuck your backbone
ammeep
671
58k
Six Lessons from altMBA
skipperchong
29
4.2k
Transcript
文献紹介 自然言語処理研究室 修士2年 宮西 由貴 1
文献情報 Semantic Neighborhoods as Hypergraphs – 著者:Chris Quirk, Pallavi Choudhury
– 会議:Association for Computational Lingui stics 2013 – ページ: 222–227 2
概略 • Hypergraphsを用いて表現 – Hypergraphの自動構築 – 簡単な文章認識タスクで評価 文のバリエーションを許す表現方法の提案 3
文のバリエーションを許す表現 • 文の様々な曖昧性を保存 – 語 – フレーズ – 語順 •
機械翻訳評価や言い換え認識などで有効 • 従来:ラティスを使用 – 語順の曖昧性があると組み合わせが多くなる 4
例えば… • 同じ映像を見て書かれた文 – A man is sliding a cat
on the floor. – A boy cleaning the floor with the cat. – A cat is being pushed across the floor by a man. 5
ハイパーグラフの構築 • おおまかな流れ – 構文解析(Penn Treebankparser) – Split – Merge
– 完成した文法の評価 – スムージングと刈り取り(速度と精度の向上) 6 ルールの改良を 繰り返す
ハイパーグラフ • グラフを拡張した表現方法 – エッジが複数のノードを連結できる – 通常のグラフより自由度が高い • 文脈自由文法をハイパーグラフで描ける 7
Split • 深層格のアノテーション – 新たなシンボルを作る – 親・右の子・左の子とのルールを作る – 文法のパラメータはEMで最適化 (例)NP
から 主格を表すNP0 と目的格を表すNP1を作成 →NPのシンボルを持つ部分をNP0、NP1と置き換える →隣接した語とのルールを作成 8
Mergeと繰り返し • Splitで増えたシンボルやルールを削減する – 尤度の低いものは切り捨てる • SplitとMergeを直列に配置し繰り返す – 回数はタスクの精度によって決める 9
完成した文法の評価 • 以下の式で評価 – c(・・・)はカウント 10 P(Xi → Yj Zk)
= _____________ c(Xi , Yj, Zk) c(Xi)
処理の流れ inputと構文解析 11
処理の流れ splitとmerge 12
処理の流れ 完成した文法 13
実験 14 • タスク – いくつかの説明文の中から正しいものを選択 • トレーニングデータは正解:ノイズ=2:1の割合 – ベースラインはTFIDFを使用
– CAPTCHAsで評価
実験 • データ – ビデオと、複数の説明が対応したコーパス 15
結果 16 • S – splitで分割した数 • k – スムージングの閾値
例 17