Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介10月
Search
miyanishi
October 22, 2015
0
200
文献紹介10月
miyanishi
October 22, 2015
Tweet
Share
More Decks by miyanishi
See All by miyanishi
平成27年度最終ゼミ
miyanishi
0
86
文献紹介1月
miyanishi
0
190
文献紹介12月
miyanishi
0
250
文献紹介11月
miyanishi
0
250
文献紹介(2015/09)
miyanishi
0
220
文献紹介8月(PPDB)
miyanishi
0
340
文献紹介15年08月
miyanishi
0
240
15年7月文献紹介
miyanishi
0
260
文献紹介15年06月
miyanishi
0
260
Featured
See All Featured
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
200
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
Speed Design
sergeychernyshev
33
1.5k
Heart Work Chapter 1 - Part 1
lfama
PRO
5
35k
Practical Orchestrator
shlominoach
191
11k
Marketing to machines
jonoalderson
1
4.7k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
240
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
430
Google's AI Overviews - The New Search
badams
0
910
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Designing for Performance
lara
610
70k
Transcript
文献紹介 自然言語処理研究室 修士2年 宮西 由貴 1
文献情報 Semantic Neighborhoods as Hypergraphs – 著者:Chris Quirk, Pallavi Choudhury
– 会議:Association for Computational Lingui stics 2013 – ページ: 222–227 2
概略 • Hypergraphsを用いて表現 – Hypergraphの自動構築 – 簡単な文章認識タスクで評価 文のバリエーションを許す表現方法の提案 3
文のバリエーションを許す表現 • 文の様々な曖昧性を保存 – 語 – フレーズ – 語順 •
機械翻訳評価や言い換え認識などで有効 • 従来:ラティスを使用 – 語順の曖昧性があると組み合わせが多くなる 4
例えば… • 同じ映像を見て書かれた文 – A man is sliding a cat
on the floor. – A boy cleaning the floor with the cat. – A cat is being pushed across the floor by a man. 5
ハイパーグラフの構築 • おおまかな流れ – 構文解析(Penn Treebankparser) – Split – Merge
– 完成した文法の評価 – スムージングと刈り取り(速度と精度の向上) 6 ルールの改良を 繰り返す
ハイパーグラフ • グラフを拡張した表現方法 – エッジが複数のノードを連結できる – 通常のグラフより自由度が高い • 文脈自由文法をハイパーグラフで描ける 7
Split • 深層格のアノテーション – 新たなシンボルを作る – 親・右の子・左の子とのルールを作る – 文法のパラメータはEMで最適化 (例)NP
から 主格を表すNP0 と目的格を表すNP1を作成 →NPのシンボルを持つ部分をNP0、NP1と置き換える →隣接した語とのルールを作成 8
Mergeと繰り返し • Splitで増えたシンボルやルールを削減する – 尤度の低いものは切り捨てる • SplitとMergeを直列に配置し繰り返す – 回数はタスクの精度によって決める 9
完成した文法の評価 • 以下の式で評価 – c(・・・)はカウント 10 P(Xi → Yj Zk)
= _____________ c(Xi , Yj, Zk) c(Xi)
処理の流れ inputと構文解析 11
処理の流れ splitとmerge 12
処理の流れ 完成した文法 13
実験 14 • タスク – いくつかの説明文の中から正しいものを選択 • トレーニングデータは正解:ノイズ=2:1の割合 – ベースラインはTFIDFを使用
– CAPTCHAsで評価
実験 • データ – ビデオと、複数の説明が対応したコーパス 15
結果 16 • S – splitで分割した数 • k – スムージングの閾値
例 17