Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介10月
Search
miyanishi
October 22, 2015
200
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
文献紹介10月
miyanishi
October 22, 2015
More Decks by miyanishi
See All by miyanishi
平成27年度最終ゼミ
miyanishi
0
91
文献紹介1月
miyanishi
0
200
文献紹介12月
miyanishi
0
260
文献紹介11月
miyanishi
0
260
文献紹介(2015/09)
miyanishi
0
230
文献紹介8月(PPDB)
miyanishi
0
340
文献紹介15年08月
miyanishi
0
240
15年7月文献紹介
miyanishi
0
270
文献紹介15年06月
miyanishi
0
270
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
エンジニアに許された特別な時間の終わり
watany
107
250k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
What's in a price? How to price your products and services
michaelherold
247
13k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
140
How to Think Like a Performance Engineer
csswizardry
28
2.6k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Unsuck your backbone
ammeep
672
58k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
The Language of Interfaces
destraynor
162
27k
WCS-LA-2024
lcolladotor
0
620
Transcript
文献紹介 自然言語処理研究室 修士2年 宮西 由貴 1
文献情報 Semantic Neighborhoods as Hypergraphs – 著者:Chris Quirk, Pallavi Choudhury
– 会議:Association for Computational Lingui stics 2013 – ページ: 222–227 2
概略 • Hypergraphsを用いて表現 – Hypergraphの自動構築 – 簡単な文章認識タスクで評価 文のバリエーションを許す表現方法の提案 3
文のバリエーションを許す表現 • 文の様々な曖昧性を保存 – 語 – フレーズ – 語順 •
機械翻訳評価や言い換え認識などで有効 • 従来:ラティスを使用 – 語順の曖昧性があると組み合わせが多くなる 4
例えば… • 同じ映像を見て書かれた文 – A man is sliding a cat
on the floor. – A boy cleaning the floor with the cat. – A cat is being pushed across the floor by a man. 5
ハイパーグラフの構築 • おおまかな流れ – 構文解析(Penn Treebankparser) – Split – Merge
– 完成した文法の評価 – スムージングと刈り取り(速度と精度の向上) 6 ルールの改良を 繰り返す
ハイパーグラフ • グラフを拡張した表現方法 – エッジが複数のノードを連結できる – 通常のグラフより自由度が高い • 文脈自由文法をハイパーグラフで描ける 7
Split • 深層格のアノテーション – 新たなシンボルを作る – 親・右の子・左の子とのルールを作る – 文法のパラメータはEMで最適化 (例)NP
から 主格を表すNP0 と目的格を表すNP1を作成 →NPのシンボルを持つ部分をNP0、NP1と置き換える →隣接した語とのルールを作成 8
Mergeと繰り返し • Splitで増えたシンボルやルールを削減する – 尤度の低いものは切り捨てる • SplitとMergeを直列に配置し繰り返す – 回数はタスクの精度によって決める 9
完成した文法の評価 • 以下の式で評価 – c(・・・)はカウント 10 P(Xi → Yj Zk)
= _____________ c(Xi , Yj, Zk) c(Xi)
処理の流れ inputと構文解析 11
処理の流れ splitとmerge 12
処理の流れ 完成した文法 13
実験 14 • タスク – いくつかの説明文の中から正しいものを選択 • トレーニングデータは正解:ノイズ=2:1の割合 – ベースラインはTFIDFを使用
– CAPTCHAsで評価
実験 • データ – ビデオと、複数の説明が対応したコーパス 15
結果 16 • S – splitで分割した数 • k – スムージングの閾値
例 17