Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL P...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Yuya Unno
September 03, 2011
Technology
14
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
Yuya Unno
September 03, 2011
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
27
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
49
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
47
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
17
進化するChainer @JSAI2017
unnonouno
0
24
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
26
深層学習フレームワーク Chainerとその進化
unnonouno
0
24
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
42
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
17
Other Decks in Technology
See All in Technology
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
0
120
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
140
LLMにもCAP定理があるという話
harukasakihara
0
280
MCP Appsを作ってみよう
iwamot
PRO
4
350
Ruby::Boxでできること、Refinementsでできること
joker1007
3
410
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
360
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
150
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
1
1.4k
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
550
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
1.9k
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
330
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
200
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Amusing Abliteration
ianozsvald
1
200
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
850
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Building an army of robots
kneath
306
46k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Chasing Engaging Ingredients in Design
codingconduct
0
220
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
240
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
The Limits of Empathy - UXLibs8
cassininazir
1
350
Transcript
ACL2011ಡΈձ EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
(1156) GUANGYOU ZHOU, JUN ZHAO, KANG LIU, AND LI CAI 2011/09/03 Yuya Unno (@unnonouno) 20119݄3༵
֓ཁ • Γड͚ͷબબ (selectional preference) Λwebσʔλ ͷසͰදݱ͠·ͨ͠ • Higher-order EisnerΛϕʔεʹɺΓड͚NάϥϜͷPMI
ΛಛྔʹೖΕ·ͨ͠ • ਫ਼্͕͕ͬͨΑ :-) 20119݄3༵
ࠓߋͰ͕͢Γड͚ղੳͱ • ୯ޠจઅͷʮΓड͚ؔʯΛͯΔ • ʮΓड͚ؔʯ͕Կͳͷ͔ӬԕͷṖ • ۃ͢Εਖ਼ղίʔύεʹ༩͑ΒΕ্ͨهͷ༷ͳߏ 20119݄3༵
બબͱʁ • ಛఆͷಈࢺ໊ࢺʹΓ͍҆ಈࢺ໊ࢺ͕͋Δ • ʮ…Λ৯Δʯʹɺ৯͕དྷ͍͢ • ʮͷߴ͍ϫΠϯʯͱʮஈͷߴ͍ϫΠϯʯͷߏ ͷҧ͍Λॠ࣌ʹஅͰ͖ΔͷԿނͩΖ͏ʁ • http://d.hatena.ne.jp/usata3/20070416/p2
20119݄3༵
ΞΠσΞɿΑ͘ڞى͢Δ୯ޠؒ ʹબબੑ͕͋ΔΜͰʁ • ʮͷߴ͍ʯʻʮஈͷߴ͍ʯ • Γड͚ϖΞީิͷ̎୯ޠͷڞى͢͠͞Λಛʹೖ ΕΑ͏ • ैདྷ୯ޠͱΫϥεؒͰ͍͚ͬͯͨͲɺWebεέʔ ϧͷσʔλ͕͋Ε୯ޠͱ୯ޠͰେৎͩΑͶʂ
20119݄3༵
ڞى۩߹PMIͰଌΖ͏ • ࣗݾ૬ޓใྔ (Point-wise Mutual Information) • ̎ͭͷ֬ม͕ͲΕ͘Β͍ಠཱͰͳ͍͔ • PMI(x,
y) = log (P(x, y) / P(x)P(y)) • ۮવͷڞىͰͳ͚Εߴ͍Λ࣋ͭ • ڞىස͑͞Θ͔ΕਪఆͰ͖Δ 20119݄3༵
සͷΧϯτํ๏ೋछྨ • Google V1 ίʔύε • Webεέʔϧͷେنίʔύε • Google API
• ̎ͭͷΩʔϫʔυΛೖΕͯάάͬͨ࣌ͷස 20119݄3༵
̏୯ޠͷ߹ߟ͑Δ • ̏୯ޠͬͯΈΔ • PMI(x, y, z) = log (
P(x, y, z) / P(x, y)P(y, z) ) • x, yͱy, zͷPMIͱ͍͏͜ͱ͔ͳɾɾɾ 20119݄3༵
PP-ATACHEMENTͬͯΈΔ • લஔࢺͷલޙͷ୯ޠͷબબߟ͍͑ͨ • PMIIN(x, z) = P(x, IN, z)
/ P(x) • PMIͰͳ͍ɾɾɾ • ઌͷʮ3୯ޠͷ߹ʯͰଌΕΔؾ͕͢Δɾɾɾʁ 20119݄3༵
ϕʔεߴ֊EISNERͷLOG- LINEARϞσϧ • Eisner๏ͱඇަࠩΓड͚ղੳͷղ๏ͷҰͭ • Γड͚෦ߏͷείΞͷ૯Λ࠷େԽͤ͞Δ • CKYΞϧΰϦζϜͱີͳ͕ؔ͋Δ • ৄ͘͠ࢲͷνϡʔτϦΞϧΛࢀর
• http://www.slideshare.net/unnonouno/ss-5724050 • PMIಛଞͷόΠφϦಛͱεέʔϧΛ߹ΘͤΔͨΊɺฏۉɾࢄͰਖ਼نԽ͢Δ (PMI - μ) / σ Ҏ߱ɺਤ͍ͣΕݪจΑΓ ρʮͷʯ→ʮϫΠϯʯ ͷΑ͏ͳΓड͚෦ߏ 20119݄3༵
ಛͷ༗ແͰ݁Ռͷൺֱ • ͍ͣΕʹ͠ΖબબಛΛೖΕͨ΄͏͕ྑ͍ • Google APIʹΑΔώοτΛͬͨ΄͏͕एׯΑ͍ • dep1: 1֊Eisner, dep2:
2֊Eisner, +hits: Google API, +V1: Google V1 Corpus 20119݄3༵
࠷৽ͷख๏ͱͷൺֱ • ࠷৽ͷڭࢣ͋Γ ʹෛ͚Δ • ڭࢣͳ͠σʔλΛ Θͳ͍ख๏ʹ উͯΔ 20119݄3༵
σʔλͷҧ͍͋·ΓӨڹ͕ͳ ͍ • ϩΠλʔͱGigword͔Β ࡞ͬͨίʔύε(NEWS)Ͱ ࣮ݧͨ͠ • UnigramͷͷΈʹਫ਼͕ ґଘ •
σʔλͷछྨʹґଘ͠ͳ ͍Α͏ͩ 20119݄3༵
ԕ͍Γड͚ͷਫ਼্͕େ͖ ͍ • ԕ͍Γड͚ਫ਼͕ ͪΌΜͱ্͕͍ͬͯΔ 20119݄3༵
దԠ͍ͨ࣌͠WEB NGRAMΛೖΕͨํ͕Α͍ • શ͘ͷ֎ʹྑ͍Өڹ Λ༩͑Δ͔ʁ • BioͷσʔλͰධՁ • ݁Ռతʹɺ֎ͷσʔ λͷਫ਼্͕Δ͜ͱ͕
Θ͔ͬͨ 20119݄3༵
ॴײ • ಉ͡Α͏ͳ͜ͱҎલߟ͑ͯগ࣮͠ݧ͕ͨ͠͏·͘ߦ ͔ͳ͔ͬͨ • ڭࢣ͋ΓΛؚΊɺϥϕϧͳ͠σʔλΛͬͯείΞ Λ্͛Δํ͕͠Β͘ଓ͖ͦ͏ • ҰํͰΓड͚ύεࣗવͰͳ͍͜ͱ͋Γɺ͏·͘ ͍͔ͳ͍έʔε͋Γͦ͏
20119݄3༵
·ͱΊ • Γड͚ղੳͷબબΛWebσʔλͷසͰදݱ͠·ͨ͠ • ಛʹೖΕΔͱ͖Γड͚ύε্ͷྡ୯ޠରͷPMIΛಛ ྔͷʹͯ͠ɺී௨ʹֶश͢Δ͚ͩ • طଘͷख๏ͱൺͨͱ͖ɺԕ͍Γड͚ɺ֎ͷσʔλɺ ͍ͣΕྑͷ݁Ռ •
࠷৽ͷڭࢣ͋Γʹෛ͚Δ 20119݄3༵