Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL P...
Search
Yuya Unno
September 03, 2011
Technology
0
12
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
Yuya Unno
September 03, 2011
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
20
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
39
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
36
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
11
進化するChainer @JSAI2017
unnonouno
0
19
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
16
深層学習フレームワーク Chainerとその進化
unnonouno
0
18
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
27
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
13
Other Decks in Technology
See All in Technology
なぜフロントエンド技術を追うのか?なぜカンファレンスに参加するのか?
sakito
9
2k
原理から解き明かす AIと人間の成長 - Progate BAR
teba_eleven
2
300
pmconf2025 - 他社事例を"自社仕様化"する技術_iRAFT法
daichi_yamashita
0
610
Data Hubグループ 紹介資料
sansan33
PRO
0
2.3k
オープンデータの内製化から分かったGISデータを巡る行政の課題
naokim84
2
1.4k
Microsoft Agent 365 を 30 分でなんとなく理解する
skmkzyk
1
360
翻訳・対話・越境で強いチームワークを作ろう! / Building Strong Teamwork through Interpretation, Dialogue, and Border-Crossing
ar_tama
4
1.7k
Product Engineer
resilire
0
140
M5UnifiedとPicoRubyで楽しむM5シリーズ
kishima
0
120
生成AI時代の自動E2Eテスト運用とPlaywright実践知_引持力哉
legalontechnologies
PRO
0
150
MS Ignite 2025で発表されたFoundry IQをRecap
satodayo
3
240
法人支出管理領域におけるソフトウェアアーキテクチャに基づいたテスト戦略の実践
ogugu9
1
170
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Practical Orchestrator
shlominoach
190
11k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Building Adaptive Systems
keathley
44
2.9k
Leading Effective Engineering Teams in the AI Era
addyosmani
8
1.3k
It's Worth the Effort
3n
187
29k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.8k
How STYLIGHT went responsive
nonsquared
100
5.9k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
A Tale of Four Properties
chriscoyier
162
23k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Transcript
ACL2011ಡΈձ EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
(1156) GUANGYOU ZHOU, JUN ZHAO, KANG LIU, AND LI CAI 2011/09/03 Yuya Unno (@unnonouno) 20119݄3༵
֓ཁ • Γड͚ͷબબ (selectional preference) Λwebσʔλ ͷසͰදݱ͠·ͨ͠ • Higher-order EisnerΛϕʔεʹɺΓड͚NάϥϜͷPMI
ΛಛྔʹೖΕ·ͨ͠ • ਫ਼্͕͕ͬͨΑ :-) 20119݄3༵
ࠓߋͰ͕͢Γड͚ղੳͱ • ୯ޠจઅͷʮΓड͚ؔʯΛͯΔ • ʮΓड͚ؔʯ͕Կͳͷ͔ӬԕͷṖ • ۃ͢Εਖ਼ղίʔύεʹ༩͑ΒΕ্ͨهͷ༷ͳߏ 20119݄3༵
બબͱʁ • ಛఆͷಈࢺ໊ࢺʹΓ͍҆ಈࢺ໊ࢺ͕͋Δ • ʮ…Λ৯Δʯʹɺ৯͕དྷ͍͢ • ʮͷߴ͍ϫΠϯʯͱʮஈͷߴ͍ϫΠϯʯͷߏ ͷҧ͍Λॠ࣌ʹஅͰ͖ΔͷԿނͩΖ͏ʁ • http://d.hatena.ne.jp/usata3/20070416/p2
20119݄3༵
ΞΠσΞɿΑ͘ڞى͢Δ୯ޠؒ ʹબબੑ͕͋ΔΜͰʁ • ʮͷߴ͍ʯʻʮஈͷߴ͍ʯ • Γड͚ϖΞީิͷ̎୯ޠͷڞى͢͠͞Λಛʹೖ ΕΑ͏ • ैདྷ୯ޠͱΫϥεؒͰ͍͚ͬͯͨͲɺWebεέʔ ϧͷσʔλ͕͋Ε୯ޠͱ୯ޠͰେৎͩΑͶʂ
20119݄3༵
ڞى۩߹PMIͰଌΖ͏ • ࣗݾ૬ޓใྔ (Point-wise Mutual Information) • ̎ͭͷ֬ม͕ͲΕ͘Β͍ಠཱͰͳ͍͔ • PMI(x,
y) = log (P(x, y) / P(x)P(y)) • ۮવͷڞىͰͳ͚Εߴ͍Λ࣋ͭ • ڞىස͑͞Θ͔ΕਪఆͰ͖Δ 20119݄3༵
සͷΧϯτํ๏ೋछྨ • Google V1 ίʔύε • Webεέʔϧͷେنίʔύε • Google API
• ̎ͭͷΩʔϫʔυΛೖΕͯάάͬͨ࣌ͷස 20119݄3༵
̏୯ޠͷ߹ߟ͑Δ • ̏୯ޠͬͯΈΔ • PMI(x, y, z) = log (
P(x, y, z) / P(x, y)P(y, z) ) • x, yͱy, zͷPMIͱ͍͏͜ͱ͔ͳɾɾɾ 20119݄3༵
PP-ATACHEMENTͬͯΈΔ • લஔࢺͷલޙͷ୯ޠͷબબߟ͍͑ͨ • PMIIN(x, z) = P(x, IN, z)
/ P(x) • PMIͰͳ͍ɾɾɾ • ઌͷʮ3୯ޠͷ߹ʯͰଌΕΔؾ͕͢Δɾɾɾʁ 20119݄3༵
ϕʔεߴ֊EISNERͷLOG- LINEARϞσϧ • Eisner๏ͱඇަࠩΓड͚ղੳͷղ๏ͷҰͭ • Γड͚෦ߏͷείΞͷ૯Λ࠷େԽͤ͞Δ • CKYΞϧΰϦζϜͱີͳ͕ؔ͋Δ • ৄ͘͠ࢲͷνϡʔτϦΞϧΛࢀর
• http://www.slideshare.net/unnonouno/ss-5724050 • PMIಛଞͷόΠφϦಛͱεέʔϧΛ߹ΘͤΔͨΊɺฏۉɾࢄͰਖ਼نԽ͢Δ (PMI - μ) / σ Ҏ߱ɺਤ͍ͣΕݪจΑΓ ρʮͷʯ→ʮϫΠϯʯ ͷΑ͏ͳΓड͚෦ߏ 20119݄3༵
ಛͷ༗ແͰ݁Ռͷൺֱ • ͍ͣΕʹ͠ΖબબಛΛೖΕͨ΄͏͕ྑ͍ • Google APIʹΑΔώοτΛͬͨ΄͏͕एׯΑ͍ • dep1: 1֊Eisner, dep2:
2֊Eisner, +hits: Google API, +V1: Google V1 Corpus 20119݄3༵
࠷৽ͷख๏ͱͷൺֱ • ࠷৽ͷڭࢣ͋Γ ʹෛ͚Δ • ڭࢣͳ͠σʔλΛ Θͳ͍ख๏ʹ উͯΔ 20119݄3༵
σʔλͷҧ͍͋·ΓӨڹ͕ͳ ͍ • ϩΠλʔͱGigword͔Β ࡞ͬͨίʔύε(NEWS)Ͱ ࣮ݧͨ͠ • UnigramͷͷΈʹਫ਼͕ ґଘ •
σʔλͷछྨʹґଘ͠ͳ ͍Α͏ͩ 20119݄3༵
ԕ͍Γड͚ͷਫ਼্͕େ͖ ͍ • ԕ͍Γड͚ਫ਼͕ ͪΌΜͱ্͕͍ͬͯΔ 20119݄3༵
దԠ͍ͨ࣌͠WEB NGRAMΛೖΕͨํ͕Α͍ • શ͘ͷ֎ʹྑ͍Өڹ Λ༩͑Δ͔ʁ • BioͷσʔλͰධՁ • ݁Ռతʹɺ֎ͷσʔ λͷਫ਼্͕Δ͜ͱ͕
Θ͔ͬͨ 20119݄3༵
ॴײ • ಉ͡Α͏ͳ͜ͱҎલߟ͑ͯগ࣮͠ݧ͕ͨ͠͏·͘ߦ ͔ͳ͔ͬͨ • ڭࢣ͋ΓΛؚΊɺϥϕϧͳ͠σʔλΛͬͯείΞ Λ্͛Δํ͕͠Β͘ଓ͖ͦ͏ • ҰํͰΓड͚ύεࣗવͰͳ͍͜ͱ͋Γɺ͏·͘ ͍͔ͳ͍έʔε͋Γͦ͏
20119݄3༵
·ͱΊ • Γड͚ղੳͷબબΛWebσʔλͷසͰදݱ͠·ͨ͠ • ಛʹೖΕΔͱ͖Γड͚ύε্ͷྡ୯ޠରͷPMIΛಛ ྔͷʹͯ͠ɺී௨ʹֶश͢Δ͚ͩ • طଘͷख๏ͱൺͨͱ͖ɺԕ͍Γड͚ɺ֎ͷσʔλɺ ͍ͣΕྑͷ݁Ռ •
࠷৽ͷڭࢣ͋Γʹෛ͚Δ 20119݄3༵