Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL P...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Yuya Unno
September 03, 2011
Technology
0
12
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
Yuya Unno
September 03, 2011
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
22
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
44
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
45
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
14
進化するChainer @JSAI2017
unnonouno
0
19
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
20
深層学習フレームワーク Chainerとその進化
unnonouno
0
20
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
28
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
15
Other Decks in Technology
See All in Technology
Bedrock PolicyでAmazon Bedrock Guardrails利用を強制してみた
yuu551
0
260
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.6k
Red Hat OpenStack Services on OpenShift
tamemiya
0
130
SRE Enabling戦記 - 急成長する組織にSREを浸透させる戦いの歴史
markie1009
0
170
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
120
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
340
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1k
日本の85%が使う公共SaaSは、どう育ったのか
taketakekaho
1
240
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
290
ブロックテーマでサイトをリニューアルした話 / 2026-01-31 Kansai WordPress Meetup
torounit
0
480
【Oracle Cloud ウェビナー】[Oracle AI Database + AWS] Oracle Database@AWSで広がるクラウドの新たな選択肢とAI時代のデータ戦略
oracle4engineer
PRO
2
180
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.1k
Are puppies a ranking factor?
jonoalderson
1
2.7k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
440
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
290
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
What does AI have to do with Human Rights?
axbom
PRO
0
2k
Unsuck your backbone
ammeep
671
58k
Chasing Engaging Ingredients in Design
codingconduct
0
110
Believing is Seeing
oripsolob
1
58
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
440
Transcript
ACL2011ಡΈձ EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
(1156) GUANGYOU ZHOU, JUN ZHAO, KANG LIU, AND LI CAI 2011/09/03 Yuya Unno (@unnonouno) 20119݄3༵
֓ཁ • Γड͚ͷબબ (selectional preference) Λwebσʔλ ͷසͰදݱ͠·ͨ͠ • Higher-order EisnerΛϕʔεʹɺΓड͚NάϥϜͷPMI
ΛಛྔʹೖΕ·ͨ͠ • ਫ਼্͕͕ͬͨΑ :-) 20119݄3༵
ࠓߋͰ͕͢Γड͚ղੳͱ • ୯ޠจઅͷʮΓड͚ؔʯΛͯΔ • ʮΓड͚ؔʯ͕Կͳͷ͔ӬԕͷṖ • ۃ͢Εਖ਼ղίʔύεʹ༩͑ΒΕ্ͨهͷ༷ͳߏ 20119݄3༵
બબͱʁ • ಛఆͷಈࢺ໊ࢺʹΓ͍҆ಈࢺ໊ࢺ͕͋Δ • ʮ…Λ৯Δʯʹɺ৯͕དྷ͍͢ • ʮͷߴ͍ϫΠϯʯͱʮஈͷߴ͍ϫΠϯʯͷߏ ͷҧ͍Λॠ࣌ʹஅͰ͖ΔͷԿނͩΖ͏ʁ • http://d.hatena.ne.jp/usata3/20070416/p2
20119݄3༵
ΞΠσΞɿΑ͘ڞى͢Δ୯ޠؒ ʹબબੑ͕͋ΔΜͰʁ • ʮͷߴ͍ʯʻʮஈͷߴ͍ʯ • Γड͚ϖΞީิͷ̎୯ޠͷڞى͢͠͞Λಛʹೖ ΕΑ͏ • ैདྷ୯ޠͱΫϥεؒͰ͍͚ͬͯͨͲɺWebεέʔ ϧͷσʔλ͕͋Ε୯ޠͱ୯ޠͰେৎͩΑͶʂ
20119݄3༵
ڞى۩߹PMIͰଌΖ͏ • ࣗݾ૬ޓใྔ (Point-wise Mutual Information) • ̎ͭͷ֬ม͕ͲΕ͘Β͍ಠཱͰͳ͍͔ • PMI(x,
y) = log (P(x, y) / P(x)P(y)) • ۮવͷڞىͰͳ͚Εߴ͍Λ࣋ͭ • ڞىස͑͞Θ͔ΕਪఆͰ͖Δ 20119݄3༵
සͷΧϯτํ๏ೋछྨ • Google V1 ίʔύε • Webεέʔϧͷେنίʔύε • Google API
• ̎ͭͷΩʔϫʔυΛೖΕͯάάͬͨ࣌ͷස 20119݄3༵
̏୯ޠͷ߹ߟ͑Δ • ̏୯ޠͬͯΈΔ • PMI(x, y, z) = log (
P(x, y, z) / P(x, y)P(y, z) ) • x, yͱy, zͷPMIͱ͍͏͜ͱ͔ͳɾɾɾ 20119݄3༵
PP-ATACHEMENTͬͯΈΔ • લஔࢺͷલޙͷ୯ޠͷબબߟ͍͑ͨ • PMIIN(x, z) = P(x, IN, z)
/ P(x) • PMIͰͳ͍ɾɾɾ • ઌͷʮ3୯ޠͷ߹ʯͰଌΕΔؾ͕͢Δɾɾɾʁ 20119݄3༵
ϕʔεߴ֊EISNERͷLOG- LINEARϞσϧ • Eisner๏ͱඇަࠩΓड͚ղੳͷղ๏ͷҰͭ • Γड͚෦ߏͷείΞͷ૯Λ࠷େԽͤ͞Δ • CKYΞϧΰϦζϜͱີͳ͕ؔ͋Δ • ৄ͘͠ࢲͷνϡʔτϦΞϧΛࢀর
• http://www.slideshare.net/unnonouno/ss-5724050 • PMIಛଞͷόΠφϦಛͱεέʔϧΛ߹ΘͤΔͨΊɺฏۉɾࢄͰਖ਼نԽ͢Δ (PMI - μ) / σ Ҏ߱ɺਤ͍ͣΕݪจΑΓ ρʮͷʯ→ʮϫΠϯʯ ͷΑ͏ͳΓड͚෦ߏ 20119݄3༵
ಛͷ༗ແͰ݁Ռͷൺֱ • ͍ͣΕʹ͠ΖબબಛΛೖΕͨ΄͏͕ྑ͍ • Google APIʹΑΔώοτΛͬͨ΄͏͕एׯΑ͍ • dep1: 1֊Eisner, dep2:
2֊Eisner, +hits: Google API, +V1: Google V1 Corpus 20119݄3༵
࠷৽ͷख๏ͱͷൺֱ • ࠷৽ͷڭࢣ͋Γ ʹෛ͚Δ • ڭࢣͳ͠σʔλΛ Θͳ͍ख๏ʹ উͯΔ 20119݄3༵
σʔλͷҧ͍͋·ΓӨڹ͕ͳ ͍ • ϩΠλʔͱGigword͔Β ࡞ͬͨίʔύε(NEWS)Ͱ ࣮ݧͨ͠ • UnigramͷͷΈʹਫ਼͕ ґଘ •
σʔλͷछྨʹґଘ͠ͳ ͍Α͏ͩ 20119݄3༵
ԕ͍Γड͚ͷਫ਼্͕େ͖ ͍ • ԕ͍Γड͚ਫ਼͕ ͪΌΜͱ্͕͍ͬͯΔ 20119݄3༵
దԠ͍ͨ࣌͠WEB NGRAMΛೖΕͨํ͕Α͍ • શ͘ͷ֎ʹྑ͍Өڹ Λ༩͑Δ͔ʁ • BioͷσʔλͰධՁ • ݁Ռతʹɺ֎ͷσʔ λͷਫ਼্͕Δ͜ͱ͕
Θ͔ͬͨ 20119݄3༵
ॴײ • ಉ͡Α͏ͳ͜ͱҎલߟ͑ͯগ࣮͠ݧ͕ͨ͠͏·͘ߦ ͔ͳ͔ͬͨ • ڭࢣ͋ΓΛؚΊɺϥϕϧͳ͠σʔλΛͬͯείΞ Λ্͛Δํ͕͠Β͘ଓ͖ͦ͏ • ҰํͰΓड͚ύεࣗવͰͳ͍͜ͱ͋Γɺ͏·͘ ͍͔ͳ͍έʔε͋Γͦ͏
20119݄3༵
·ͱΊ • Γड͚ղੳͷબબΛWebσʔλͷසͰදݱ͠·ͨ͠ • ಛʹೖΕΔͱ͖Γड͚ύε্ͷྡ୯ޠରͷPMIΛಛ ྔͷʹͯ͠ɺී௨ʹֶश͢Δ͚ͩ • طଘͷख๏ͱൺͨͱ͖ɺԕ͍Γड͚ɺ֎ͷσʔλɺ ͍ͣΕྑͷ݁Ռ •
࠷৽ͷڭࢣ͋Γʹෛ͚Δ 20119݄3༵