Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL P...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Yuya Unno
September 03, 2011
Technology
0
12
ACL2011読み会 EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
Yuya Unno
September 03, 2011
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
23
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
45
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
45
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
15
進化するChainer @JSAI2017
unnonouno
0
21
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
22
深層学習フレームワーク Chainerとその進化
unnonouno
0
21
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
30
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
15
Other Decks in Technology
See All in Technology
Kubernetesにおける推論基盤
ry
1
400
わたしがセキュアにAWSを使えるわけないじゃん、ムリムリ!(※ムリじゃなかった!?)
cmusudakeisuke
1
770
最強のAIエージェントを諦めたら品質が上がった話 / how quality improved after giving up on the strongest AI agent
kt2mikan
0
190
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
20260311 技術SWG活動報告(デジタルアイデンティティ人材育成推進WG Ph2 活動報告会)
oidfj
0
360
OCI技術資料 : コンピュート・サービス 概要
ocise
4
54k
組織全体で実現する標準監視設計
yuobayashi
3
490
1GB RAMのラズピッピで何ができるのか試してみよう / 20260319-rpijam-1gb-rpi-whats-possible
akkiesoft
0
120
めちゃくちゃ開発するQAエンジニアになって感じたメリットとこれからの課題感
ryuhei0000yamamoto
0
110
生成AI活用でQAエンジニアにどのような仕事が生まれるか/Support Required of QA Engineers for Generative AI
goyoki
1
220
OpenClaw を Amazon Lightsail で動かす理由
uechishingo
0
150
S3はフラットである –AWS公式SDKにも存在した、 署名付きURLにおけるパストラバーサル脆弱性– / JAWS DAYS 2026
flatt_security
0
1.8k
Featured
See All Featured
A better future with KSS
kneath
240
18k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
470
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Between Models and Reality
mayunak
2
230
Designing Experiences People Love
moore
143
24k
A designer walks into a library…
pauljervisheath
210
24k
[SF Ruby Conf 2025] Rails X
palkan
2
830
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
Documentation Writing (for coders)
carmenintech
77
5.3k
Transcript
ACL2011ಡΈձ EXPLOITING WEB-DERIVED SELECTIONAL PREFERENCE TO IMPROVE STATISTICAL DEPENDENCY PARSING
(1156) GUANGYOU ZHOU, JUN ZHAO, KANG LIU, AND LI CAI 2011/09/03 Yuya Unno (@unnonouno) 20119݄3༵
֓ཁ • Γड͚ͷબબ (selectional preference) Λwebσʔλ ͷසͰදݱ͠·ͨ͠ • Higher-order EisnerΛϕʔεʹɺΓड͚NάϥϜͷPMI
ΛಛྔʹೖΕ·ͨ͠ • ਫ਼্͕͕ͬͨΑ :-) 20119݄3༵
ࠓߋͰ͕͢Γड͚ղੳͱ • ୯ޠจઅͷʮΓड͚ؔʯΛͯΔ • ʮΓड͚ؔʯ͕Կͳͷ͔ӬԕͷṖ • ۃ͢Εਖ਼ղίʔύεʹ༩͑ΒΕ্ͨهͷ༷ͳߏ 20119݄3༵
બબͱʁ • ಛఆͷಈࢺ໊ࢺʹΓ͍҆ಈࢺ໊ࢺ͕͋Δ • ʮ…Λ৯Δʯʹɺ৯͕དྷ͍͢ • ʮͷߴ͍ϫΠϯʯͱʮஈͷߴ͍ϫΠϯʯͷߏ ͷҧ͍Λॠ࣌ʹஅͰ͖ΔͷԿނͩΖ͏ʁ • http://d.hatena.ne.jp/usata3/20070416/p2
20119݄3༵
ΞΠσΞɿΑ͘ڞى͢Δ୯ޠؒ ʹબબੑ͕͋ΔΜͰʁ • ʮͷߴ͍ʯʻʮஈͷߴ͍ʯ • Γड͚ϖΞީิͷ̎୯ޠͷڞى͢͠͞Λಛʹೖ ΕΑ͏ • ैདྷ୯ޠͱΫϥεؒͰ͍͚ͬͯͨͲɺWebεέʔ ϧͷσʔλ͕͋Ε୯ޠͱ୯ޠͰେৎͩΑͶʂ
20119݄3༵
ڞى۩߹PMIͰଌΖ͏ • ࣗݾ૬ޓใྔ (Point-wise Mutual Information) • ̎ͭͷ֬ม͕ͲΕ͘Β͍ಠཱͰͳ͍͔ • PMI(x,
y) = log (P(x, y) / P(x)P(y)) • ۮવͷڞىͰͳ͚Εߴ͍Λ࣋ͭ • ڞىස͑͞Θ͔ΕਪఆͰ͖Δ 20119݄3༵
සͷΧϯτํ๏ೋछྨ • Google V1 ίʔύε • Webεέʔϧͷେنίʔύε • Google API
• ̎ͭͷΩʔϫʔυΛೖΕͯάάͬͨ࣌ͷස 20119݄3༵
̏୯ޠͷ߹ߟ͑Δ • ̏୯ޠͬͯΈΔ • PMI(x, y, z) = log (
P(x, y, z) / P(x, y)P(y, z) ) • x, yͱy, zͷPMIͱ͍͏͜ͱ͔ͳɾɾɾ 20119݄3༵
PP-ATACHEMENTͬͯΈΔ • લஔࢺͷલޙͷ୯ޠͷબબߟ͍͑ͨ • PMIIN(x, z) = P(x, IN, z)
/ P(x) • PMIͰͳ͍ɾɾɾ • ઌͷʮ3୯ޠͷ߹ʯͰଌΕΔؾ͕͢Δɾɾɾʁ 20119݄3༵
ϕʔεߴ֊EISNERͷLOG- LINEARϞσϧ • Eisner๏ͱඇަࠩΓड͚ղੳͷղ๏ͷҰͭ • Γड͚෦ߏͷείΞͷ૯Λ࠷େԽͤ͞Δ • CKYΞϧΰϦζϜͱີͳ͕ؔ͋Δ • ৄ͘͠ࢲͷνϡʔτϦΞϧΛࢀর
• http://www.slideshare.net/unnonouno/ss-5724050 • PMIಛଞͷόΠφϦಛͱεέʔϧΛ߹ΘͤΔͨΊɺฏۉɾࢄͰਖ਼نԽ͢Δ (PMI - μ) / σ Ҏ߱ɺਤ͍ͣΕݪจΑΓ ρʮͷʯ→ʮϫΠϯʯ ͷΑ͏ͳΓड͚෦ߏ 20119݄3༵
ಛͷ༗ແͰ݁Ռͷൺֱ • ͍ͣΕʹ͠ΖબબಛΛೖΕͨ΄͏͕ྑ͍ • Google APIʹΑΔώοτΛͬͨ΄͏͕एׯΑ͍ • dep1: 1֊Eisner, dep2:
2֊Eisner, +hits: Google API, +V1: Google V1 Corpus 20119݄3༵
࠷৽ͷख๏ͱͷൺֱ • ࠷৽ͷڭࢣ͋Γ ʹෛ͚Δ • ڭࢣͳ͠σʔλΛ Θͳ͍ख๏ʹ উͯΔ 20119݄3༵
σʔλͷҧ͍͋·ΓӨڹ͕ͳ ͍ • ϩΠλʔͱGigword͔Β ࡞ͬͨίʔύε(NEWS)Ͱ ࣮ݧͨ͠ • UnigramͷͷΈʹਫ਼͕ ґଘ •
σʔλͷछྨʹґଘ͠ͳ ͍Α͏ͩ 20119݄3༵
ԕ͍Γड͚ͷਫ਼্͕େ͖ ͍ • ԕ͍Γड͚ਫ਼͕ ͪΌΜͱ্͕͍ͬͯΔ 20119݄3༵
దԠ͍ͨ࣌͠WEB NGRAMΛೖΕͨํ͕Α͍ • શ͘ͷ֎ʹྑ͍Өڹ Λ༩͑Δ͔ʁ • BioͷσʔλͰධՁ • ݁Ռతʹɺ֎ͷσʔ λͷਫ਼্͕Δ͜ͱ͕
Θ͔ͬͨ 20119݄3༵
ॴײ • ಉ͡Α͏ͳ͜ͱҎલߟ͑ͯগ࣮͠ݧ͕ͨ͠͏·͘ߦ ͔ͳ͔ͬͨ • ڭࢣ͋ΓΛؚΊɺϥϕϧͳ͠σʔλΛͬͯείΞ Λ্͛Δํ͕͠Β͘ଓ͖ͦ͏ • ҰํͰΓड͚ύεࣗવͰͳ͍͜ͱ͋Γɺ͏·͘ ͍͔ͳ͍έʔε͋Γͦ͏
20119݄3༵
·ͱΊ • Γड͚ղੳͷબબΛWebσʔλͷසͰදݱ͠·ͨ͠ • ಛʹೖΕΔͱ͖Γड͚ύε্ͷྡ୯ޠରͷPMIΛಛ ྔͷʹͯ͠ɺී௨ʹֶश͢Δ͚ͩ • طଘͷख๏ͱൺͨͱ͖ɺԕ͍Γड͚ɺ֎ͷσʔλɺ ͍ͣΕྑͷ݁Ռ •
࠷৽ͷڭࢣ͋Γʹෛ͚Δ 20119݄3༵