Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3_Seminar_07
Search
kakubari
March 30, 2017
Technology
0
65
B3_Seminar_07
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
March 30, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
160
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
83
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
100
Labeling the Semantic Roles of Commas
kakubari
0
78
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
120
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
90
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
130
述語項構造と照応関係のアノテーション
kakubari
0
230
Other Decks in Technology
See All in Technology
自動テストのコストと向き合ってみた
qa
1
220
「使い方教えて」「事例教えて」じゃもう遅い! Microsoft 365 Copilot を触り倒そう!
taichinakamura
0
340
Uncle Bobの「プロフェッショナリズムへの期待」から学ぶプロの覚悟
nakasho
2
110
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
400
空間を設計する力を考える / 20251004 Naoki Takahashi
shift_evolve
PRO
4
460
"プロポーザルってなんか怖そう"という境界を超えてみた@TSUDOI by giftee Tech #1
shilo113
0
180
20201008_ファインディ_品質意識を育てる役目は人かAIか___2_.pdf
findy_eventslides
2
600
AI時代だからこそ考える、僕らが本当につくりたいスクラムチーム / A Scrum Team we really want to create in this AI era
takaking22
8
4.1k
リーダーになったら未来を語れるようになろう/Speak the Future
sanogemaru
0
380
【Oracle Cloud ウェビナー】クラウド導入に「専用クラウド」という選択肢、Oracle AlloyとOCI Dedicated Region とは
oracle4engineer
PRO
3
130
Adapty_東京AI祭ハッカソン2025ピッチスライド
shinoyamada
0
270
AI時代こそ求められる設計力- AWSクラウドデザインパターン3選で信頼性と拡張性を高める-
kenichirokimura
3
290
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Embracing the Ebb and Flow
colly
88
4.8k
Building Applications with DynamoDB
mza
96
6.7k
The Cost Of JavaScript in 2023
addyosmani
54
9k
Music & Morning Musume
bryan
46
6.8k
Being A Developer After 40
akosma
91
590k
Building an army of robots
kneath
306
46k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
How STYLIGHT went responsive
nonsquared
100
5.8k
Scaling GitHub
holman
463
140k
A better future with KSS
kneath
239
18k
Statistics for Hackers
jakevdp
799
220k
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ใΞΫηεධՁํ๏ᶄ 1
今日の内容 ˔جຊతͳใݕࡧධՁࢦඪ ɹɾٯॱҐ ˔ςΩετΛରͱͨ͠ใΞΫηεධՁ ɹɾ#-&6 2
Web検索の検索意図 ˔#SPEFS͕ʹࣔͨ͠ݕࡧҙਤͷ̏ͭͷλΠϓ ɾ༠ಋܕ ಛఆͷαΠτΛ๚Ε͍ͨͱ͍͏ҙਤ ɾใऩूܕ ҰͭҎ্ͷΣϒϖʔδʹॻ͔Ε͍ͯΔͱࢥΘΕΔ ใΛऔಘ͍ͨ͠ͱ͍͏ҙਤ ɾऔҾܕ ΣϒΛհͱͨ͠ΞΫγϣϯΛ࣮ߦ͍ͨ͠ͱ͍͏ ҙਤʢྫ͑ɺҿ৯ళͷ༧ʣ
3
逆数順位 ˔༠ಋܕݕࡧҙਤʹదͨ͠ධՁࢦඪ ɹɾಛఆͷαΠτΛ๚Ε͍ͨ ɹɾཉ͍͠จॻΛҰͭݟ͚͍ͭͨ ˔ٯॱҐͷఆٛ ɹݕࡧ݁Ռதɺ࠷্Ґͷద߹จॻͷϥϯΫΛS ͱ͠ɺ ద߹จॻΛؚ·ͳ͍߹ʹɺಛʹS
ʹ㱣ͱ͢Δɻ ͜ͷ࣌ͷٯॱҐ SFDJQSPDBMSBOL ɺ ಛʹɺݕࡧ݁Ռ͕ద߹จॻΛؚ·ͳ͍߹33 RR= 1 r 1 4
テキストを対象とした情報アクセス評価指標 ˔ػց༁ͷࣗಈධՁࢦඪɹ#-&6 ɹػց༁ͷࣗಈධՁͰɺਓखʹΑΔෳͷਖ਼ղ σʔλʢଈͪࢀর༁ʣΛ༩͑Δඞཁ͕͋Δɻ ɹ༁ͷํҰ௨ΓͰͳ͍ͨΊ
5
BLEU ࢀর༁T ɿ5IFDBUJTPOUIFNBU ʢୈҰͷࢀর༁ʣ ɹɹɹT ɿ5IFSFJTBDBUPOUIFNBUʢୈೋͷࢀর༁ʣ ධՁͷରͱͳΔػց༁ͷ݁ՌɿT
5IFNBUJTPOUIFDBU ͜ͷจTʹؚ·ΕΔશϢχάϥϜ HSBN T \lUIFz lNBUz lJTz lPOz lDBUz^ ྫ͑ɺzUIFzͷසͰ͋Γɺ ͜ΕΛ$ lUIFz ͷΑ͏ʹද͢ɻ 6
BLEU ಉ༷ʹɺTʹରԠ͢ΔୈҰͷࢀর༁T Ͱ $ lUIFz T
ୈೋͷࢀর༁T ʹ͍ͭͯ $ lUIFz T ػց༁ͷ݁Ռͷ֤จTΛධՁ͢Δʹɺ ࢀর༁தͰ͜ΕʹରԠ͢Δਖ਼ղ༁ͱͷۙ͞Λߟ͑Δɻ 7
BLEU Ұͭͷख͕͔Γͱͯ͠ɺ ਖ਼ղ༁ͱػց༁݁Ռͷ྆ํʹؚ·ΕΔzUIFzͷΑ͏ ͳϢχάϥϜͷසʹ͍ͭͯൺֱ͢Δɻ ྫ͑ʜ ػց༁݁ՌʹzUIFz͕ճग़ݱ͍ͯͯ͠ɺ ୈҰͷࢀর༁ʹ̎ճɺୈೋͷࢀর༁ʹ̍ճ͔͠ग़ ݱ͠ͳ͍ɻ ػց༁݁ՌʹճͷใुΛ༩͑ͳ͍ɻ
8
BLEU ैͬͯɺHSBN T HSBN T ͕ͱʹؚΉ֤Ϣχά ϥϜFʹ͍ͭͯɺසΛמΓࠐΉ
$MJQ ɻ $MJQ F T NJO NBY $ F T $ F T ྫ͑ɺ$ lUIFz T Ͱ͋ͬͯɺ ɹɹɹ$ lUIFz T Ͱ͋Εɺ $MJQ lUIFz T ̎ 9
BLEU ɹಉ༷ʹόΠάϥϜʹ͍ͭͯߟ͍͑ͯ͘ɻ ػց༁Tʹ͍ͭͯ HSBN T \lUIFNBUz lNBUJTz lJTPOz lPOUIFz
lUIFDBUz^ ͱͳΔɻ ɹҎ্ΑΓɺਖ਼ղ༁ʹؚ·Εͳ͍zNBUJTz͕ଘࡏ͢Δ ͜ͱ͕Θ͔ΓɺϢχάϥϜΑΓࡉ͔͍ධՁͰ͖Δɻ /άϥϜͰɺΑΓࡉ͔͍ධՁ͕Ͱ͖Δ 10
BLEU ػց༁݁ՌશମʢจTͷू߹ʣͷධՁΛߦ͏ࡍɺ /άϥϜͷמΓࠐΈසʹجͮ͘ࢦඪΛߟ͑Δɻ 1SFD / ɺਫ਼ʹ֤/άϥϜͷසΛಋೖͨ͠ͷʹ
૬͢Δɻ Prec N = Clip(e,s) e∈gramN (s) ∑ s ∑ C(e,s) e∈gramN (s) ∑ s ∑ 11
BLEU #-&6Ͱɺ͞Βʹ/ ʹ͍ͭͯ1SFD/ ΛҎԼ ͷΑ͏ʹ݁߹͢Δɻ
͜Εਫ਼ʹࣅͨࢦඪͷͨΊɺػց༁݁Ռʹؚ·Ε ΔϊΠζʹରͯ͠ϖφϧςΟΛ༩͑Δ͜ͱ͕Ͱ͖Δɻ PREC = exp( 1 4 lnPrec N N∈{1,2,3,4} ∑ ) 12
BLEU ˔ϖφϧςΟΛ༩͑Δج४ ػց༁݁Ռ͕ୈҰͷਖ਼ղ༁ͱશͯҰகͨ͠߹ɺ ୈೋͷਖ਼ղ༁ͷzUIFSFzΛؚ·ͳ͍͔ΒϖφϧςΟΛ ༩͑Δ͜ͱෆదɻ /άϥϜͷ࠶ݱΛߟ͑ΔΘΓʹɺ ɹػց༁݁Ռͷ͞ʹண 13
BLEU ػց༁݁Ռͷ͕͞ਖ਼ղ༁ͷ͞ͱൺֱͯ͠ʜ ᶃ͗͢Δͱஅͨ͠߹ ɹϖφϧςΟΛ༩͑Δ ᶄ͗͢Δͱஅͨ͠߹ ɹ13&$ʹΑΓϖφϧςΟ͕༩͑ΒΕΔ 14
BLEU ػց༁݁Ռதͷ֤จTʹ͍ͭͯɺରԠ͢Δਖ਼ղจT ͷ͏͕ͪ͞࠷Tʹ͍ۙͷΛબɻ ͦͷਖ਼ղจͷ͞Λ ࠷దϚονɿ#.- T Ͱද͢ɻ ͦͯ͠ɺػց༁݁Ռશମʹ͍ͭͯͦͷΛٻΊΔͱ
4#.-ػց༁݁Ռͷཧతͳ͞ʹ૬͢Δ SBML = BML(s) = arg len(s* ) min len(s)− len(s* ) s ∑ s ∑ 15
BLEU Ұํɺػց༁݁Ռͷશͷ࣮ଌ ͜ΕΒΑΓɺ#-&6ͷ؆қϖφϧςΟ 4:4-4.#-ͷ࣌ɺ#1ͱͳΓ ϖφϧςΟ͕՝͞ΕΔɻ
SYSL = len(s) s ∑ BP=exp(min(0,1- SBML SYSL )) 16
BLEU Ҏ্ͷఆٛʹج͖ͮɺ#-&6 ˔#-&6ͷ·ͱΊ ɾجຊతʹසΛߟྀͨ͠/άϥϜʹجͮ͘ਫ਼ ɾػց༁݁Ռશମͱͯ͗͢͠Δͱஅͨ͠߹ɺ ɹϖφϧςΟΛ՝͢ࢦඪ
BLEU=BP PREC 17
参考文献 ˔ใΞΫηεධՁํ๏ʢ̏ɺ̐ষʣɺञҪɺ ɹίϩφࣾɺ݄ 18