Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3_Seminar_07
Search
kakubari
March 30, 2017
Technology
0
66
B3_Seminar_07
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
March 30, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
170
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
88
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
100
Labeling the Semantic Roles of Commas
kakubari
0
83
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
120
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
91
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
130
述語項構造と照応関係のアノテーション
kakubari
0
240
Other Decks in Technology
See All in Technology
Oracle Cloud Infrastructure IaaS 新機能アップデート 2025/09 - 2025/11
oracle4engineer
PRO
0
160
RAG/Agent開発のアップデートまとめ
taka0709
0
190
Sansanが実践する Platform EngineeringとSREの協創
sansantech
PRO
2
930
AI駆動開発における設計思想 認知負荷を下げるフロントエンドアーキテクチャ/ 20251211 Teppei Hanai
shift_evolve
PRO
2
420
1人1サービス開発しているチームでのClaudeCodeの使い方
noayaoshiro
2
420
打 造 A I 驅 動 的 G i t H u b ⾃ 動 化 ⼯ 作 流 程
appleboy
0
360
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
160
ウェルネス SaaS × AI、1,000万ユーザーを支える 業界特化 AI プロダクト開発への道のり
hacomono
PRO
0
150
ChatGPTで論⽂は読めるのか
spatial_ai_network
11
29k
プロンプトやエージェントを自動的に作る方法
shibuiwilliam
13
12k
【U/day Tokyo 2025】Cygames流 最新スマートフォンゲームの技術設計 〜『Shadowverse: Worlds Beyond』におけるアーキテクチャ再設計の挑戦~
cygames
PRO
2
730
Microsoft Agent 365 についてゆっくりじっくり理解する!
skmkzyk
0
380
Featured
See All Featured
Chasing Engaging Ingredients in Design
codingconduct
0
71
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
67
Measuring & Analyzing Core Web Vitals
bluesmoon
9
710
Done Done
chrislema
186
16k
Documentation Writing (for coders)
carmenintech
77
5.2k
Practical Orchestrator
shlominoach
190
11k
Building Flexible Design Systems
yeseniaperezcruz
330
39k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
Scaling GitHub
holman
464
140k
Being A Developer After 40
akosma
91
590k
We Are The Robots
honzajavorek
0
110
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ใΞΫηεධՁํ๏ᶄ 1
今日の内容 ˔جຊతͳใݕࡧධՁࢦඪ ɹɾٯॱҐ ˔ςΩετΛରͱͨ͠ใΞΫηεධՁ ɹɾ#-&6 2
Web検索の検索意図 ˔#SPEFS͕ʹࣔͨ͠ݕࡧҙਤͷ̏ͭͷλΠϓ ɾ༠ಋܕ ಛఆͷαΠτΛ๚Ε͍ͨͱ͍͏ҙਤ ɾใऩूܕ ҰͭҎ্ͷΣϒϖʔδʹॻ͔Ε͍ͯΔͱࢥΘΕΔ ใΛऔಘ͍ͨ͠ͱ͍͏ҙਤ ɾऔҾܕ ΣϒΛհͱͨ͠ΞΫγϣϯΛ࣮ߦ͍ͨ͠ͱ͍͏ ҙਤʢྫ͑ɺҿ৯ళͷ༧ʣ
3
逆数順位 ˔༠ಋܕݕࡧҙਤʹదͨ͠ධՁࢦඪ ɹɾಛఆͷαΠτΛ๚Ε͍ͨ ɹɾཉ͍͠จॻΛҰͭݟ͚͍ͭͨ ˔ٯॱҐͷఆٛ ɹݕࡧ݁Ռதɺ࠷্Ґͷద߹จॻͷϥϯΫΛS ͱ͠ɺ ద߹จॻΛؚ·ͳ͍߹ʹɺಛʹS
ʹ㱣ͱ͢Δɻ ͜ͷ࣌ͷٯॱҐ SFDJQSPDBMSBOL ɺ ಛʹɺݕࡧ݁Ռ͕ద߹จॻΛؚ·ͳ͍߹33 RR= 1 r 1 4
テキストを対象とした情報アクセス評価指標 ˔ػց༁ͷࣗಈධՁࢦඪɹ#-&6 ɹػց༁ͷࣗಈධՁͰɺਓखʹΑΔෳͷਖ਼ղ σʔλʢଈͪࢀর༁ʣΛ༩͑Δඞཁ͕͋Δɻ ɹ༁ͷํҰ௨ΓͰͳ͍ͨΊ
5
BLEU ࢀর༁T ɿ5IFDBUJTPOUIFNBU ʢୈҰͷࢀর༁ʣ ɹɹɹT ɿ5IFSFJTBDBUPOUIFNBUʢୈೋͷࢀর༁ʣ ධՁͷରͱͳΔػց༁ͷ݁ՌɿT
5IFNBUJTPOUIFDBU ͜ͷจTʹؚ·ΕΔશϢχάϥϜ HSBN T \lUIFz lNBUz lJTz lPOz lDBUz^ ྫ͑ɺzUIFzͷසͰ͋Γɺ ͜ΕΛ$ lUIFz ͷΑ͏ʹද͢ɻ 6
BLEU ಉ༷ʹɺTʹରԠ͢ΔୈҰͷࢀর༁T Ͱ $ lUIFz T
ୈೋͷࢀর༁T ʹ͍ͭͯ $ lUIFz T ػց༁ͷ݁Ռͷ֤จTΛධՁ͢Δʹɺ ࢀর༁தͰ͜ΕʹରԠ͢Δਖ਼ղ༁ͱͷۙ͞Λߟ͑Δɻ 7
BLEU Ұͭͷख͕͔Γͱͯ͠ɺ ਖ਼ղ༁ͱػց༁݁Ռͷ྆ํʹؚ·ΕΔzUIFzͷΑ͏ ͳϢχάϥϜͷසʹ͍ͭͯൺֱ͢Δɻ ྫ͑ʜ ػց༁݁ՌʹzUIFz͕ճग़ݱ͍ͯͯ͠ɺ ୈҰͷࢀর༁ʹ̎ճɺୈೋͷࢀর༁ʹ̍ճ͔͠ग़ ݱ͠ͳ͍ɻ ػց༁݁ՌʹճͷใुΛ༩͑ͳ͍ɻ
8
BLEU ैͬͯɺHSBN T HSBN T ͕ͱʹؚΉ֤Ϣχά ϥϜFʹ͍ͭͯɺසΛמΓࠐΉ
$MJQ ɻ $MJQ F T NJO NBY $ F T $ F T ྫ͑ɺ$ lUIFz T Ͱ͋ͬͯɺ ɹɹɹ$ lUIFz T Ͱ͋Εɺ $MJQ lUIFz T ̎ 9
BLEU ɹಉ༷ʹόΠάϥϜʹ͍ͭͯߟ͍͑ͯ͘ɻ ػց༁Tʹ͍ͭͯ HSBN T \lUIFNBUz lNBUJTz lJTPOz lPOUIFz
lUIFDBUz^ ͱͳΔɻ ɹҎ্ΑΓɺਖ਼ղ༁ʹؚ·Εͳ͍zNBUJTz͕ଘࡏ͢Δ ͜ͱ͕Θ͔ΓɺϢχάϥϜΑΓࡉ͔͍ධՁͰ͖Δɻ /άϥϜͰɺΑΓࡉ͔͍ධՁ͕Ͱ͖Δ 10
BLEU ػց༁݁ՌશମʢจTͷू߹ʣͷධՁΛߦ͏ࡍɺ /άϥϜͷמΓࠐΈසʹجͮ͘ࢦඪΛߟ͑Δɻ 1SFD / ɺਫ਼ʹ֤/άϥϜͷසΛಋೖͨ͠ͷʹ
૬͢Δɻ Prec N = Clip(e,s) e∈gramN (s) ∑ s ∑ C(e,s) e∈gramN (s) ∑ s ∑ 11
BLEU #-&6Ͱɺ͞Βʹ/ ʹ͍ͭͯ1SFD/ ΛҎԼ ͷΑ͏ʹ݁߹͢Δɻ
͜Εਫ਼ʹࣅͨࢦඪͷͨΊɺػց༁݁Ռʹؚ·Ε ΔϊΠζʹରͯ͠ϖφϧςΟΛ༩͑Δ͜ͱ͕Ͱ͖Δɻ PREC = exp( 1 4 lnPrec N N∈{1,2,3,4} ∑ ) 12
BLEU ˔ϖφϧςΟΛ༩͑Δج४ ػց༁݁Ռ͕ୈҰͷਖ਼ղ༁ͱશͯҰகͨ͠߹ɺ ୈೋͷਖ਼ղ༁ͷzUIFSFzΛؚ·ͳ͍͔ΒϖφϧςΟΛ ༩͑Δ͜ͱෆదɻ /άϥϜͷ࠶ݱΛߟ͑ΔΘΓʹɺ ɹػց༁݁Ռͷ͞ʹண 13
BLEU ػց༁݁Ռͷ͕͞ਖ਼ղ༁ͷ͞ͱൺֱͯ͠ʜ ᶃ͗͢Δͱஅͨ͠߹ ɹϖφϧςΟΛ༩͑Δ ᶄ͗͢Δͱஅͨ͠߹ ɹ13&$ʹΑΓϖφϧςΟ͕༩͑ΒΕΔ 14
BLEU ػց༁݁Ռதͷ֤จTʹ͍ͭͯɺରԠ͢Δਖ਼ղจT ͷ͏͕ͪ͞࠷Tʹ͍ۙͷΛબɻ ͦͷਖ਼ղจͷ͞Λ ࠷దϚονɿ#.- T Ͱද͢ɻ ͦͯ͠ɺػց༁݁Ռશମʹ͍ͭͯͦͷΛٻΊΔͱ
4#.-ػց༁݁Ռͷཧతͳ͞ʹ૬͢Δ SBML = BML(s) = arg len(s* ) min len(s)− len(s* ) s ∑ s ∑ 15
BLEU Ұํɺػց༁݁Ռͷશͷ࣮ଌ ͜ΕΒΑΓɺ#-&6ͷ؆қϖφϧςΟ 4:4-4.#-ͷ࣌ɺ#1ͱͳΓ ϖφϧςΟ͕՝͞ΕΔɻ
SYSL = len(s) s ∑ BP=exp(min(0,1- SBML SYSL )) 16
BLEU Ҏ্ͷఆٛʹج͖ͮɺ#-&6 ˔#-&6ͷ·ͱΊ ɾجຊతʹසΛߟྀͨ͠/άϥϜʹجͮ͘ਫ਼ ɾػց༁݁Ռશମͱͯ͗͢͠Δͱஅͨ͠߹ɺ ɹϖφϧςΟΛ՝͢ࢦඪ
BLEU=BP PREC 17
参考文献 ˔ใΞΫηεධՁํ๏ʢ̏ɺ̐ষʣɺञҪɺ ɹίϩφࣾɺ݄ 18