Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Leveraging Crowdsourcing for Paraphrase Recogni...
Search
kakubari
November 28, 2017
Technology
110
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Leveraging Crowdsourcing for Paraphrase Recognition
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
November 28, 2017
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
130
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
110
Labeling the Semantic Roles of Commas
kakubari
0
97
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
130
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
98
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
述語項構造と照応関係のアノテーション
kakubari
0
260
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
230
Other Decks in Technology
See All in Technology
10倍の生産性を実現するAI駆動並列エージェントのすべて
kumaiu
4
990
AIにフローを作らせようとして挫折した話
hamatsutaichi
0
220
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
440
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
300
ブロックチェーン / Blockchain
ks91
PRO
0
110
新規ゲーム開発におけるAI駆動開発のリアル
202409e2
0
2.9k
運用を見据えたAIエージェント設計実践
amacbee
1
3.2k
Ruby::Boxでできること、Refinementsでできること
joker1007
3
400
AI Testing Talks: Challenges of Applying AI in Software Testing: From Hype to Practical Use
exactpro
PRO
1
140
Dynamic Workersについて
yusukebe
2
630
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
7
1.3k
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
2
310
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Claude Code のすすめ
schroneko
67
230k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
Exploring anti-patterns in Rails
aemeredith
3
400
Statistics for Hackers
jakevdp
799
230k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
150
Site-Speed That Sticks
csswizardry
13
1.2k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ Leveraging Crowdsourcing for Parapharase Recognition Martin Tschirsich, Gerold Hintz Proceedings of the 7th Linguistic Annotation Workshop & Interoperability with Discourse, pages 205–213, Sofia, Bulgaria, August 8-9, 2013. ਤදจΑΓҾ༻ 1
概要 2 ʲௐࠪɾఏҊʳ ύϥϑϨʔζೝࣝͷͨΊͷΫϥυιʔγϯάํ๏ ଟஈ֊ͷΫϥυιʔγϯάख๏Λఏࣔɻ ʲ݁Ռʳ จ຺తͳݴ͍͑ͷੜΛͰ͖Δɻ
ݴ͍͑ίʔύεͷίετΛେ෯ʹݮͰ͖Δɻ
はじめに 3 ʲύϥϑϨʔζೝࣝʳ %SBT ަ͕ՄೳͳςΩετͷϖΞΛੳ͢Δ͜ͱ ˔ྫ͑ɾɾɾใݕࡧͷ ʮୈถࠃେ౦ྗͷࡴਓʯ
ɹʹʮδϣϯ'ɾέωσΟͷ҉ࡴʯ
はじめに 4 ʲύϥϑϨʔζೝࣝͷݚڀʳ Φʔϓϯͳݚڀ՝ ۙɺٸܹʹਐา͍ͯ͠Δ 4PDIFSFUBM
͔͠͠ɺਫ਼ະͩʹ্͍ͯ͠ͳ͍ɻ
パラフレーズの定義 5 ʲύϥϑϨʔζͷ֓೦ʳ %PMBOBOE#SPDLFUU ҙຯతྨࣅੑͱ୯ޠΦϯτϩδʔͷ֓೦ʹີʹ ؔ࿈͍ͯ͠Δɻ
ਖ਼֬ͳఆٛͳ͘ɺෳࡶͳΨΠυϥΠϯͰܾఆɻ ΫϥυιʔγϯάΛߦ͏ࡍʹɾɾɾ ࡞ۀऀͷײʹཔ͍ͬͯΔ͜ͱʹҙ͢Δඞཁ͕͋Δɻ ྫจ͕ॏཁͰ͋Δ
パラフレーズの認識 6 ʲύϥϑϨʔζͷೝࣝʳ 4PDIFSFUBM ʮҙͷ͞ͱܗͰ͋ΔͭͷϑϨʔζ͕ಉ͡ҙຯͰ͋ Δ͔Ͳ͏͔ʯΛܾఆ͢Δ ʲઌߦݚڀʳ
/άϥϜͷॏͳΓ ґଘؔπϦʔͷॏͳΓฤूڑ Ͱܾఆ͍ͯ͠Δɻ ಉٛޠҙຯʹ͍͔͠ΛࣝผͰ͖ͳ͍ɻ ݴ͍͑ΒΕͨจষΛֶशͯࣗ͠ಈࣝผ͢Δඞཁ͕͋Δɻ
先行研究 7 ;IPVFUBM ύϥϨϧίʔύεΛ༻͍ͨ༁ϕʔεͷख๏ .BEOBOJFUBM
ҙຯྨࣅੑͷධՁ ୯७ͳ̎Ͱͳ͘ɺ࿈ଓతͳͰϖΞͷྨࣅͯ͠ ͍ΔఔΛࣔ͢ɻ ςΩετͷྨࣅੑɺଟͷΫϥυϫʔΧʔͷ அΛฏۉԽ͢Δɻ
クラウドソーシング 8 ʲ$SPXE'MPXFSʳ ΫϥυιʔγϯάΛߦ͏8FCαʔϏε ࡞ۀऀͷλεΫډॅΛ੍ݶͰ͖Δ ऩू͞Εͨσʔλͷਖ਼ੑΛݕূ͢ΔγεςϜ ¡
࣮ࡍͷσʔλΛॲཧ͢Δલʹɺ࡞ۀऀ͕ਖ਼͘͠ճ͢ΔΑ͏ ʹνΣοΫΛ͢Δɻ ¡ ࡞ۀதʹɺਖ਼͘͠ճ͍ͯ͠Δ͔νΣοΫ͢Δɻ ਖ਼ղσʔλͱ࡞ۀ݁ՌΛൺֱ͠ɺ৴པੑΛ୲อ͢Δɻ
クラウドソーシング 9 ʲࣄ༰ͷσβΠϯʳ ࣄ༰ͷσβΠϯɺऩू͞Εͨσʔλͷ࣭ʹ ࠷େ͖ͳӨڹΛ༩͑Δɻ ਖ਼͍͠ࢦࣔͱΘ͔Γ͍͢ྫ͕ॏཁ $SPXE'MPXFSʹɺ$.-ݕূػೳ͕͋Δɻ
ෆਖ਼ͳϢʔβͷೖྗΛऩू͠ͳ͍
フレーズ−パラフレーズ生成 10 ݴ͍͑ͷϕʔεϥΠϯ ूஂ࡞ۀऀʹɺϑϨʔζQ Λఏࣔ͠ɺॻ͖͑Q Λ
ಘΔ
2段階の言い換えの生成 11 ࡞ۀऀʹϑϨʔζQ Λఏࣔ͠ɺݴ͍͑Q ΛಘΔɻ ̎ɺ̏ਓͷ࡞ۀऀ͕ͦΕͧΕͷੜ͞Εͨݴ͍
͑ͷϖΞΛݕূ͢Δɻ ઐՈͷධՁऀͱ܈ऺͷஅͷ߹ҙ /FHSJFUBM
多段階の言い換えの生成 12 ࡞ۀऀʹϑϨʔζQ Λఏࣔ͠ɺݴ͍͑Q ΛಘΔɻ ଞͷ࡞ۀऀʹϑϨʔζQ
Λఏࣔ͠ɺQ Λݕূ͠ɺ ݴ͍͑Q ΛಘΔɻ ޡͬͨݴ͍͑ΛݮΒ͠ɺ ɹΑΓଟ͘ͷݴ͍͕͑ಘΒΕΔɻ
多段階の言い換えの生成 13 ஈ֊ͷݴ͍͑ɿऩूͨ͠ϖΞͷΛݕূ ଟஈ֊ͷݴ͍͑ ஈ ɿऩूͨ͠ϖΞͷΛݕূ
まとめ 14 Ϋϥυιʔγϯάͷํ๏ͱͯ͠ɺ ɹଟஈ֊ͷݴ͍͑ΛఏҊɻ ଟஈతʹύϥϑϨʔζΛߦ͏͜ͱ͕༗ޮ ¡ ݕূͱݴ͍͑Λߦ͏͜ͱͰɺҙຯͷΒ͖͕ͭগͳ͘ͳΔ