Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Automatically Acquired Lexical Knowledge Improv...
Search
kakubari
October 23, 2017
Technology
0
99
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
長岡技術科学大学
自然言語処理研究室
学部4年 角張竜晴
kakubari
October 23, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
78
Labeling the Semantic Roles of Commas
kakubari
0
71
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
87
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
述語項構造と照応関係のアノテーション
kakubari
0
220
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
190
Other Decks in Technology
See All in Technology
Intro to Software Startups: Spring 2025
arnabdotorg
0
230
Amazon Qで2Dゲームを作成してみた
siromi
0
130
Google Cloud で学ぶデータエンジニアリング入門 2025年版 #GoogleCloudNext / 20250805
kazaneya
PRO
19
4.5k
Rubyの国のPerlMonger
anatofuz
3
730
【新卒研修資料】数理最適化 / Mathematical Optimization
brainpadpr
25
12k
形式手法特論:位相空間としての並行プログラミング #kernelvm / Kernel VM Study Tokyo 18th
ytaka23
3
1.2k
Amazon S3 Vectorsは大規模ベクトル検索を低コスト化するサーバーレスなベクトルデータベースだ #jawsugsaga / S3 Vectors As A Serverless Vector Database
quiver
1
180
AI時代の経営、Bet AI Vision #BetAIDay
layerx
PRO
1
1.9k
Eval-Centric AI: Agent 開発におけるベストプラクティスの探求
asei
0
110
専門分化が進む分業下でもユーザーが本当に欲しかったものを追求するプロダクトマネジメント/Focus on real user needs despite deep specialization and division of labor
moriyuya
1
1.2k
2025-07-31: GitHub Copilot Agent mode at Vibe Coding Cafe (15min)
chomado
2
400
全員が手を動かす組織へ - 生成AIが変えるTVerの開発現場 / everyone-codes-genai-transforms-tver-development
tohae
0
110
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
Making the Leap to Tech Lead
cromwellryan
134
9.5k
The Pragmatic Product Professional
lauravandoore
36
6.8k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Designing for humans not robots
tammielis
253
25k
Designing for Performance
lara
610
69k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Practical Orchestrator
shlominoach
190
11k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤදจΑΓҾ༻ 1
概要 2 ˗ఏҊ ࣗಈతʹ֫ಘ͞Εͨޠኮࣝʹجͮ͘ܗଶૉղੳٴ ͼΓड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ ैདྷͷύΠϓϥΠϯϞσϧΑΓڞಉϞσϧͷ༗ޮ
ੑΛূ໌
はじめに 3 ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠׂɺ104͚ɺݟग़͠ޠղੳ
Ὃ Γड͚ղੳड़ޠҾߏ 1"4 ղੳͳͲ ύΠϓϥΠϯॲཧͷ ¡ ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹൖ͢Δ ܗଶૉղੳͰ୯ޠׂΛ͢Δࡍʹɺߏจతٴͼߏతͳࣝ ͕ඞཁͳ߹͕͋Δɻ
はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU
Մೳੑ͕͋Δ͔Ͳ͏͔ ɹ C ͋Δ͔ͳ͍ XBMLOPU Մೳੑ͕า͔ͳ͍
提案 5 ࣗಈతʹ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺ ɹܗଶૉɾΓड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ ޠኮࣝʹ̏ͭͷλΠϓ͕͋Δ ¡ ֨ϑϨʔϜ
¡ ໊ࢺͱड़ޠͷΓड͚ؔͷڞى֬ ¡ ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ
関連研究 6 ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡ (PMECFSHBOE5TBSGBSZ ¡ (PMECFSHFUBM
¡ (SFFOBOE.BOOJOH ¡ (PMECFSHBOE&MIBEBE ޠኮࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡ 5BXBSBFUBM
格フレーム 7 ֨ϑϨʔϜΛ༻ͯ͠ɺ1"4ͷଥੑΛධՁ͢Δ ֨ϑϨʔϜ,BXBIBSBFUBM ͷߏஙํ๏Λద༻
ܗଶૉղੳͱΓड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ΤϥʔͷӨڹ؇ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़ ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷͍ۙҾΛ݁߹ࣝ͠ผ͢Δɻ ྫ͑ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠҾͷͰ۠ผ͢ Δɻ ԯͷຊޠจड़ޠ ͷ֨ϑϨʔϜΛऔಘ
名詞と述語の依存関係の共起確率 8 1"4Ͱଊ͑ΒΕͳ͍Γड͚ؔΛධՁ͢Δ Γड͚ؔͷڞى֬ͷ౷ܭຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡ ໊ࢺ໊ࢺ ÷
ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔΛΧόʔ ¡ ड़ޠड़ޠ ÷ ड़ޠؒͷґଘؔΛΧόʔ
単語埋め込み 9 ୯ޠͱ୯ޠྻͷؒͷྨࣅΛܭࢉ͢Δ XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ຊޠͷ8FCจΛ༻ͯ͠܇࿅͢Δ
¡ ࣍ݩͰDPTྨࣅΛܭࢉ͢Δ
共同解析モデル 10 $,:ΞϧΰϦζϜΛ࠾༻ ¡ ڞಉղੳϞσϧʹ͘༻͞Ε͍ͯΔ ͜ͷϞσϧͷग़ྗ ¡ ୯ޠɺจઅɺٴͼΓड͚ؔͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ
ɹ࠷దͳղੳπϦʔΛग़ྗ
共同解析モデルの解析手順 11 ީิ୯ޠͷ$,:ςʔϒϧͷӨ ¡ ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ͢Δ ޠ۟ͷੜ ¡
104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ༻͠$,:ςʔϒϧͰੜ͞ΕΔ ϧʔϧ,/1͔Βநग़͞ΕΔ ¡ ࠷খͷαϒπϦʔͱͯ͠Έͳ͢
共同解析モデルの解析手順 12 ྡ͢ΔαϒπϦʔϖΞͷϚʔδ ¡ ྡ͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ ¡ ϘτϧΞοϓํࣜͰߦ͏
ೖྗจશମʹର͢Δީิ
共同解析モデルの解析手順 13 είΞ͕࠷ߴ͍πϦʔΛબ ੜ͞ΕͨީิͷதͰείΞ͕࠷ߴ͍Λग़ྗ
スコア機能とトレーニング 14 είΞػೳ
XJ ɿಛͷॏΈ ЇJ ɿಛJͷಛؔ ֶशखॱ ಛྔΛॳظԽ͠ɺ܇࿅ίʔύεͷ֤จͷ୯ޠ֨ࢠ Λೖྗ ೖྗจʹର͢ΔީิΛಘΔ ΰʔϧυπϦʔʹର͢ΔΓड͚είΞ͕࠷ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ ಛͷॏΈ܇࿅ίʔύεͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ
実験 15 ژେֶςΩετίʔύε /&84 ¡ ,BXBIBSBFUBM
ژେֶΣϒจॻϦʔυίʔύε 8&# ¡ )BOHZPFUBM
実験 16 ൺֱର ¡ ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡
$BCP$IB 4BTTBOP ධՁ߲ ¡ 4FHɿ୯ޠׂ ¡ 104ɿ4FH 104 ¡ "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡ Q4FRɿจઅ۠Γ ¡ 6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋ΓͷΓड͚ղੳ
実験結果 17
実験結果 18
結論 19 ࣗಈ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺܗଶૉղੳٴͼ Γड͚ղੳͷڞಉϞσϧͷఏҊ ैདྷͷύΠϓϥΠϯϞσϧʹൺɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠ ܗଶૉղੳͱΓड͚ղੳͷͨΊͷޠኮࣝΛ
χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹΈࠐΉ͜ ͱʹࢼΈΔ