Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Automatically Acquired Lexical Knowledge Improv...
Search
kakubari
October 23, 2017
Technology
110
0
Share
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
長岡技術科学大学
自然言語処理研究室
学部4年 角張竜晴
kakubari
October 23, 2017
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
130
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
110
Labeling the Semantic Roles of Commas
kakubari
0
96
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
130
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
97
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
述語項構造と照応関係のアノテーション
kakubari
0
260
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
230
Other Decks in Technology
See All in Technology
ボトムアップ限界を越える - 20チームを束る "Drive Map" / Beyond Bottom-Up: A 'Drive Map' for 20 Teams
kaonavi
0
170
AI駆動開発で生産性を追いかけたら、行き着いたのは品質とシフトレフトだった
littlehands
0
470
OWASP APTSを眺めてみた
su3158
0
130
Every Conversation Counts
kawaguti
PRO
0
200
要件定義の精度を高めるための型と生成AIの活用 / Using Types and Generative AI to Improve the Accuracy of Requirements Definition
haru860
0
320
Claude Code / Codex / Kiro に AWS 権限を 渡すとき、何を設計すべきか
k_adachi_01
4
740
freeeで運用しているAIQAについて
qatonchan
0
480
データモデリング通り #5オンライン勉強会: AIに『ビジネスの文脈』を教え込むデータモデリング
datayokocho
0
220
もっとコンテンツをよく構造化して理解したいので、LLM 時代こそ Taxonomy の設計品質に目を向けたい〜!
morinota
0
240
サンプリングは「作る」のか「使う」のか? 分散トレースのコストと運用を両立する実践的戦略 / Why you need the tail sampling and why you don't want it
ymotongpoo
4
160
The 7 pitfalls of AI
ufried
0
200
Agent Skillsで実現する記憶領域の運用とその後
yamadashy
2
1.6k
Featured
See All Featured
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
180
WENDY [Excerpt]
tessaabrams
10
37k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
280
Rails Girls Zürich Keynote
gr2m
96
14k
Building the Perfect Custom Keyboard
takai
2
750
Believing is Seeing
oripsolob
1
120
Reality Check: Gamification 10 Years Later
codingconduct
0
2.1k
sira's awesome portfolio website redesign presentation
elsirapls
0
230
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
510
Amusing Abliteration
ianozsvald
1
160
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
170
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤදจΑΓҾ༻ 1
概要 2 ˗ఏҊ ࣗಈతʹ֫ಘ͞Εͨޠኮࣝʹجͮ͘ܗଶૉղੳٴ ͼΓड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ ैདྷͷύΠϓϥΠϯϞσϧΑΓڞಉϞσϧͷ༗ޮ
ੑΛূ໌
はじめに 3 ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠׂɺ104͚ɺݟग़͠ޠղੳ
Ὃ Γड͚ղੳड़ޠҾߏ 1"4 ղੳͳͲ ύΠϓϥΠϯॲཧͷ ¡ ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹൖ͢Δ ܗଶૉղੳͰ୯ޠׂΛ͢Δࡍʹɺߏจతٴͼߏతͳࣝ ͕ඞཁͳ߹͕͋Δɻ
はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU
Մೳੑ͕͋Δ͔Ͳ͏͔ ɹ C ͋Δ͔ͳ͍ XBMLOPU Մೳੑ͕า͔ͳ͍
提案 5 ࣗಈతʹ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺ ɹܗଶૉɾΓड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ ޠኮࣝʹ̏ͭͷλΠϓ͕͋Δ ¡ ֨ϑϨʔϜ
¡ ໊ࢺͱड़ޠͷΓड͚ؔͷڞى֬ ¡ ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ
関連研究 6 ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡ (PMECFSHBOE5TBSGBSZ ¡ (PMECFSHFUBM
¡ (SFFOBOE.BOOJOH ¡ (PMECFSHBOE&MIBEBE ޠኮࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡ 5BXBSBFUBM
格フレーム 7 ֨ϑϨʔϜΛ༻ͯ͠ɺ1"4ͷଥੑΛධՁ͢Δ ֨ϑϨʔϜ,BXBIBSBFUBM ͷߏஙํ๏Λద༻
ܗଶૉղੳͱΓड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ΤϥʔͷӨڹ؇ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़ ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷͍ۙҾΛ݁߹ࣝ͠ผ͢Δɻ ྫ͑ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠҾͷͰ۠ผ͢ Δɻ ԯͷຊޠจड़ޠ ͷ֨ϑϨʔϜΛऔಘ
名詞と述語の依存関係の共起確率 8 1"4Ͱଊ͑ΒΕͳ͍Γड͚ؔΛධՁ͢Δ Γड͚ؔͷڞى֬ͷ౷ܭຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡ ໊ࢺ໊ࢺ ÷
ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔΛΧόʔ ¡ ड़ޠड़ޠ ÷ ड़ޠؒͷґଘؔΛΧόʔ
単語埋め込み 9 ୯ޠͱ୯ޠྻͷؒͷྨࣅΛܭࢉ͢Δ XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ຊޠͷ8FCจΛ༻ͯ͠܇࿅͢Δ
¡ ࣍ݩͰDPTྨࣅΛܭࢉ͢Δ
共同解析モデル 10 $,:ΞϧΰϦζϜΛ࠾༻ ¡ ڞಉղੳϞσϧʹ͘༻͞Ε͍ͯΔ ͜ͷϞσϧͷग़ྗ ¡ ୯ޠɺจઅɺٴͼΓड͚ؔͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ
ɹ࠷దͳղੳπϦʔΛग़ྗ
共同解析モデルの解析手順 11 ީิ୯ޠͷ$,:ςʔϒϧͷӨ ¡ ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ͢Δ ޠ۟ͷੜ ¡
104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ༻͠$,:ςʔϒϧͰੜ͞ΕΔ ϧʔϧ,/1͔Βநग़͞ΕΔ ¡ ࠷খͷαϒπϦʔͱͯ͠Έͳ͢
共同解析モデルの解析手順 12 ྡ͢ΔαϒπϦʔϖΞͷϚʔδ ¡ ྡ͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ ¡ ϘτϧΞοϓํࣜͰߦ͏
ೖྗจશମʹର͢Δީิ
共同解析モデルの解析手順 13 είΞ͕࠷ߴ͍πϦʔΛબ ੜ͞ΕͨީิͷதͰείΞ͕࠷ߴ͍Λग़ྗ
スコア機能とトレーニング 14 είΞػೳ
XJ ɿಛͷॏΈ ЇJ ɿಛJͷಛؔ ֶशखॱ ಛྔΛॳظԽ͠ɺ܇࿅ίʔύεͷ֤จͷ୯ޠ֨ࢠ Λೖྗ ೖྗจʹର͢ΔީิΛಘΔ ΰʔϧυπϦʔʹର͢ΔΓड͚είΞ͕࠷ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ ಛͷॏΈ܇࿅ίʔύεͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ
実験 15 ژେֶςΩετίʔύε /&84 ¡ ,BXBIBSBFUBM
ژେֶΣϒจॻϦʔυίʔύε 8&# ¡ )BOHZPFUBM
実験 16 ൺֱର ¡ ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡
$BCP$IB 4BTTBOP ධՁ߲ ¡ 4FHɿ୯ޠׂ ¡ 104ɿ4FH 104 ¡ "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡ Q4FRɿจઅ۠Γ ¡ 6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋ΓͷΓड͚ղੳ
実験結果 17
実験結果 18
結論 19 ࣗಈ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺܗଶૉղੳٴͼ Γड͚ղੳͷڞಉϞσϧͷఏҊ ैདྷͷύΠϓϥΠϯϞσϧʹൺɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠ ܗଶૉղੳͱΓड͚ղੳͷͨΊͷޠኮࣝΛ
χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹΈࠐΉ͜ ͱʹࢼΈΔ