Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Automatically Acquired Lexical Knowledge Improv...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
kakubari
October 23, 2017
Technology
0
110
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
長岡技術科学大学
自然言語処理研究室
学部4年 角張竜晴
kakubari
October 23, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
120
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
100
Labeling the Semantic Roles of Commas
kakubari
0
94
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
120
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
96
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
述語項構造と照応関係のアノテーション
kakubari
0
250
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
220
Other Decks in Technology
See All in Technology
Astro Islandsの 内部実装を 「日本で一番わかりやすく」 ざっくり解説!
knj
0
280
「お金で解決」が全てではない!大規模WebアプリのCI高速化 #phperkaigi
stefafafan
5
2.3k
RGBに陥らないために -プロダクトの価値を届けるまで-
righttouch
PRO
0
110
【PHPerKaigi2026】OpenTelemetry SDKを使ってPHPでAPMを自作する
fendo181
1
290
やさしいとこから始めるGitHubリポジトリのセキュリティ
tsubakimoto_s
2
1.4k
FlutterでPiP再生を実装した話
s9a17
0
180
A4)シラバスを超えて語る、テストマネジメント
moritamasami
0
130
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
2
270
The Rise of Browser Automation: AI-Powered Web Interaction in 2026
marcthompson_seo
0
310
Kiro Meetup #7 Kiro アップデート (2025/12/15〜2026/3/20)
katzueno
2
250
「コントロールの三分法」で考える「コト」への向き合い方 / phperkaigi2026
blue_goheimochi
0
160
AIエージェント勉強会第3回 エージェンティックAIの時代がやってきた
ymiya55
0
120
Featured
See All Featured
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
210
Writing Fast Ruby
sferik
630
63k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
120
Raft: Consensus for Rubyists
vanstee
141
7.4k
How to Ace a Technical Interview
jacobian
281
24k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
830
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Code Review Best Practice
trishagee
74
20k
For a Future-Friendly Web
brad_frost
183
10k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤදจΑΓҾ༻ 1
概要 2 ˗ఏҊ ࣗಈతʹ֫ಘ͞Εͨޠኮࣝʹجͮ͘ܗଶૉղੳٴ ͼΓड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ ैདྷͷύΠϓϥΠϯϞσϧΑΓڞಉϞσϧͷ༗ޮ
ੑΛূ໌
はじめに 3 ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠׂɺ104͚ɺݟग़͠ޠղੳ
Ὃ Γड͚ղੳड़ޠҾߏ 1"4 ղੳͳͲ ύΠϓϥΠϯॲཧͷ ¡ ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹൖ͢Δ ܗଶૉղੳͰ୯ޠׂΛ͢Δࡍʹɺߏจతٴͼߏతͳࣝ ͕ඞཁͳ߹͕͋Δɻ
はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU
Մೳੑ͕͋Δ͔Ͳ͏͔ ɹ C ͋Δ͔ͳ͍ XBMLOPU Մೳੑ͕า͔ͳ͍
提案 5 ࣗಈతʹ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺ ɹܗଶૉɾΓड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ ޠኮࣝʹ̏ͭͷλΠϓ͕͋Δ ¡ ֨ϑϨʔϜ
¡ ໊ࢺͱड़ޠͷΓड͚ؔͷڞى֬ ¡ ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ
関連研究 6 ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡ (PMECFSHBOE5TBSGBSZ ¡ (PMECFSHFUBM
¡ (SFFOBOE.BOOJOH ¡ (PMECFSHBOE&MIBEBE ޠኮࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡ 5BXBSBFUBM
格フレーム 7 ֨ϑϨʔϜΛ༻ͯ͠ɺ1"4ͷଥੑΛධՁ͢Δ ֨ϑϨʔϜ,BXBIBSBFUBM ͷߏஙํ๏Λద༻
ܗଶૉղੳͱΓड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ΤϥʔͷӨڹ؇ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़ ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷͍ۙҾΛ݁߹ࣝ͠ผ͢Δɻ ྫ͑ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠҾͷͰ۠ผ͢ Δɻ ԯͷຊޠจड़ޠ ͷ֨ϑϨʔϜΛऔಘ
名詞と述語の依存関係の共起確率 8 1"4Ͱଊ͑ΒΕͳ͍Γड͚ؔΛධՁ͢Δ Γड͚ؔͷڞى֬ͷ౷ܭຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡ ໊ࢺ໊ࢺ ÷
ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔΛΧόʔ ¡ ड़ޠड़ޠ ÷ ड़ޠؒͷґଘؔΛΧόʔ
単語埋め込み 9 ୯ޠͱ୯ޠྻͷؒͷྨࣅΛܭࢉ͢Δ XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ຊޠͷ8FCจΛ༻ͯ͠܇࿅͢Δ
¡ ࣍ݩͰDPTྨࣅΛܭࢉ͢Δ
共同解析モデル 10 $,:ΞϧΰϦζϜΛ࠾༻ ¡ ڞಉղੳϞσϧʹ͘༻͞Ε͍ͯΔ ͜ͷϞσϧͷग़ྗ ¡ ୯ޠɺจઅɺٴͼΓड͚ؔͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ
ɹ࠷దͳղੳπϦʔΛग़ྗ
共同解析モデルの解析手順 11 ީิ୯ޠͷ$,:ςʔϒϧͷӨ ¡ ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ͢Δ ޠ۟ͷੜ ¡
104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ༻͠$,:ςʔϒϧͰੜ͞ΕΔ ϧʔϧ,/1͔Βநग़͞ΕΔ ¡ ࠷খͷαϒπϦʔͱͯ͠Έͳ͢
共同解析モデルの解析手順 12 ྡ͢ΔαϒπϦʔϖΞͷϚʔδ ¡ ྡ͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ ¡ ϘτϧΞοϓํࣜͰߦ͏
ೖྗจશମʹର͢Δީิ
共同解析モデルの解析手順 13 είΞ͕࠷ߴ͍πϦʔΛબ ੜ͞ΕͨީิͷதͰείΞ͕࠷ߴ͍Λग़ྗ
スコア機能とトレーニング 14 είΞػೳ
XJ ɿಛͷॏΈ ЇJ ɿಛJͷಛؔ ֶशखॱ ಛྔΛॳظԽ͠ɺ܇࿅ίʔύεͷ֤จͷ୯ޠ֨ࢠ Λೖྗ ೖྗจʹର͢ΔީิΛಘΔ ΰʔϧυπϦʔʹର͢ΔΓड͚είΞ͕࠷ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ ಛͷॏΈ܇࿅ίʔύεͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ
実験 15 ژେֶςΩετίʔύε /&84 ¡ ,BXBIBSBFUBM
ژେֶΣϒจॻϦʔυίʔύε 8&# ¡ )BOHZPFUBM
実験 16 ൺֱର ¡ ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡
$BCP$IB 4BTTBOP ධՁ߲ ¡ 4FHɿ୯ޠׂ ¡ 104ɿ4FH 104 ¡ "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡ Q4FRɿจઅ۠Γ ¡ 6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋ΓͷΓड͚ղੳ
実験結果 17
実験結果 18
結論 19 ࣗಈ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺܗଶૉղੳٴͼ Γड͚ղੳͷڞಉϞσϧͷఏҊ ैདྷͷύΠϓϥΠϯϞσϧʹൺɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠ ܗଶૉղੳͱΓड͚ղੳͷͨΊͷޠኮࣝΛ
χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹΈࠐΉ͜ ͱʹࢼΈΔ