Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
Search
kakubari
October 23, 2017
Technology
0
90
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
長岡技術科学大学
自然言語処理研究室
学部4年 角張竜晴
kakubari
October 23, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
88
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
110
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
64
Labeling the Semantic Roles of Commas
kakubari
0
56
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
93
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
74
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
88
述語項構造と照応関係のアノテーション
kakubari
0
180
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
150
Other Decks in Technology
See All in Technology
Aurora MySQL v3(MySQL8.0互換)の オンラインDDLの罠挙動を全バージョンで検証した
yutakikai
1
150
Terraformあれやこれ/terraform-this-and-that
emiki
4
450
アプリがつくるNOT A HOTELブランド
hokuts
1
450
Four keys改善の取り組み事例紹介
sansantech
PRO
3
230
オーナーシップを持つ領域を明確にする
konifar
11
2.6k
DevOpsDays History and my DevOps story
kawaguti
PRO
8
1.6k
Delivering Millions of Messages within seconds @ Duolingo
pelelgrino
0
330
なぜ NOT A HOTEL が Web3 に取り組むのか - NOT A HOTEL TECH TALK
ynunokawa
0
160
コンパウンドスタートアップのためのスケーラブルでセキュアなInfrastructure as Codeパイプラインを考える / Scalable and Secure Infrastructure as Code Pipeline for a Compound Startup
yuyatakeyama
3
2.5k
クラウドサインにおけるプロダクトマネージャーの役割と開発プロセス / 20240410_cloudsign-PdM
bengo4com
1
680
SIEMを用いて、セキュリティログ分析の可視化と分析を実現し、PDCAサイクルを回してみた
coconala_engineer
0
220
Databricks における 『MLOps』
databricksjapan
2
140
Featured
See All Featured
Writing Fast Ruby
sferik
620
60k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
9
8.3k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
18
1.7k
Thoughts on Productivity
jonyablonski
57
3.8k
Building a Modern Day E-commerce SEO Strategy
aleyda
16
6.4k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
124
32k
Designing Experiences People Love
moore
136
23k
Clear Off the Table
cherdarchuk
83
310k
What’s in a name? Adding method to the madness
productmarketing
PRO
15
2.6k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
15
1.4k
No one is an island. Learnings from fostering a developers community.
thoeni
14
2.1k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤදจΑΓҾ༻ 1
概要 2 ˗ఏҊ ࣗಈతʹ֫ಘ͞Εͨޠኮࣝʹجͮ͘ܗଶૉղੳٴ ͼΓड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ ैདྷͷύΠϓϥΠϯϞσϧΑΓڞಉϞσϧͷ༗ޮ
ੑΛূ໌
はじめに 3 ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠׂɺ104͚ɺݟग़͠ޠղੳ
Ὃ Γड͚ղੳड़ޠҾߏ 1"4 ղੳͳͲ ύΠϓϥΠϯॲཧͷ ¡ ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹൖ͢Δ ܗଶૉղੳͰ୯ޠׂΛ͢Δࡍʹɺߏจతٴͼߏతͳࣝ ͕ඞཁͳ߹͕͋Δɻ
はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU
Մೳੑ͕͋Δ͔Ͳ͏͔ ɹ C ͋Δ͔ͳ͍ XBMLOPU Մೳੑ͕า͔ͳ͍
提案 5 ࣗಈతʹ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺ ɹܗଶૉɾΓड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ ޠኮࣝʹ̏ͭͷλΠϓ͕͋Δ ¡ ֨ϑϨʔϜ
¡ ໊ࢺͱड़ޠͷΓड͚ؔͷڞى֬ ¡ ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ
関連研究 6 ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡ (PMECFSHBOE5TBSGBSZ ¡ (PMECFSHFUBM
¡ (SFFOBOE.BOOJOH ¡ (PMECFSHBOE&MIBEBE ޠኮࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡ 5BXBSBFUBM
格フレーム 7 ֨ϑϨʔϜΛ༻ͯ͠ɺ1"4ͷଥੑΛධՁ͢Δ ֨ϑϨʔϜ,BXBIBSBFUBM ͷߏஙํ๏Λద༻
ܗଶૉղੳͱΓड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ΤϥʔͷӨڹ؇ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़ ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷͍ۙҾΛ݁߹ࣝ͠ผ͢Δɻ ྫ͑ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠҾͷͰ۠ผ͢ Δɻ ԯͷຊޠจड़ޠ ͷ֨ϑϨʔϜΛऔಘ
名詞と述語の依存関係の共起確率 8 1"4Ͱଊ͑ΒΕͳ͍Γड͚ؔΛධՁ͢Δ Γड͚ؔͷڞى֬ͷ౷ܭຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡ ໊ࢺ໊ࢺ ÷
ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔΛΧόʔ ¡ ड़ޠड़ޠ ÷ ड़ޠؒͷґଘؔΛΧόʔ
単語埋め込み 9 ୯ޠͱ୯ޠྻͷؒͷྨࣅΛܭࢉ͢Δ XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ຊޠͷ8FCจΛ༻ͯ͠܇࿅͢Δ
¡ ࣍ݩͰDPTྨࣅΛܭࢉ͢Δ
共同解析モデル 10 $,:ΞϧΰϦζϜΛ࠾༻ ¡ ڞಉղੳϞσϧʹ͘༻͞Ε͍ͯΔ ͜ͷϞσϧͷग़ྗ ¡ ୯ޠɺจઅɺٴͼΓड͚ؔͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ
ɹ࠷దͳղੳπϦʔΛग़ྗ
共同解析モデルの解析手順 11 ީิ୯ޠͷ$,:ςʔϒϧͷӨ ¡ ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ͢Δ ޠ۟ͷੜ ¡
104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ༻͠$,:ςʔϒϧͰੜ͞ΕΔ ϧʔϧ,/1͔Βநग़͞ΕΔ ¡ ࠷খͷαϒπϦʔͱͯ͠Έͳ͢
共同解析モデルの解析手順 12 ྡ͢ΔαϒπϦʔϖΞͷϚʔδ ¡ ྡ͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ ¡ ϘτϧΞοϓํࣜͰߦ͏
ೖྗจશମʹର͢Δީิ
共同解析モデルの解析手順 13 είΞ͕࠷ߴ͍πϦʔΛબ ੜ͞ΕͨީิͷதͰείΞ͕࠷ߴ͍Λग़ྗ
スコア機能とトレーニング 14 είΞػೳ
XJ ɿಛͷॏΈ ЇJ ɿಛJͷಛؔ ֶशखॱ ಛྔΛॳظԽ͠ɺ܇࿅ίʔύεͷ֤จͷ୯ޠ֨ࢠ Λೖྗ ೖྗจʹର͢ΔީิΛಘΔ ΰʔϧυπϦʔʹର͢ΔΓड͚είΞ͕࠷ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ ಛͷॏΈ܇࿅ίʔύεͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ
実験 15 ژେֶςΩετίʔύε /&84 ¡ ,BXBIBSBFUBM
ژେֶΣϒจॻϦʔυίʔύε 8&# ¡ )BOHZPFUBM
実験 16 ൺֱର ¡ ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡
$BCP$IB 4BTTBOP ධՁ߲ ¡ 4FHɿ୯ޠׂ ¡ 104ɿ4FH 104 ¡ "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡ Q4FRɿจઅ۠Γ ¡ 6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋ΓͷΓड͚ղੳ
実験結果 17
実験結果 18
結論 19 ࣗಈ֫ಘͨ͠ޠኮࣝʹجͮ͘ɺܗଶૉղੳٴͼ Γड͚ղੳͷڞಉϞσϧͷఏҊ ैདྷͷύΠϓϥΠϯϞσϧʹൺɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠ ܗଶૉղੳͱΓड͚ղੳͷͨΊͷޠኮࣝΛ
χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹΈࠐΉ͜ ͱʹࢼΈΔ