Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
述語項構造と照応関係のアノテーション
Search
kakubari
May 19, 2017
Technology
260
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
述語項構造と照応関係のアノテーション
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
May 19, 2017
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
130
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
110
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
110
Labeling the Semantic Roles of Commas
kakubari
0
97
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
130
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
98
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
230
Other Decks in Technology
See All in Technology
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
190
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
2
310
AgentGatewayを試してみたかった
tkikuchi
0
120
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
19
11k
製造業のクラウド活用最適解〜AI,DXを加速するデータ基盤の作り方〜
hamadakoji
0
410
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
570
コードレビューを制するチームがソフトウェアデリバリーのフローを制す / Beyond Code Review: Distributing Its Responsibilities Across the SDLC
mtx2s
4
1.3k
AI Engineering Summit Tokyo 2026 AIの前に、やることがある 〜医療データ企業の4フェーズ〜
dtaniwaki
0
2.2k
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
7
1.4k
EventBridge Connection
_kensh
5
660
Terraformモジュールは、なぜ「魔境」化するのか
hayama17
2
220
探して_入れて_作って_使う_Agent_Skills___LT.pdf
peintangos
2
180
Featured
See All Featured
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
360
Balancing Empowerment & Direction
lara
6
1.1k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
240
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
Designing Powerful Visuals for Engaging Learning
tmiket
1
400
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
580
Building Adaptive Systems
keathley
44
3k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
570
Utilizing Notion as your number one productivity tool
mfonobong
4
320
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から 飯田 龍・小町 守・井之上 直也・乾 健太郎・松本 裕治 自然言語処理, 7PM /P QQ@@ ਤදจΑΓҾ༻ 1
研究の背景 ˔طଘͷίʔύε࡞Ͱಋೖ͞Ε͍ͯΔλά༩ͷج४ ɹݴޠͷҧ͍࠷ऴతʹग़ྗ͍ͨ͠ղੳ݁Ռ͕ҟͳΔͨΊɺ ͦͷ··ར༻Ͱ͖ͳ͍ɻ ɹ ˔ຊจͰͷݕ౼ ɹ˓طଘͷλά༩ͷ༻Λۛຯ ɹ˓ड़ޠ߲ߏͱڞࢀরؔͷΞϊςʔγϣϯ ɹ˓λά༩ͷج४͕Ͳ͏͋Δ͖͔Λݕ౼
˔࡞ۀ݁ՌͰ͋Δ/"*45ςΩετίʔύε ɹIUUQDMOBJTUKQOMEBUBDPSQVT 2
照応・共参照 3 রԠɿ ɾ͋Δදݱ͕ಉҰจষͷଞͷදݱΛࢦ͢ػೳɻ ɾࢦ͢ଆͷදݱΛরԠࢺɺࢦ͞ΕΔଆͷදݱΛઌߦࢺͱ͍͏ɻ θϩরԠɿ ɾθϩ໊ࢺͱরԠؔͱͳΔ߹ɻ จθϩরԠɿ ɾθϩ໊ࢺͱઌߦࢺ͕ಉҰจʹग़ݱ͍ͯ͠Δ߹ɻ จؒθϩরԠɿ
ɾઌߦࢺ͕θϩ໊ࢺͱಉҰจষͷҟͳΔจষʹग़ݱ͍ͯ͠ Δ߹ɻ ڞࢀরɿ ɾೋͭʢͦ͘͠ΕҎ্ʣͷදݱ͕ݱ࣮ੈքʢ͘͠Ծ ੈքʣʹ͓͍ͯಉҰͷ࣮ଶΛ͍ͯ͞͠Δ߹ɻ
照応・共参照のタグ付与に関する先行研究 4 ˔4PPOΒʢ4PPO /H BOE-JNʣ/HΒʢ/HBOE $BSEJFBʣ ɿաͳڞࢀর͕ؔλά༩͞Ε͍ͯΔɻ ˔"VUPNBUJD$POUFOU&YUSBDUJPO "$&
%PEEJOHUPOFUBM ɹఏҊɿաͳڞࢀরؔΛճආ͢ΔͨΊʹɺNFOUJPOʢݴٴʣ ͱFOUJUZʢ࣮ମʣͱ͍͏̎ͭͷ֓೦Λಋೖɻ ɹɿจষʹग़ݱ͢Δڞࢀরؔʹཏతʹλά͕༩͞Ε ͳ͍ɻ ˔ژίʔύεʢՏݪଞʣ ɹΓड͚ͷใʹՃ͑ɺҰ෦ʹڞࢀরλά͕༩͞Ε͍ͯΔɻ
述語項構造のタグ付与に関する先行研究 5 ˔ඞਢ͕֨লུ͞ΕΔθϩরԠͷݱ͕සൟʹى͖Δɻ ɹɾจΛ͑ͯग़ݱ͍ͯ͠Δදݱ ɹɾจষ֎ͷཁૉ ɹ্هΛߟྀͯ͠ɺλά༩Λߦ͏ඞཁ͕͋Δɻ ژίʔύε ɾจؒθϩরԠɺ֎քরԠʹؔͯ͠λάΛ༩ ɾ֨ॿࢺ૬ͷද֨ʹՃ͑ɺχπΠςͷΑ͏ͳ࿈ޠ
Ұͭͷද֨ͱͯ͠ड़ޠͱ߲ͷؔΛ༩
本研究のタグ付与の基準 6 /"*45ςΩετίʔύεͰ࠾༻͢Δλά༩ͷ༷ ड़ޠ߲ߏʹ͍ͭͯ ɹड़ޠͷجຊܗʹͦͷ߲ͱͳΔදݱΛද֨ʢΨ֨ɺϮ֨ɺ χ֨ʣϨϕϧͰλά༩͢Δɻ ࣄଶੑ໊ࢺʹ͍ͭͯ
ɹड़ޠͱಉ༷ʹද֨ϨϕϧͰ߲Λ༩͢Δɻ ڞࢀরؔʹ͍ͭͯ ɹ*3"ͷؔͷΈΛରͱͯ͠ڞࢀরͷؔΛೝఆ͢Δɻ
述語と項のタグ付与 7 Bژίʔύεͷड़ޠ߲ߏͰ͋Γɺ C͕ຊจͷड़ޠ߲ߏͰ͋Δɻ ຊจͷಛ ɾಈࢺͷݪܗʹରͯ͠λάΛ༩͢Δɻ ɾ֨ཁૉΛ૿͢ॿಈࢺʹରͯ͠λάΛ༩͢Δɻ
タグ付与作業の結果(統計) 8 表3 述語と事態性名詞のタグの統計(NAISTテキストコーパスの全体)
タグ付与作業の結果(統計) 9 ˔ड़ޠͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ͷ΄ͱΜͲΓؔ ɾΨ֨ͷׂ̒θϩরԠͷؔ ˔ࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ಉҰจઅ ɾΨ֨ͷׂ̔θϩরԠͷؔ
ड़ޠͱࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴେ͖͘ҟͳΔ
作業者のタグ付与の一致率 10 表4 タグの一致率(報道30記事)
タグ付与の問題点 11 ˔ड़ޠͷλά༩ͷ ɹλά༩ͷରͱͳΔड़ޠ͕ʮʙͱͯ͠ʯͷΑ͏ͳػೳ ޠ૬දݱͷ͕͋Δɻ ྫ͑ɾɾɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱͯ͠ʯ ɾʮͱͯ͠ʯ͕z͋ΔҰͭͷଆ໘͔ΒͷՁ͚ɾҙຯ ͚zɹͷػೳޠ૬දݱ ɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱ͢Δʯͱղऍ
Βʢ Ӊ࿊ দ٢ ࠤ౻ தʣࢀߟ༧ ఆ
タグ付与の問題点 12 ˔ࣄଶੑ໊ࢺλά༩ͷ ɹࠓճɺࣄଶੑ໊ࢺ͕zίτzΛද͍ͯ͠Δ߹ͷΈ ʹλάΛ༩͍ͯ͠Δɻ ͕ͩɺࣄଶੑ໊ࢺͷதʹ lίτzͱzϞϊzͷͲͪΒͱղऍͰ͖Δͷ͕͋Δɻ ྫ͑ɾɾɾใࠂ
ɹɾίτɿใࠂ͢Δಈ࡞ ɹɾϞϊɿใࠂ͞ΕΔ݁Ռ
事態性名詞タグ付与の改善点 13 ˔मਖ਼̍ ϞϊΛࢦ͢දݱʹରͯ͠λάΛ༩͢Δɻ ˔मਖ਼̎ ϞϊͱίτΛࢦ͢දݱΛ۠ผ͢ΔͨΊɺϞϊͱஅ͠ ͨࠜڌλά
タグ付与の改善結果 14 ɾจষதͷ΄ͱΜͲͷαม໊ࢺ͕߲ͷ༩ରɻ ɾ߲Λ͔࣋ͭ൱͔ͷҰகͰ͋ΓɺҎલͷ ΑΓ࡞ۀ্࣭͕ͨ͠ɻ ɾ߲͕Ұக͠ͳ͔ͬͨͷɺ࡞ۀऀ͕֨ύλʔϯΛ ى͢Δ͜ͱ͕Ͱ͖ͳ͔ͬͨ߹͕ଟ͍ɻ 表6 名詞クラスのタグ付与の作業結果(報道50記事、サ変名詞665箇所)
まとめ 15 ɾژίʔύεΛରʹ͜Ε·Ͱʹͳ͍େنͳ ड़ޠ߲ߏɾڞࢀরλά͖ίʔύεΛߏஙɻ ɾػցֶशͷ܇࿅ࣄྫͱ͢Δ߹ɺͷҧ͍ʹΑ ΓదʹղੳͰ͖ͳ͍߹͕͋ΔͨΊɺ͍͔ͭ͘ͷྖ Ҭʹ֦ுͯ͠λά༩Λߦ͏ඞཁ͕͋Δɻ