Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
述語項構造と照応関係のアノテーション
Search
kakubari
May 19, 2017
Technology
0
220
述語項構造と照応関係のアノテーション
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
May 19, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
160
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
81
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
100
Labeling the Semantic Roles of Commas
kakubari
0
76
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
89
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
130
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
190
Other Decks in Technology
See All in Technology
【実演版】カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 / 大吉祥寺.pm 2025
arthur1
1
830
Webアプリケーションにオブザーバビリティを実装するRust入門ガイド
nwiizo
7
800
250905 大吉祥寺.pm 2025 前夜祭 「プログラミングに出会って20年、『今』が1番楽しい」
msykd
PRO
1
820
生成AIでセキュリティ運用を効率化する話
sakaitakeshi
0
660
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
460
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
220
サラリーマンの小遣いで作るtoCサービス - Cloudflare Workersでスケールする開発戦略
shinaps
2
440
現場で効くClaude Code ─ 最新動向と企業導入
takaakikakei
1
240
react-callを使ってダイヤログをいろんなとこで再利用しよう!
shinaps
1
240
人工衛星のファームウェアをRustで書く理由
koba789
15
7.7k
品質視点から考える組織デザイン/Organizational Design from Quality
mii3king
0
200
「何となくテストする」を卒業するためにプロダクトが動く仕組みを理解しよう
kawabeaver
0
390
Featured
See All Featured
Statistics for Hackers
jakevdp
799
220k
Gamification - CAS2011
davidbonilla
81
5.4k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
GraphQLの誤解/rethinking-graphql
sonatard
72
11k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
The Invisible Side of Design
smashingmag
301
51k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Fireside Chat
paigeccino
39
3.6k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
920
KATA
mclloyd
32
14k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から 飯田 龍・小町 守・井之上 直也・乾 健太郎・松本 裕治 自然言語処理, 7PM /P QQ@@ ਤදจΑΓҾ༻ 1
研究の背景 ˔طଘͷίʔύε࡞Ͱಋೖ͞Ε͍ͯΔλά༩ͷج४ ɹݴޠͷҧ͍࠷ऴతʹग़ྗ͍ͨ͠ղੳ݁Ռ͕ҟͳΔͨΊɺ ͦͷ··ར༻Ͱ͖ͳ͍ɻ ɹ ˔ຊจͰͷݕ౼ ɹ˓طଘͷλά༩ͷ༻Λۛຯ ɹ˓ड़ޠ߲ߏͱڞࢀরؔͷΞϊςʔγϣϯ ɹ˓λά༩ͷج४͕Ͳ͏͋Δ͖͔Λݕ౼
˔࡞ۀ݁ՌͰ͋Δ/"*45ςΩετίʔύε ɹIUUQDMOBJTUKQOMEBUBDPSQVT 2
照応・共参照 3 রԠɿ ɾ͋Δදݱ͕ಉҰจষͷଞͷදݱΛࢦ͢ػೳɻ ɾࢦ͢ଆͷදݱΛরԠࢺɺࢦ͞ΕΔଆͷදݱΛઌߦࢺͱ͍͏ɻ θϩরԠɿ ɾθϩ໊ࢺͱরԠؔͱͳΔ߹ɻ จθϩরԠɿ ɾθϩ໊ࢺͱઌߦࢺ͕ಉҰจʹग़ݱ͍ͯ͠Δ߹ɻ จؒθϩরԠɿ
ɾઌߦࢺ͕θϩ໊ࢺͱಉҰจষͷҟͳΔจষʹग़ݱ͍ͯ͠ Δ߹ɻ ڞࢀরɿ ɾೋͭʢͦ͘͠ΕҎ্ʣͷදݱ͕ݱ࣮ੈքʢ͘͠Ծ ੈքʣʹ͓͍ͯಉҰͷ࣮ଶΛ͍ͯ͞͠Δ߹ɻ
照応・共参照のタグ付与に関する先行研究 4 ˔4PPOΒʢ4PPO /H BOE-JNʣ/HΒʢ/HBOE $BSEJFBʣ ɿաͳڞࢀর͕ؔλά༩͞Ε͍ͯΔɻ ˔"VUPNBUJD$POUFOU&YUSBDUJPO "$&
%PEEJOHUPOFUBM ɹఏҊɿաͳڞࢀরؔΛճආ͢ΔͨΊʹɺNFOUJPOʢݴٴʣ ͱFOUJUZʢ࣮ମʣͱ͍͏̎ͭͷ֓೦Λಋೖɻ ɹɿจষʹग़ݱ͢Δڞࢀরؔʹཏతʹλά͕༩͞Ε ͳ͍ɻ ˔ژίʔύεʢՏݪଞʣ ɹΓड͚ͷใʹՃ͑ɺҰ෦ʹڞࢀরλά͕༩͞Ε͍ͯΔɻ
述語項構造のタグ付与に関する先行研究 5 ˔ඞਢ͕֨লུ͞ΕΔθϩরԠͷݱ͕සൟʹى͖Δɻ ɹɾจΛ͑ͯग़ݱ͍ͯ͠Δදݱ ɹɾจষ֎ͷཁૉ ɹ্هΛߟྀͯ͠ɺλά༩Λߦ͏ඞཁ͕͋Δɻ ژίʔύε ɾจؒθϩরԠɺ֎քরԠʹؔͯ͠λάΛ༩ ɾ֨ॿࢺ૬ͷද֨ʹՃ͑ɺχπΠςͷΑ͏ͳ࿈ޠ
Ұͭͷද֨ͱͯ͠ड़ޠͱ߲ͷؔΛ༩
本研究のタグ付与の基準 6 /"*45ςΩετίʔύεͰ࠾༻͢Δλά༩ͷ༷ ड़ޠ߲ߏʹ͍ͭͯ ɹड़ޠͷجຊܗʹͦͷ߲ͱͳΔදݱΛද֨ʢΨ֨ɺϮ֨ɺ χ֨ʣϨϕϧͰλά༩͢Δɻ ࣄଶੑ໊ࢺʹ͍ͭͯ
ɹड़ޠͱಉ༷ʹද֨ϨϕϧͰ߲Λ༩͢Δɻ ڞࢀরؔʹ͍ͭͯ ɹ*3"ͷؔͷΈΛରͱͯ͠ڞࢀরͷؔΛೝఆ͢Δɻ
述語と項のタグ付与 7 Bژίʔύεͷड़ޠ߲ߏͰ͋Γɺ C͕ຊจͷड़ޠ߲ߏͰ͋Δɻ ຊจͷಛ ɾಈࢺͷݪܗʹରͯ͠λάΛ༩͢Δɻ ɾ֨ཁૉΛ૿͢ॿಈࢺʹରͯ͠λάΛ༩͢Δɻ
タグ付与作業の結果(統計) 8 表3 述語と事態性名詞のタグの統計(NAISTテキストコーパスの全体)
タグ付与作業の結果(統計) 9 ˔ड़ޠͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ͷ΄ͱΜͲΓؔ ɾΨ֨ͷׂ̒θϩরԠͷؔ ˔ࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ಉҰจઅ ɾΨ֨ͷׂ̔θϩরԠͷؔ
ड़ޠͱࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴେ͖͘ҟͳΔ
作業者のタグ付与の一致率 10 表4 タグの一致率(報道30記事)
タグ付与の問題点 11 ˔ड़ޠͷλά༩ͷ ɹλά༩ͷରͱͳΔड़ޠ͕ʮʙͱͯ͠ʯͷΑ͏ͳػೳ ޠ૬දݱͷ͕͋Δɻ ྫ͑ɾɾɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱͯ͠ʯ ɾʮͱͯ͠ʯ͕z͋ΔҰͭͷଆ໘͔ΒͷՁ͚ɾҙຯ ͚zɹͷػೳޠ૬දݱ ɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱ͢Δʯͱղऍ
Βʢ Ӊ࿊ দ٢ ࠤ౻ தʣࢀߟ༧ ఆ
タグ付与の問題点 12 ˔ࣄଶੑ໊ࢺλά༩ͷ ɹࠓճɺࣄଶੑ໊ࢺ͕zίτzΛද͍ͯ͠Δ߹ͷΈ ʹλάΛ༩͍ͯ͠Δɻ ͕ͩɺࣄଶੑ໊ࢺͷதʹ lίτzͱzϞϊzͷͲͪΒͱղऍͰ͖Δͷ͕͋Δɻ ྫ͑ɾɾɾใࠂ
ɹɾίτɿใࠂ͢Δಈ࡞ ɹɾϞϊɿใࠂ͞ΕΔ݁Ռ
事態性名詞タグ付与の改善点 13 ˔मਖ਼̍ ϞϊΛࢦ͢දݱʹରͯ͠λάΛ༩͢Δɻ ˔मਖ਼̎ ϞϊͱίτΛࢦ͢දݱΛ۠ผ͢ΔͨΊɺϞϊͱஅ͠ ͨࠜڌλά
タグ付与の改善結果 14 ɾจষதͷ΄ͱΜͲͷαม໊ࢺ͕߲ͷ༩ରɻ ɾ߲Λ͔࣋ͭ൱͔ͷҰகͰ͋ΓɺҎલͷ ΑΓ࡞ۀ্࣭͕ͨ͠ɻ ɾ߲͕Ұக͠ͳ͔ͬͨͷɺ࡞ۀऀ͕֨ύλʔϯΛ ى͢Δ͜ͱ͕Ͱ͖ͳ͔ͬͨ߹͕ଟ͍ɻ 表6 名詞クラスのタグ付与の作業結果(報道50記事、サ変名詞665箇所)
まとめ 15 ɾژίʔύεΛରʹ͜Ε·Ͱʹͳ͍େنͳ ड़ޠ߲ߏɾڞࢀরλά͖ίʔύεΛߏஙɻ ɾػցֶशͷ܇࿅ࣄྫͱ͢Δ߹ɺͷҧ͍ʹΑ ΓదʹղੳͰ͖ͳ͍߹͕͋ΔͨΊɺ͍͔ͭ͘ͷྖ Ҭʹ֦ுͯ͠λά༩Λߦ͏ඞཁ͕͋Δɻ