Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
述語項構造と照応関係のアノテーション
Search
kakubari
May 19, 2017
Technology
0
220
述語項構造と照応関係のアノテーション
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
May 19, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
78
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
71
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
87
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
190
Other Decks in Technology
See All in Technology
相互運用可能な学修歴クレデンシャルに向けた標準技術と国際動向
fujie
0
240
Claude CodeでKiroの仕様駆動開発を実現させるには...
gotalab555
3
980
全員が手を動かす組織へ - 生成AIが変えるTVerの開発現場 / everyone-codes-genai-transforms-tver-development
tohae
0
110
【CEDEC2025】大規模言語モデルを活用したゲーム内会話パートのスクリプト作成支援への取り組み
cygames
PRO
2
820
薬屋のひとりごとにみるトラブルシューティング
tomokusaba
0
220
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
150
Vision Language Modelと自動運転AIの最前線_20250730
yuyamaguchi
4
1.2k
LTに影響を受けてテンプレリポジトリを作った話
hol1kgmg
0
350
Jamf Connect ZTNAとMDMで実現! 金融ベンチャーにおける「デバイストラスト」実例と軌跡 / Kyash Device Trust
rela1470
1
190
アカデミーキャンプ 2025 SuuuuuuMMeR「燃えろ!!ロボコン」 / Academy Camp 2025 SuuuuuuMMeR "Burn the Spirit, Robocon!!" DAY 1
ks91
PRO
0
130
【OptimizationNight】数理最適化のラストワンマイルとしてのUIUX
brainpadpr
1
440
隙間時間で爆速開発! Claude Code × Vibe Coding で作るマニュアル自動生成サービス
akitomonam
3
260
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Thoughts on Productivity
jonyablonski
69
4.8k
The Pragmatic Product Professional
lauravandoore
36
6.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
235
140k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Building Adaptive Systems
keathley
43
2.7k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
750
Why Our Code Smells
bkeepers
PRO
337
57k
KATA
mclloyd
32
14k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から 飯田 龍・小町 守・井之上 直也・乾 健太郎・松本 裕治 自然言語処理, 7PM /P QQ@@ ਤදจΑΓҾ༻ 1
研究の背景 ˔طଘͷίʔύε࡞Ͱಋೖ͞Ε͍ͯΔλά༩ͷج४ ɹݴޠͷҧ͍࠷ऴతʹग़ྗ͍ͨ͠ղੳ݁Ռ͕ҟͳΔͨΊɺ ͦͷ··ར༻Ͱ͖ͳ͍ɻ ɹ ˔ຊจͰͷݕ౼ ɹ˓طଘͷλά༩ͷ༻Λۛຯ ɹ˓ड़ޠ߲ߏͱڞࢀরؔͷΞϊςʔγϣϯ ɹ˓λά༩ͷج४͕Ͳ͏͋Δ͖͔Λݕ౼
˔࡞ۀ݁ՌͰ͋Δ/"*45ςΩετίʔύε ɹIUUQDMOBJTUKQOMEBUBDPSQVT 2
照応・共参照 3 রԠɿ ɾ͋Δදݱ͕ಉҰจষͷଞͷදݱΛࢦ͢ػೳɻ ɾࢦ͢ଆͷදݱΛরԠࢺɺࢦ͞ΕΔଆͷදݱΛઌߦࢺͱ͍͏ɻ θϩরԠɿ ɾθϩ໊ࢺͱরԠؔͱͳΔ߹ɻ จθϩরԠɿ ɾθϩ໊ࢺͱઌߦࢺ͕ಉҰจʹग़ݱ͍ͯ͠Δ߹ɻ จؒθϩরԠɿ
ɾઌߦࢺ͕θϩ໊ࢺͱಉҰจষͷҟͳΔจষʹग़ݱ͍ͯ͠ Δ߹ɻ ڞࢀরɿ ɾೋͭʢͦ͘͠ΕҎ্ʣͷදݱ͕ݱ࣮ੈքʢ͘͠Ծ ੈքʣʹ͓͍ͯಉҰͷ࣮ଶΛ͍ͯ͞͠Δ߹ɻ
照応・共参照のタグ付与に関する先行研究 4 ˔4PPOΒʢ4PPO /H BOE-JNʣ/HΒʢ/HBOE $BSEJFBʣ ɿաͳڞࢀর͕ؔλά༩͞Ε͍ͯΔɻ ˔"VUPNBUJD$POUFOU&YUSBDUJPO "$&
%PEEJOHUPOFUBM ɹఏҊɿաͳڞࢀরؔΛճආ͢ΔͨΊʹɺNFOUJPOʢݴٴʣ ͱFOUJUZʢ࣮ମʣͱ͍͏̎ͭͷ֓೦Λಋೖɻ ɹɿจষʹग़ݱ͢Δڞࢀরؔʹཏతʹλά͕༩͞Ε ͳ͍ɻ ˔ژίʔύεʢՏݪଞʣ ɹΓड͚ͷใʹՃ͑ɺҰ෦ʹڞࢀরλά͕༩͞Ε͍ͯΔɻ
述語項構造のタグ付与に関する先行研究 5 ˔ඞਢ͕֨লུ͞ΕΔθϩরԠͷݱ͕සൟʹى͖Δɻ ɹɾจΛ͑ͯग़ݱ͍ͯ͠Δදݱ ɹɾจষ֎ͷཁૉ ɹ্هΛߟྀͯ͠ɺλά༩Λߦ͏ඞཁ͕͋Δɻ ژίʔύε ɾจؒθϩরԠɺ֎քরԠʹؔͯ͠λάΛ༩ ɾ֨ॿࢺ૬ͷද֨ʹՃ͑ɺχπΠςͷΑ͏ͳ࿈ޠ
Ұͭͷද֨ͱͯ͠ड़ޠͱ߲ͷؔΛ༩
本研究のタグ付与の基準 6 /"*45ςΩετίʔύεͰ࠾༻͢Δλά༩ͷ༷ ड़ޠ߲ߏʹ͍ͭͯ ɹड़ޠͷجຊܗʹͦͷ߲ͱͳΔදݱΛද֨ʢΨ֨ɺϮ֨ɺ χ֨ʣϨϕϧͰλά༩͢Δɻ ࣄଶੑ໊ࢺʹ͍ͭͯ
ɹड़ޠͱಉ༷ʹද֨ϨϕϧͰ߲Λ༩͢Δɻ ڞࢀরؔʹ͍ͭͯ ɹ*3"ͷؔͷΈΛରͱͯ͠ڞࢀরͷؔΛೝఆ͢Δɻ
述語と項のタグ付与 7 Bژίʔύεͷड़ޠ߲ߏͰ͋Γɺ C͕ຊจͷड़ޠ߲ߏͰ͋Δɻ ຊจͷಛ ɾಈࢺͷݪܗʹରͯ͠λάΛ༩͢Δɻ ɾ֨ཁૉΛ૿͢ॿಈࢺʹରͯ͠λάΛ༩͢Δɻ
タグ付与作業の結果(統計) 8 表3 述語と事態性名詞のタグの統計(NAISTテキストコーパスの全体)
タグ付与作業の結果(統計) 9 ˔ड़ޠͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ͷ΄ͱΜͲΓؔ ɾΨ֨ͷׂ̒θϩরԠͷؔ ˔ࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ಉҰจઅ ɾΨ֨ͷׂ̔θϩরԠͷؔ
ड़ޠͱࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴେ͖͘ҟͳΔ
作業者のタグ付与の一致率 10 表4 タグの一致率(報道30記事)
タグ付与の問題点 11 ˔ड़ޠͷλά༩ͷ ɹλά༩ͷରͱͳΔड़ޠ͕ʮʙͱͯ͠ʯͷΑ͏ͳػೳ ޠ૬දݱͷ͕͋Δɻ ྫ͑ɾɾɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱͯ͠ʯ ɾʮͱͯ͠ʯ͕z͋ΔҰͭͷଆ໘͔ΒͷՁ͚ɾҙຯ ͚zɹͷػೳޠ૬දݱ ɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱ͢Δʯͱղऍ
Βʢ Ӊ࿊ দ٢ ࠤ౻ தʣࢀߟ༧ ఆ
タグ付与の問題点 12 ˔ࣄଶੑ໊ࢺλά༩ͷ ɹࠓճɺࣄଶੑ໊ࢺ͕zίτzΛද͍ͯ͠Δ߹ͷΈ ʹλάΛ༩͍ͯ͠Δɻ ͕ͩɺࣄଶੑ໊ࢺͷதʹ lίτzͱzϞϊzͷͲͪΒͱղऍͰ͖Δͷ͕͋Δɻ ྫ͑ɾɾɾใࠂ
ɹɾίτɿใࠂ͢Δಈ࡞ ɹɾϞϊɿใࠂ͞ΕΔ݁Ռ
事態性名詞タグ付与の改善点 13 ˔मਖ਼̍ ϞϊΛࢦ͢දݱʹରͯ͠λάΛ༩͢Δɻ ˔मਖ਼̎ ϞϊͱίτΛࢦ͢දݱΛ۠ผ͢ΔͨΊɺϞϊͱஅ͠ ͨࠜڌλά
タグ付与の改善結果 14 ɾจষதͷ΄ͱΜͲͷαม໊ࢺ͕߲ͷ༩ରɻ ɾ߲Λ͔࣋ͭ൱͔ͷҰகͰ͋ΓɺҎલͷ ΑΓ࡞ۀ্࣭͕ͨ͠ɻ ɾ߲͕Ұக͠ͳ͔ͬͨͷɺ࡞ۀऀ͕֨ύλʔϯΛ ى͢Δ͜ͱ͕Ͱ͖ͳ͔ͬͨ߹͕ଟ͍ɻ 表6 名詞クラスのタグ付与の作業結果(報道50記事、サ変名詞665箇所)
まとめ 15 ɾژίʔύεΛରʹ͜Ε·Ͱʹͳ͍େنͳ ड़ޠ߲ߏɾڞࢀরλά͖ίʔύεΛߏஙɻ ɾػցֶशͷ܇࿅ࣄྫͱ͢Δ߹ɺͷҧ͍ʹΑ ΓదʹղੳͰ͖ͳ͍߹͕͋ΔͨΊɺ͍͔ͭ͘ͷྖ Ҭʹ֦ுͯ͠λά༩Λߦ͏ඞཁ͕͋Δɻ