Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
述語項構造と照応関係のアノテーション
Search
kakubari
May 19, 2017
Technology
0
220
述語項構造と照応関係のアノテーション
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
May 19, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
73
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
66
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
86
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
180
Other Decks in Technology
See All in Technology
「どこにある?」の解決。生成AI(RAG)で効率化するガバメントクラウド運用
toru_kubota
2
370
vLLM meetup Tokyo
jpishikawa
1
200
Model Mondays S2E01: Advanced Reasoning
nitya
0
310
マルチテナント+マルチプロダクト SaaS への AI Agent の組み込み方
kworkdev
PRO
2
320
kubellが挑むBPaaSにおける、人とAIエージェントによるサービス開発の最前線と技術展望
kubell_hr
0
280
脅威をモデリングしてMCPのセキュリティ対策を考えよう
flatt_security
4
1.5k
OCI Oracle Database Services新機能アップデート(2025/03-2025/05)
oracle4engineer
PRO
1
140
上長や社内ステークホルダーに対する解像度を上げて、より良い補完関係を築く方法 / How-to-increase-resolution-and-build-better-complementary-relationships-with-your-bosses-and-internal-stakeholders
madoxten
13
7.5k
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
12k
開発効率と信頼性を両立する Ubieのプラットフォームエンジニアリング
teru0x1
0
130
データ戦略部門 紹介資料
sansan33
PRO
1
3.2k
DB 醬,嗨!哪泥嘎斯基?
line_developers_tw
PRO
0
150
Featured
See All Featured
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Designing for Performance
lara
609
69k
KATA
mclloyd
29
14k
Gamification - CAS2011
davidbonilla
81
5.3k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
480
Automating Front-end Workflow
addyosmani
1370
200k
Code Reviewing Like a Champion
maltzj
524
40k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Scaling GitHub
holman
459
140k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Documentation Writing (for coders)
carmenintech
71
4.9k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から 飯田 龍・小町 守・井之上 直也・乾 健太郎・松本 裕治 自然言語処理, 7PM /P QQ@@ ਤදจΑΓҾ༻ 1
研究の背景 ˔طଘͷίʔύε࡞Ͱಋೖ͞Ε͍ͯΔλά༩ͷج४ ɹݴޠͷҧ͍࠷ऴతʹग़ྗ͍ͨ͠ղੳ݁Ռ͕ҟͳΔͨΊɺ ͦͷ··ར༻Ͱ͖ͳ͍ɻ ɹ ˔ຊจͰͷݕ౼ ɹ˓طଘͷλά༩ͷ༻Λۛຯ ɹ˓ड़ޠ߲ߏͱڞࢀরؔͷΞϊςʔγϣϯ ɹ˓λά༩ͷج४͕Ͳ͏͋Δ͖͔Λݕ౼
˔࡞ۀ݁ՌͰ͋Δ/"*45ςΩετίʔύε ɹIUUQDMOBJTUKQOMEBUBDPSQVT 2
照応・共参照 3 রԠɿ ɾ͋Δදݱ͕ಉҰจষͷଞͷදݱΛࢦ͢ػೳɻ ɾࢦ͢ଆͷදݱΛরԠࢺɺࢦ͞ΕΔଆͷදݱΛઌߦࢺͱ͍͏ɻ θϩরԠɿ ɾθϩ໊ࢺͱরԠؔͱͳΔ߹ɻ จθϩরԠɿ ɾθϩ໊ࢺͱઌߦࢺ͕ಉҰจʹग़ݱ͍ͯ͠Δ߹ɻ จؒθϩরԠɿ
ɾઌߦࢺ͕θϩ໊ࢺͱಉҰจষͷҟͳΔจষʹग़ݱ͍ͯ͠ Δ߹ɻ ڞࢀরɿ ɾೋͭʢͦ͘͠ΕҎ্ʣͷදݱ͕ݱ࣮ੈքʢ͘͠Ծ ੈքʣʹ͓͍ͯಉҰͷ࣮ଶΛ͍ͯ͞͠Δ߹ɻ
照応・共参照のタグ付与に関する先行研究 4 ˔4PPOΒʢ4PPO /H BOE-JNʣ/HΒʢ/HBOE $BSEJFBʣ ɿաͳڞࢀর͕ؔλά༩͞Ε͍ͯΔɻ ˔"VUPNBUJD$POUFOU&YUSBDUJPO "$&
%PEEJOHUPOFUBM ɹఏҊɿաͳڞࢀরؔΛճආ͢ΔͨΊʹɺNFOUJPOʢݴٴʣ ͱFOUJUZʢ࣮ମʣͱ͍͏̎ͭͷ֓೦Λಋೖɻ ɹɿจষʹग़ݱ͢Δڞࢀরؔʹཏతʹλά͕༩͞Ε ͳ͍ɻ ˔ژίʔύεʢՏݪଞʣ ɹΓड͚ͷใʹՃ͑ɺҰ෦ʹڞࢀরλά͕༩͞Ε͍ͯΔɻ
述語項構造のタグ付与に関する先行研究 5 ˔ඞਢ͕֨লུ͞ΕΔθϩরԠͷݱ͕සൟʹى͖Δɻ ɹɾจΛ͑ͯग़ݱ͍ͯ͠Δදݱ ɹɾจষ֎ͷཁૉ ɹ্هΛߟྀͯ͠ɺλά༩Λߦ͏ඞཁ͕͋Δɻ ژίʔύε ɾจؒθϩরԠɺ֎քরԠʹؔͯ͠λάΛ༩ ɾ֨ॿࢺ૬ͷද֨ʹՃ͑ɺχπΠςͷΑ͏ͳ࿈ޠ
Ұͭͷද֨ͱͯ͠ड़ޠͱ߲ͷؔΛ༩
本研究のタグ付与の基準 6 /"*45ςΩετίʔύεͰ࠾༻͢Δλά༩ͷ༷ ड़ޠ߲ߏʹ͍ͭͯ ɹड़ޠͷجຊܗʹͦͷ߲ͱͳΔදݱΛද֨ʢΨ֨ɺϮ֨ɺ χ֨ʣϨϕϧͰλά༩͢Δɻ ࣄଶੑ໊ࢺʹ͍ͭͯ
ɹड़ޠͱಉ༷ʹද֨ϨϕϧͰ߲Λ༩͢Δɻ ڞࢀরؔʹ͍ͭͯ ɹ*3"ͷؔͷΈΛରͱͯ͠ڞࢀরͷؔΛೝఆ͢Δɻ
述語と項のタグ付与 7 Bژίʔύεͷड़ޠ߲ߏͰ͋Γɺ C͕ຊจͷड़ޠ߲ߏͰ͋Δɻ ຊจͷಛ ɾಈࢺͷݪܗʹରͯ͠λάΛ༩͢Δɻ ɾ֨ཁૉΛ૿͢ॿಈࢺʹରͯ͠λάΛ༩͢Δɻ
タグ付与作業の結果(統計) 8 表3 述語と事態性名詞のタグの統計(NAISTテキストコーパスの全体)
タグ付与作業の結果(統計) 9 ˔ड़ޠͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ͷ΄ͱΜͲΓؔ ɾΨ֨ͷׂ̒θϩরԠͷؔ ˔ࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ಉҰจઅ ɾΨ֨ͷׂ̔θϩরԠͷؔ
ड़ޠͱࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴେ͖͘ҟͳΔ
作業者のタグ付与の一致率 10 表4 タグの一致率(報道30記事)
タグ付与の問題点 11 ˔ड़ޠͷλά༩ͷ ɹλά༩ͷରͱͳΔड़ޠ͕ʮʙͱͯ͠ʯͷΑ͏ͳػೳ ޠ૬දݱͷ͕͋Δɻ ྫ͑ɾɾɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱͯ͠ʯ ɾʮͱͯ͠ʯ͕z͋ΔҰͭͷଆ໘͔ΒͷՁ͚ɾҙຯ ͚zɹͷػೳޠ૬දݱ ɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱ͢Δʯͱղऍ
Βʢ Ӊ࿊ দ٢ ࠤ౻ தʣࢀߟ༧ ఆ
タグ付与の問題点 12 ˔ࣄଶੑ໊ࢺλά༩ͷ ɹࠓճɺࣄଶੑ໊ࢺ͕zίτzΛද͍ͯ͠Δ߹ͷΈ ʹλάΛ༩͍ͯ͠Δɻ ͕ͩɺࣄଶੑ໊ࢺͷதʹ lίτzͱzϞϊzͷͲͪΒͱղऍͰ͖Δͷ͕͋Δɻ ྫ͑ɾɾɾใࠂ
ɹɾίτɿใࠂ͢Δಈ࡞ ɹɾϞϊɿใࠂ͞ΕΔ݁Ռ
事態性名詞タグ付与の改善点 13 ˔मਖ਼̍ ϞϊΛࢦ͢දݱʹରͯ͠λάΛ༩͢Δɻ ˔मਖ਼̎ ϞϊͱίτΛࢦ͢දݱΛ۠ผ͢ΔͨΊɺϞϊͱஅ͠ ͨࠜڌλά
タグ付与の改善結果 14 ɾจষதͷ΄ͱΜͲͷαม໊ࢺ͕߲ͷ༩ରɻ ɾ߲Λ͔࣋ͭ൱͔ͷҰகͰ͋ΓɺҎલͷ ΑΓ࡞ۀ্࣭͕ͨ͠ɻ ɾ߲͕Ұக͠ͳ͔ͬͨͷɺ࡞ۀऀ͕֨ύλʔϯΛ ى͢Δ͜ͱ͕Ͱ͖ͳ͔ͬͨ߹͕ଟ͍ɻ 表6 名詞クラスのタグ付与の作業結果(報道50記事、サ変名詞665箇所)
まとめ 15 ɾژίʔύεΛରʹ͜Ε·Ͱʹͳ͍େنͳ ड़ޠ߲ߏɾڞࢀরλά͖ίʔύεΛߏஙɻ ɾػցֶशͷ܇࿅ࣄྫͱ͢Δ߹ɺͷҧ͍ʹΑ ΓదʹղੳͰ͖ͳ͍߹͕͋ΔͨΊɺ͍͔ͭ͘ͷྖ Ҭʹ֦ுͯ͠λά༩Λߦ͏ඞཁ͕͋Δɻ