Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
述語項構造と照応関係のアノテーション
Search
kakubari
May 19, 2017
Technology
0
180
述語項構造と照応関係のアノテーション
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
May 19, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
87
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
110
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
63
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
87
Labeling the Semantic Roles of Commas
kakubari
0
56
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
91
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
73
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
86
用言と直前の格要素の組を単位とする格フレームの自動構築
kakubari
0
140
Other Decks in Technology
See All in Technology
単回帰分析について数式を追いながら実装してみた
kentaitakura
0
500
XRミーティング 2024-03-20
1ftseabass
PRO
0
100
ビジネスロジックを「型」で表現するOOPのための関数型DDD / Functional And Type-Safe DDD for OOP
yuitosato
29
11k
MongoDB Atlas Vectorsearchではじめる生成AIアプリ開発
chie8842
3
510
Challenges - Open Farming Hackdays 2024
loleg
0
530
暗黙知を集積するプラットフォーム : 「健常者エミュレータ事例集」の取り組み
sora32127
1
160
TCA入門したてなので、自分が馴染みのある実装と比較しながらキャッチアップしてみる
fumiyasac0921
1
370
技術広報経験0のEMがエンジニアブランディングをはじめてみた
coconala_engineer
1
130
依存ライブラリはどこに?
takesection
0
100
中央集権体制からDataOpsへの転換 / centralized-to-dataops-transformation
pei0804
7
1.4k
20240321_生成AI時代のDevOps
kzkmaeda
2
610
OpenTelemetry実践 はじめの一歩
taxin
0
310
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
350
18k
Debugging Ruby Performance
tmm1
68
11k
Why You Should Never Use an ORM
jnunemaker
PRO
50
8.6k
Web Components: a chance to create the future
zenorocha
304
41k
jQuery: Nuts, Bolts and Bling
dougneiner
57
7.1k
[RailsConf 2023] Rails as a piece of cake
palkan
21
3.8k
The World Runs on Bad Software
bkeepers
PRO
60
6.6k
Scaling GitHub
holman
456
140k
Build your cross-platform service in a week with App Engine
jlugia
223
17k
Building Your Own Lightsaber
phodgson
97
5.6k
The Illustrated Children's Guide to Kubernetes
chrisshort
28
46k
Typedesign – Prime Four
hannesfritz
36
2k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ֯ ு ཽ 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から 飯田 龍・小町 守・井之上 直也・乾 健太郎・松本 裕治 自然言語処理, 7PM /P QQ@@ ਤදจΑΓҾ༻ 1
研究の背景 ˔طଘͷίʔύε࡞Ͱಋೖ͞Ε͍ͯΔλά༩ͷج४ ɹݴޠͷҧ͍࠷ऴతʹग़ྗ͍ͨ͠ղੳ݁Ռ͕ҟͳΔͨΊɺ ͦͷ··ར༻Ͱ͖ͳ͍ɻ ɹ ˔ຊจͰͷݕ౼ ɹ˓طଘͷλά༩ͷ༻Λۛຯ ɹ˓ड़ޠ߲ߏͱڞࢀরؔͷΞϊςʔγϣϯ ɹ˓λά༩ͷج४͕Ͳ͏͋Δ͖͔Λݕ౼
˔࡞ۀ݁ՌͰ͋Δ/"*45ςΩετίʔύε ɹIUUQDMOBJTUKQOMEBUBDPSQVT 2
照応・共参照 3 রԠɿ ɾ͋Δදݱ͕ಉҰจষͷଞͷදݱΛࢦ͢ػೳɻ ɾࢦ͢ଆͷදݱΛরԠࢺɺࢦ͞ΕΔଆͷදݱΛઌߦࢺͱ͍͏ɻ θϩরԠɿ ɾθϩ໊ࢺͱরԠؔͱͳΔ߹ɻ จθϩরԠɿ ɾθϩ໊ࢺͱઌߦࢺ͕ಉҰจʹग़ݱ͍ͯ͠Δ߹ɻ จؒθϩরԠɿ
ɾઌߦࢺ͕θϩ໊ࢺͱಉҰจষͷҟͳΔจষʹग़ݱ͍ͯ͠ Δ߹ɻ ڞࢀরɿ ɾೋͭʢͦ͘͠ΕҎ্ʣͷදݱ͕ݱ࣮ੈքʢ͘͠Ծ ੈքʣʹ͓͍ͯಉҰͷ࣮ଶΛ͍ͯ͞͠Δ߹ɻ
照応・共参照のタグ付与に関する先行研究 4 ˔4PPOΒʢ4PPO /H BOE-JNʣ/HΒʢ/HBOE $BSEJFBʣ ɿաͳڞࢀর͕ؔλά༩͞Ε͍ͯΔɻ ˔"VUPNBUJD$POUFOU&YUSBDUJPO "$&
%PEEJOHUPOFUBM ɹఏҊɿաͳڞࢀরؔΛճආ͢ΔͨΊʹɺNFOUJPOʢݴٴʣ ͱFOUJUZʢ࣮ମʣͱ͍͏̎ͭͷ֓೦Λಋೖɻ ɹɿจষʹग़ݱ͢Δڞࢀরؔʹཏతʹλά͕༩͞Ε ͳ͍ɻ ˔ژίʔύεʢՏݪଞʣ ɹΓड͚ͷใʹՃ͑ɺҰ෦ʹڞࢀরλά͕༩͞Ε͍ͯΔɻ
述語項構造のタグ付与に関する先行研究 5 ˔ඞਢ͕֨লུ͞ΕΔθϩরԠͷݱ͕සൟʹى͖Δɻ ɹɾจΛ͑ͯग़ݱ͍ͯ͠Δදݱ ɹɾจষ֎ͷཁૉ ɹ্هΛߟྀͯ͠ɺλά༩Λߦ͏ඞཁ͕͋Δɻ ژίʔύε ɾจؒθϩরԠɺ֎քরԠʹؔͯ͠λάΛ༩ ɾ֨ॿࢺ૬ͷද֨ʹՃ͑ɺχπΠςͷΑ͏ͳ࿈ޠ
Ұͭͷද֨ͱͯ͠ड़ޠͱ߲ͷؔΛ༩
本研究のタグ付与の基準 6 /"*45ςΩετίʔύεͰ࠾༻͢Δλά༩ͷ༷ ड़ޠ߲ߏʹ͍ͭͯ ɹड़ޠͷجຊܗʹͦͷ߲ͱͳΔදݱΛද֨ʢΨ֨ɺϮ֨ɺ χ֨ʣϨϕϧͰλά༩͢Δɻ ࣄଶੑ໊ࢺʹ͍ͭͯ
ɹड़ޠͱಉ༷ʹද֨ϨϕϧͰ߲Λ༩͢Δɻ ڞࢀরؔʹ͍ͭͯ ɹ*3"ͷؔͷΈΛରͱͯ͠ڞࢀরͷؔΛೝఆ͢Δɻ
述語と項のタグ付与 7 Bژίʔύεͷड़ޠ߲ߏͰ͋Γɺ C͕ຊจͷड़ޠ߲ߏͰ͋Δɻ ຊจͷಛ ɾಈࢺͷݪܗʹରͯ͠λάΛ༩͢Δɻ ɾ֨ཁૉΛ૿͢ॿಈࢺʹରͯ͠λάΛ༩͢Δɻ
タグ付与作業の結果(統計) 8 表3 述語と事態性名詞のタグの統計(NAISTテキストコーパスの全体)
タグ付与作業の結果(統計) 9 ˔ड़ޠͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ͷ΄ͱΜͲΓؔ ɾΨ֨ͷׂ̒θϩরԠͷؔ ˔ࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴ ɾϮ֨ɺχ֨ಉҰจઅ ɾΨ֨ͷׂ̔θϩরԠͷؔ
ड़ޠͱࣄଶੑ໊ࢺͷ߲ͷग़ݱՕॴେ͖͘ҟͳΔ
作業者のタグ付与の一致率 10 表4 タグの一致率(報道30記事)
タグ付与の問題点 11 ˔ड़ޠͷλά༩ͷ ɹλά༩ͷରͱͳΔड़ޠ͕ʮʙͱͯ͠ʯͷΑ͏ͳػೳ ޠ૬දݱͷ͕͋Δɻ ྫ͑ɾɾɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱͯ͠ʯ ɾʮͱͯ͠ʯ͕z͋ΔҰͭͷଆ໘͔ΒͷՁ͚ɾҙຯ ͚zɹͷػೳޠ૬දݱ ɾʮձࣾ"͕ձࣾ#Λࢠձࣾͱ͢Δʯͱղऍ
Βʢ Ӊ࿊ দ٢ ࠤ౻ தʣࢀߟ༧ ఆ
タグ付与の問題点 12 ˔ࣄଶੑ໊ࢺλά༩ͷ ɹࠓճɺࣄଶੑ໊ࢺ͕zίτzΛද͍ͯ͠Δ߹ͷΈ ʹλάΛ༩͍ͯ͠Δɻ ͕ͩɺࣄଶੑ໊ࢺͷதʹ lίτzͱzϞϊzͷͲͪΒͱղऍͰ͖Δͷ͕͋Δɻ ྫ͑ɾɾɾใࠂ
ɹɾίτɿใࠂ͢Δಈ࡞ ɹɾϞϊɿใࠂ͞ΕΔ݁Ռ
事態性名詞タグ付与の改善点 13 ˔मਖ਼̍ ϞϊΛࢦ͢දݱʹରͯ͠λάΛ༩͢Δɻ ˔मਖ਼̎ ϞϊͱίτΛࢦ͢දݱΛ۠ผ͢ΔͨΊɺϞϊͱஅ͠ ͨࠜڌλά
タグ付与の改善結果 14 ɾจষதͷ΄ͱΜͲͷαม໊ࢺ͕߲ͷ༩ରɻ ɾ߲Λ͔࣋ͭ൱͔ͷҰகͰ͋ΓɺҎલͷ ΑΓ࡞ۀ্࣭͕ͨ͠ɻ ɾ߲͕Ұக͠ͳ͔ͬͨͷɺ࡞ۀऀ͕֨ύλʔϯΛ ى͢Δ͜ͱ͕Ͱ͖ͳ͔ͬͨ߹͕ଟ͍ɻ 表6 名詞クラスのタグ付与の作業結果(報道50記事、サ変名詞665箇所)
まとめ 15 ɾژίʔύεΛରʹ͜Ε·Ͱʹͳ͍େنͳ ड़ޠ߲ߏɾڞࢀরλά͖ίʔύεΛߏஙɻ ɾػցֶशͷ܇࿅ࣄྫͱ͢Δ߹ɺͷҧ͍ʹΑ ΓదʹղੳͰ͖ͳ͍߹͕͋ΔͨΊɺ͍͔ͭ͘ͷྖ Ҭʹ֦ுͯ͠λά༩Λߦ͏ඞཁ͕͋Δɻ