Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
複数の客観的手法を用いたテキスト含意認識評価セットの構築
Search
自然言語処理研究室
March 31, 2011
Research
1
76
複数の客観的手法を用いたテキスト含意認識評価セットの構築
宇髙 邦弘, 山本 和英. 複数の客観的手法を用いたテキスト含意認識評価セットの構築. 言語処理学会第17回年次大会, pp.627-630 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
19
9.6k
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
540
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
900
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
170
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
660
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.2k
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
3.2k
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
490
CoRL2025速報
rpc
4
4.2k
LiDARセキュリティ最前線(2025年)
kentaroy47
0
140
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
120
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
5
1.3k
Featured
See All Featured
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
920
Optimizing for Happiness
mojombo
379
71k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
270
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
120
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
How to Talk to Developers About Accessibility
jct
2
140
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
340
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
250
Making Projects Easy
brettharned
120
6.6k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Transcript
複数の客観的手法を用いた テキスト含意認識評価セット の構築 長岡技術科学大学 電気系 山本研究室 宇高 邦弘,山本 和英
テキスト含意認識とは ① ・言語表現A(テキスト)が言語表現B(仮説) の意味を含むかを判断するタスク テキスト :日本の大豆生産量は世界16位だ 仮説 :日本は大豆を生産している 含意判定 :含意
テキスト含意認識の例
研究背景 ・テキスト含意認識(RTE)の研究が活発化 ⇒換言や質問応答など多様な問題を含む ・日本語の評価セットが少ない ⇒構築コストの高さ ⇒テキスト含意認識のための知識の少なさ ⇒既存の評価セットは再現性に乏しい ⇒どのような含意関係を解決可能か不明瞭 ②
研究目的 換言や要約などの手法による 評価セットの構築 手法ごとに評価セットを作成 ⇒評価セットの難易性を統一 ⇒構築が低コスト ⇒再現性が高い ③
各評価セットの 構築方法(1/2) ・入力として日経ニュースメールを使用 ・以下の4種類の手法によって仮説を生成 ・含意判定は人手 ・含意ペアと非含意ペアが500ずつで各評価セット を構成 ④ 手法A:複文の単文化 手法B:述部に係らない文節の削除
手法C:副詞の削除 手法D:接頭辞の削除
各評価セットの 構築方法(2/2) 手法Aでの 仮説生成 テキスト 手法Bでの 仮説生成 手法Cでの 仮説生成 手法Dでの
仮説生成 評価セットA 評価セットB 評価セットC 評価セットD 含意判定 ⑤
手法A:複文の単文化 ⑥ ・連体修飾節について格助詞を補う ⇒文構造を変化させた仮説を作成 テキスト :AT&Tは高速ネット接続を可能にする CATV網を他の通信会社に開放する 仮説 :高速ネット接続をCATV網が可能にする 生成されるペアの例
手法B:述部に係る 文節以外の削除 ・述部に係る文節以外を全て削除 ⇒文構造を変化させた仮説を生成 ⑦ テキスト :NTTは電話線を使う高速ネット「ADSL」 を月800円で開放する 仮説 :NTTは「ADSL」を800円で開放する
生成されるペアの例
手法C:副詞の削除 ⑧ ・文中に存在する副詞を全て削除 (副詞可能名詞も含む) ⇒表層情報を変化させた仮説を生成 テキスト :東証のベンチャー向け新市場「マザーズ」 に22日、ネット関連2社が始めて上場 仮説 :東証のベンチャー向け新市場「マザーズ」
に22日、ネット関連2社が上場 生成されるペアの例
手法D:接頭辞の削除 ⑨ ・文中に存在する接頭辞を全て削除することで 仮説を生成 (「反,未,非,無,不」は未削除) ⇒表層情報を変化させた仮説を生成 テキスト :ジー・オー巨額詐欺事件で大神源太被告ら 5人の初公判が20日、東京地裁で開かれた 仮説
:ジー・オー巨額詐欺事件で大神源太被告ら 5人の公判が20日、東京地裁で開かれた 生成されるペアの例
仮説生成結果 手法Aは他の手法に比べ非文が作成され易い ⑩ 237 1143 728 手法D 1206 1279 826
手法C 284 511 535 手法B 3426 520 513 手法A 非文 非含意文 含意文 生成した文について含意文,非含意文,非文を カウント
評価実験 ⑪ ・各評価セットを2つの手法で含意認識 ・10分割交差検定法により含意認識精度を算出 ⇒10個の精度から標準偏差を算出 標準偏差が0に近いほど、評価セットの難易性が一定 1:共起頻度による含意認識手法 2:SubpathSet法による含意認識
実験結果 ⑫ SS:SubpatSet法による含意認識 0.44 0.21 1.69 0.64 13.77 0.44 19.76
0.21 標準 偏差 SS 共起 頻度 SS 共起 頻度 SS 共起頻 度 SS 共起 頻度 認識 手法 手法D 手法C 手法B 手法A 手法A,Bでの評価セットはSubpathSet法での標準 偏差が大きい
考察 ・含意認識手法と評価セットの構築手法によって 含意判定結果の揺れに差が生じる SubpathSet法:構文木の一致度 手法A,B :構文情報が大きく変化 ・共起頻度による含意認識では全ての評価セットに おいて標準偏差が小さい ⑬ 難易性が統一されている
結論 ・4種類の手法を個々に用いて,日本語テキス ト含意認識評価セットを構築 ⇒構築コストの低下,再現性の向上 ・以下の2点についてさらに研究を進める. ⑭ 1:他の含意認識手法を用いて,評価セットの 難易性が統一されていることを確認 2:他の手法を用いて評価セットを作成し, 含意認識の問題を網羅する
既存研究 ⑤ ・The PASCAL Recognizing Textual Entailment Challenge [Dagan et
al. 2005] ⇒機械翻訳や情報検索の手法を使用 ・日本語Textual Entailmentのデータ構築と自動 獲得した類語表現に基づく推論関係の認識 [小谷ら 2008] ⇒推論要因を5つに分類し,評価セットを構築 ⇒分類方法が不明瞭なため再現性がない ⇒含意認識時の問題点が議論しにくい