語彙知識を用いた日本語テキスト含意認識の評価セット構築と認識実験

語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた日本語テキスト含意認識の日本語テキスト含意認識の
日本語テキスト含意認識の日本語テキスト含意認識の日本語テキスト含意認識の日本語テキスト含意認識の日本語テキスト含意認識の日本語テキスト含意認識の評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験評価セット構築と認識実験長岡技術科学大学長岡技術科学大学電気系電気系村松村松祐希祐希山本山本和英和英 ①

② 背景背景・・テキスト含意認識が注目されているテキスト含意認識が注目されている → →海外ではワークショップを開催海外ではワークショップを開催 →
→質問応答や要約の基礎質問応答や要約の基礎・・国内でテキスト含意認識の研究が少数国内でテキスト含意認識の研究が少数 → →評価セット構築のコストが高い評価セット構築のコストが高い → →含意関係を判断する資源が少ない含意関係を判断する資源が少ない

目的目的・・語彙知識による評価セットの構築を提案語彙知識による評価セットの構築を提案 → →評価セットの構築を低コスト評価セットの構築を低コスト → →テキスト含意認識の問題を明確化
テキスト含意認識の問題を明確化・・本手法の評価セットによる認識実験本手法の評価セットによる認識実験 → →評価セットの新規性を調査評価セットの新規性を調査 ③

④ テキスト含意認識テキスト含意認識本文と仮説から含意関係の判断を行うタスク本文と仮説から含意関係の判断を行うタスク含意判定真本文朝青龍は相撲を辞めた。仮説
朝青龍は相撲界を引退した。テキスト含意認識の例

⑤ 関連研究関連研究・・Dagan Daganらら[2005] [2005] - -新聞コーパスから評価セットを構築
新聞コーパスから評価セットを構築 - -7 7つの手法を使用（質問応答、情報抽出等）つの手法を使用（質問応答、情報抽出等）・・小谷ら小谷ら[2008] [2008] - -推論要因を基に推論要因を基に5 5つの要因に分類つの要因に分類 - -同義・上位下位関係から含意判定同義・上位下位関係から含意判定

⑥ アプローチアプローチ・・語彙知識の利用語彙知識の利用 - -含意認識で発生する問題に制約含意認識で発生する問題に制約 -
-語彙知識の種類よる評価セットの分類化語彙知識の種類よる評価セットの分類化・・評価セットの重要度評価セットの重要度 - -語彙知識の使用頻度語彙知識の使用頻度 - -文の自然さ（連接確率）文の自然さ（連接確率）

⑦ 日本語日本語WordNet WordNet inference hype relations entailment, implication, deduction
eng 暗示、含み、内含、含意、含蓄 jpn words something that is ingerred ・・・. eng definitions entailment(05780885-n) synset 表１日本語WordNetの例日本語WordNetはＮＩＣＴが開発した階層型辞書日本語WordNetから語彙知識を獲得

⑧ システム図システム図システム図システム図システム図システム図システム図システム図語彙知識の獲得
仮説の生成本文と仮説の出力日本語 WordNet 新聞コーパス仮説のフィードバック Ⅰ Ⅲ Ⅱ 資源処理

⑨ 手法手法（語彙知識の獲得）（語彙知識の獲得）語彙知識は上位下位語、同義語を使用 entailment inference ・・暗示
暗示・・含み含み・・内容内容・・含意含意・・含蓄含蓄・・推測推測・・推理推理・・推論推論 derivation ・・導出導出上位概念単語単語単語単語下位概念同義語上位下位語

⑩ 手法手法（仮説の生成）（仮説の生成）本文 OSの欠陥が修正されていないパソコンに感染仮説 OSの欠陥が改善されていないパソコンに感染が修正
する 10 が改定する 5 が改善する 20 が・・・・する連接確率の向上率に注目本文に対する仮説を生成向上率の高い語に置換

⑪ 手法（仮説のフィードバック）手法（仮説のフィードバック）生成した仮説を本文としてフィードバック本文 OSの欠陥が修正されていないパソコンに感染仮説 OSの欠陥が改善されていないパソコンに感染本文 OSの欠陥が改善されていないパソコンに感染
仮説 OSの不具合が改善されていないパソコンに感染フィードバックした仮説から新しい評価セットを生成

評価実験評価実験・・評価セット構築評価セット構築 - -フィードバック回数をフィードバック回数を4 4回まで回まで
- -本文と仮説が含意関係であるか人手判定本文と仮説が含意関係であるか人手判定・・認識実験認識実験 - - Perez and Alfonseca、Glickman et al.の手法 - - 上位語、下位語、上位語、下位語、同義語ごとに実験 ⑫

実験結果（評価セット構築）実験結果（評価セット構築）・・上位上位100 100件の含意文に対して人手評価件の含意文に対して人手評価 ⑬同義語が最も含意文として生成可能 0% 0%
0% 0% 10% 10% 10% 10% 20% 20% 20% 20% 30% 30% 30% 30% 40% 40% 40% 40% 50% 50% 50% 50% 60% 60% 60% 60% 70% 70% 70% 70% 80% 80% 80% 80% 90% 90% 90% 90% 0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 フィードバック回数フィードバック回数フィードバック回数フィードバック回数含意率[%] 含意率[%] 含意率[%] 含意率[%] 上位語上位語上位語上位語下位語下位語下位語下位語同義語同義語同義語同義語

実験結果（認識実験）実験結果（認識実験）・・評価セット各評価セット各500 500件の含意判定結果件の含意判定結果上位語上位語の評価セットが一番難しいの評価セットが一番難しい
⑭ 59% 51% 63% 64% 48% 56% Glickman et al. 71% 51% 60% 64% 46% 56% Perez and Alfonseca CWS 精度 CWS 精度 CWS 精度手法同義語下位語上位語上位語(210:290)、下位語(179:321)、同義語(251:249) 語彙知識（真の数:偽の数）

考察考察（評価セット構築）（評価セット構築）・・連接確率だけでは判断が難しい連接確率だけでは判断が難しい上位語の例上位語の例本文
本文超大型旅客機の開発超大型旅客機の開発延期延期を発表。を発表。仮説仮説超大型旅客機の開発超大型旅客機の開発中止中止を発表。を発表。含意判定含意判定偽偽 ⑮ 語彙知識以外の知識が必要

考察（認識実験）考察（認識実験） ⑯ ・・Perez and Perez and Alfonseca Alfonsecaは
はBLEU BLEUを使用を使用 - -表層が似ている評価セットは難しい表層が似ている評価セットは難しい・・Glickman et al.はWebの検索件数を基に計算 - -上位下位語、同義語は検索件数が高くなる上位下位語、同義語は検索件数が高くなる人間の知識に基づく含意知識が必要

結論結論 ⑰ ・・認識実験により既存手法で解くことが難しい認識実験により既存手法で解くことが難しい - -述語項構造や別の語彙知識が必要述語項構造や別の語彙知識が必要・
・語彙知識を用いてテキスト含意認識の語彙知識を用いてテキスト含意認識の評価セットが構築可能評価セットが構築可能 - -同義語同義語> >上位語上位語> >下位語で作ることが容易下位語で作ることが容易

語彙知識を用いた日本語テキスト含意認識の評価セット構築と認識実験

語彙知識を用いた日本語テキスト含意認識の評価セット構築と認識実験

自然言語処理研究室

More Decks by 自然言語処理研究室

Other Decks in Research

Featured

Transcript

語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた語彙知識を用いた日本語テキスト含意認識の日本語テキスト含意認識の

② 背景背景・・テキスト含意認識が注目されているテキスト含意認識が注目されている → →海外ではワークショップを開催海外ではワークショップを開催 →

目的目的・・語彙知識による評価セットの構築を提案語彙知識による評価セットの構築を提案 → →評価セットの構築を低コスト評価セットの構築を低コスト → →テキスト含意認識の問題を明確化

④ テキスト含意認識テキスト含意認識本文と仮説から含意関係の判断を行うタスク本文と仮説から含意関係の判断を行うタスク含意判定真本文朝青龍は相撲を辞めた。仮説

⑤ 関連研究関連研究・・Dagan Daganらら[2005] [2005] - -新聞コーパスから評価セットを構築

⑥ アプローチアプローチ・・語彙知識の利用語彙知識の利用 - -含意認識で発生する問題に制約含意認識で発生する問題に制約 -

⑦ 日本語日本語WordNet WordNet inference hype relations entailment, implication, deduction

⑧ システム図システム図システム図システム図システム図システム図システム図システム図語彙知識の獲得

⑨ 手法手法（語彙知識の獲得）（語彙知識の獲得）語彙知識は上位下位語、同義語を使用 entailment inference ・・暗示

⑩ 手法手法（仮説の生成）（仮説の生成）本文 OSの欠陥が修正されていないパソコンに感染仮説 OSの欠陥が改善されていないパソコンに感染が修正

評価実験評価実験・・評価セット構築評価セット構築 - -フィードバック回数をフィードバック回数を4 4回まで回まで

実験結果（評価セット構築）実験結果（評価セット構築）・・上位上位100 100件の含意文に対して人手評価件の含意文に対して人手評価 ⑬同義語が最も含意文として生成可能 0% 0%

実験結果（認識実験）実験結果（認識実験）・・評価セット各評価セット各500 500件の含意判定結果件の含意判定結果上位語上位語の評価セットが一番難しいの評価セットが一番難しい

考察考察（評価セット構築）（評価セット構築）・・連接確率だけでは判断が難しい連接確率だけでは判断が難しい上位語の例上位語の例本文

考察（認識実験）考察（認識実験） ⑯ ・・Perez and Perez and Alfonseca Alfonsecaは

結論結論 ⑰ ・・認識実験により既存手法で解くことが難しい認識実験により既存手法で解くことが難しい - -述語項構造や別の語彙知識が必要述語項構造や別の語彙知識が必要・