Upgrade to Pro — share decks privately, control downloads, hide ads and more …

説明文と記述要素の関係要因の調査 ~ そこにクエリの「何」が書かれているのか ~

説明文と記述要素の関係要因の調査 ~ そこにクエリの「何」が書かれているのか ~

久保木 武承, 山本和英. 説明文と記述要素の関係要因の調査 ~ そこにクエリの「何」が書かれているのか ~. 電子情報通信学会 テキストマイニングシンポジウム, 信学技報, vol. 111, no. 119, NLC2011-14, pp. 73-78 (2011.7)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 記述要素候補の取得 クエリ:個人情報保護法 記述要素の異なり数 366 適切な記述要素 289(79%) 不適切な記述要素 77(21%) ・定義に則った単純な手法 →79%がそのまま利用可能

    適切な例:施行,適用,定義,対策,改正,影響 不適切な例:民間事業者,過剰,全面 次の付与実験では、文数の多い52個を使用 5
  2. 記述要素の付与 規定のキーワード ・行政機関 ・行政機関個人情報保護 法第二条第三項 ・保有個人情報 ・開示請求 ・行政機関個人情報保護 法第十二条第二項 9

    (3)キーワードを含む文に“記述要素“を付与 個人情報保護法 を含む文の語 ・行政機関 ・保有個人情報 ・開示請求 付与
  3. 実験-共起語トリガによる付与 ・再現率は高いが適合率は低い ・トリガの制約はきいている→平均候補数は減少 ・実際に使われたトリガは…? 名称 再現率 適合率 F値 平均候補数 ans

    0.72 0.06 0.10 54.0 1trigger(1) 0.70 0.07 0.13 41.4 2trigger(1) 0.70 0.08 0.14 36.5 3trigger(1) 0.62 0.09 0.16 27.3 1trigger(1)(2) 0.42 0.15 0.22 5.9 2trigger(1)(2) 0.54 0.10 0.17 20.9 3trigger(1)(2) 0.55 0.10 0.16 21.8 1trigger(1)(2)(3) 0.37 0.16 0.22 3.4 2trigger(1)(2)(3) 0.52 0.10 0.17 18.5 3trigger(1)(2)(3) 0.55 0.10 0.17 20.3 13
  4. まとめ-共起・係り受けトリガ比較 p/p=記述要素は正しく付与 p/n=間違って付与した n/p=取り逃している n/n=記述要素がないことを正しく認識 17 トリガ 精度 適合率 再現率

    system/answer p/p p/n n/p n/n 1単語 0.46 0.13 0.77 148 978 44 730 2単語 0.73 0.19 0.50 96 409 96 1299 3単語 0.85 0.23 0.21 41 140 151 1568 係り受け 0.86 0.31 0.06 11 24 181 1615 正解 セット 0.10 - - 192 - - 1708
  5. まとめ-共起・係り受けトリガ比較 ・係り受けでも精度が低い→大量のエラーのせい 18 トリガ 精度 適合率 再現率 system/answer p/p p/n

    n/p n/n 1単語 0.46 0.13 0.77 148 978 44 730 2単語 0.73 0.19 0.50 96 409 96 1299 3単語 0.85 0.23 0.21 41 140 151 1568 係り受け 0.86 0.31 0.06 11 24 181 1615 正解 セット 0.10 - - 192 - - 1708 トリガは正解と不正解の分別に向かない? →考察へ
  6. 25