Upgrade to Pro — share decks privately, control downloads, hide ads and more …

保険約款に対する派生文書の矛盾認識

 保険約款に対する派生文書の矛盾認識

丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)

Transcript

  1. 保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英

  2. 2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集

    マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
  3. 3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要

    etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
  4. 4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3

  5. 5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3

  6. 6 基礎書類 „ 保険契約の内容・条件・種類を定めたもの „ 国に許可を得るため法律文のような傾向がある „ 章・条・項等の箇条書きで構成されている „ 括弧書きによる注釈を含む

    約款 „ 保険の主契約に付随するオプション „ 約款と同様の体裁をとる 特約(特別約款) etc. 4
  7. 7 派生文書 „ 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの „ 客に理解を促すため図表や敬語を使用している 契約概要 „ 免責事項や個人情報等について書かれたもの

    „ 契約概要と同様の体裁をとる 注意喚起情報 5
  8. 8 6 本研究における矛盾 „ 数値の間違い „ 否定表現の間違い „ 使用している語の不統一 事故の日から180日以内に~

    ⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
  9. 9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment

    Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
  10. 10 使用した基準 „ 数値の不一致 „ 派生文書に出現した数値が基礎書類に存在しない „ 時間や日付の不一致 „ 派生文書に出現した日付や時間が基礎書類に存在しない

    „ 単語の不一致 „ 派生文書に出現した単語が基礎書類に存在しない „ 「すべて/いずれか」の不一致 „ 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない „ 否定表現の不一致 „ 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
  11. 11 実験 „ 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文) „ 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
  12. 12 実験 „ 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文) „ 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
  13. 13 矛盾認識できた例 „ 基礎書類にそろえるべき表現 „ 基礎書類と一致しない数値 „ 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)

    クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
  14. 14 認識できなかった例 „ 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11

  15. 15 誤って認識した例 „ 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12

  16. 16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13

  17. 17 まとめ „ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した „ 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた „ 書類の増量および再現率の向上を目指す

    14
  18. 18 発表は以上です ご清聴ありがとうございました