Upgrade to Pro — share decks privately, control downloads, hide ads and more …

保険関連文書の自動校正支援

 保険関連文書の自動校正支援

丹治 広樹. 保険関連文書の自動校正支援. 長岡技術科学大学修士論文 (2011.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル

    印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
  2. 使用する文書(派生書類) 4 Ⅰ 契約概要のご説明 ・ ・ ・ (2) 補償内容 主な補償内容は

    ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・
  3. 使用する文書(派生書類) 4 Ⅰ 契約概要のご説明 ・ ・ ・ (2) 補償内容 主な補償内容は

    ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類と対応
  4. 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル

    印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
  5. 対応付けの手法  人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~

    ②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
  6. 対応付けの実験  実験条件 損害保険に関する資料 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)

    : 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
  7. 対応付けの実験  実験結果 12 重み 尺度 IDF 内積 正解率 69.2%

    TF・IDF コサイン類似度 56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
  8. 対応付けの実験  実験結果 12 重み 尺度 IDF 内積 正解率 69.2%

    TF・IDF コサイン類似度 56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文を対応付けできた
  9. 15 本研究における矛盾  数値の間違い  否定表現の間違い  使用している語の不統一 事故の日から180日以内に~ ⇔

    事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 等 + 契約者ご自身 ⇔ 契約者本人
  10. 使用した基準  数値の不一致  派生書類に出現した数値が基礎書類に存在しない  時間や日付の不一致  派生書類に出現した時間や日付が基礎書類に存在しない 

    単語の不一致  派生書類に出現した単語が基礎書類に存在しない  「すべて/いずれか」の不一致  派生書類に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない  否定表現の不一致  派生書類に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 17
  11. 矛盾認識の実験  実験条件 生命保険に関する資料 基礎書類 (保険約款、特約) : 794文 派生書類 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文)  実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 224→102 18
  12. 矛盾認識の実験  実験条件 生命保険に関する資料 基礎書類 (保険約款、特約) : 794文 派生書類 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文)  実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 224→102 再現率0.85で 文書量を半分以下に削減できた 18
  13. 残された課題 1. 矛盾認識手法における再現率の向上  場面や極性の判定  具体例の除去 2. 対応付けの精度向上 

    重要語の検討 3. 対応のない文の判定および1対多の対応付け 4. 各種校正支援システムの実用化 24