保険関連文書の自動校正支援

 保険関連文書の自動校正支援

丹治 広樹. 保険関連文書の自動校正支援. 長岡技術科学大学修士論文 (2011.3)

Transcript

  1. 2.

    背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル

    印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
  2. 4.

    使用する文書(派生書類) 4 Ⅰ 契約概要のご説明 ・ ・ ・ (2) 補償内容 主な補償内容は

    ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・
  3. 5.

    使用する文書(派生書類) 4 Ⅰ 契約概要のご説明 ・ ・ ・ (2) 補償内容 主な補償内容は

    ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類と対応
  4. 6.

    背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル

    印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
  5. 10.

    対応付けの手法  人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~

    ②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
  6. 13.

    対応付けの実験  実験条件 損害保険に関する資料 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)

    : 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
  7. 14.

    対応付けの実験  実験結果 12 重み 尺度 IDF 内積 正解率 69.2%

    TF・IDF コサイン類似度 56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
  8. 15.

    対応付けの実験  実験結果 12 重み 尺度 IDF 内積 正解率 69.2%

    TF・IDF コサイン類似度 56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文を対応付けできた
  9. 19.

    15 本研究における矛盾  数値の間違い  否定表現の間違い  使用している語の不統一 事故の日から180日以内に~ ⇔

    事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 等 + 契約者ご自身 ⇔ 契約者本人
  10. 21.

    使用した基準  数値の不一致  派生書類に出現した数値が基礎書類に存在しない  時間や日付の不一致  派生書類に出現した時間や日付が基礎書類に存在しない 

    単語の不一致  派生書類に出現した単語が基礎書類に存在しない  「すべて/いずれか」の不一致  派生書類に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない  否定表現の不一致  派生書類に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 17
  11. 22.

    矛盾認識の実験  実験条件 生命保険に関する資料 基礎書類 (保険約款、特約) : 794文 派生書類 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文)  実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 224→102 18
  12. 23.

    矛盾認識の実験  実験条件 生命保険に関する資料 基礎書類 (保険約款、特約) : 794文 派生書類 (契約概要、注意喚起情報)

    : 224文 (うち矛盾を含む文 : 82文)  実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 224→102 再現率0.85で 文書量を半分以下に削減できた 18
  13. 31.

    残された課題 1. 矛盾認識手法における再現率の向上  場面や極性の判定  具体例の除去 2. 対応付けの精度向上 

    重要語の検討 3. 対応のない文の判定および1対多の対応付け 4. 各種校正支援システムの実用化 24