Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款と派生書類の自動対応付け
Search
自然言語処理研究室
March 31, 2011
Research
92
0
Share
保険約款と派生書類の自動対応付け
丹治 広樹, 山本 和英. 保険約款と派生書類の自動対応付け. 言語処理学会第17回年次大会, pp.868-871 (2011.3)
自然言語処理研究室
March 31, 2011
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
150
ICCV2025参加報告_採択されやすいワークショップの選び方
kobayashi31
0
120
2026.01ウェビナー資料
elith
0
340
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
2.5k
データサイエンティストの業務変化
datascientistsociety
PRO
0
370
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
210
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
250
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
820
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
1.6k
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
440
LLMアプリケーションの透明性について
fufufukakaka
0
220
Ankylosing Spondylitis
ankh2054
0
160
Featured
See All Featured
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.6k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
What's in a price? How to price your products and services
michaelherold
247
13k
Paper Plane
katiecoart
PRO
1
49k
Darren the Foodie - Storyboard
khoart
PRO
3
3.3k
Balancing Empowerment & Direction
lara
6
1.1k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
900
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Fireside Chat
paigeccino
42
3.9k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
530
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
53k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Transcript
保険約款と派生書類の 自動対応付け 長岡技術科学大学 丹治 広樹 山本 和英 言語処理学会第17回年次大会 於 豊橋技術科学大学
F3-4
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 保険約款・特約、事業方法書、算出方法書 等
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 章・条のような構造 箇条書き形式 等 保険約款・特約、事業方法書、算出方法書 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等 表形式など、レイアウト重視 章や条による区分はない
派生書類 4 Ⅰ 契約概要のご説明 ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・
(2) 補償内容 主な補償内容は ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類の1章のみに対応 基礎書類の複数の章に対応 複数の書類に対応 重要事項説明書、規定集、パンフレット、広告 等
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6 派生書類のある1文について 基礎書類の対応する章を提示
ベースライン 頻度情報による対応付け 7 派生書類 基礎書類 単語TF・IDF or 単語のIDF 単語TF・IDF
or 単語のIDF 単語ベクトル 単語ベクトル 内積 or コサイン類似度 類似度
対応付けの手法 人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~
②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
基礎書類の手がかり語による対応付け 提案手法1 9 派生書類 基礎書類 手がかり語のヒット数 章のタイトル 条のタイトル 用語の定義
定義文 手がかり語 第1章 : 第2章 : 章のタイトル ・ ・ ・
提案手法2 派生書類の手がかり語による対応付け 10 派生書類 基礎書類 単語のIDF 手がかり語 手がかり語のヒット数
実験条件 使用した資源 自動車損害保険に関する文書 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)
: 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文が対応付けされた
考察 ~頻度情報による手法~ IDFおよび内積を用いた手法が最良 派生書類の文中で繰り返し使用する語は 「保険」「補償」等、対応付けの参考にならない 基礎書類の複数章に言及する文もある 13 基礎書類との対応が文の長さに依存しない
1文中での語の出現回数は意味をもたない TF・IDF より IDF コサイン類似度 より 内積
人手で抽出した手がかり語を用いた場合 派生書類215文から人手で手がかり語を抽出 基礎書類で手がかり語が最も多くヒットした章を提示 派生書類から人手で抽出した手がかり語が 基礎書類に存在した割合が8割程度 考察 ~手がかり語による手法~ 14
ヒット数以外の尺度が必要 人手で抽出した手がかり語を用いても 正解率は5割弱
考察 ~手がかり語の有効性~ 複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語
複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 考察 ~手がかり語の有効性~ 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語 1語で対応付けできる場合と 複数の語を見るべき場合の 判別が重要!
今後の課題 1. 対応付けの精度向上 手がかり語を生かす尺度の検討 複数文を見るべき場合との判別 2. 対応のない文の判定および1対多の対応付け 3.
校正支援システムとしての実用化 16
まとめ 人手による校正を支援するために、基礎書類と 派生書類の自動対応付けを行った IDF と内積を用いた手法により、正解率約7割で 対応付けすることができた 手がかり語による手法は正解率約4割であった
複数の語を見るべき場合との判別が必要 17
ご清聴ありがとうございました