Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款と派生書類の自動対応付け
Search
自然言語処理研究室
March 31, 2011
Research
0
72
保険約款と派生書類の自動対応付け
丹治 広樹, 山本 和英. 保険約款と派生書類の自動対応付け. 言語処理学会第17回年次大会, pp.868-871 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
97
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
980
【緊急警告】日本の未来設計図 ~沈没か、再生か。国民と断行するラストチャンス~
yuutakasan
0
150
[RSJ25] Enhancing VLA Performance in Understanding and Executing Free-form Instructions via Visual Prompt-based Paraphrasing
keio_smilab
PRO
0
100
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
1.7k
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
25
18k
Creation and environmental applications of 15-year daily inundation and vegetation maps for Siberia by integrating satellite and meteorological datasets
satai
3
260
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
1
200
言語モデルの地図:確率分布と情報幾何による類似性の可視化
shimosan
5
1.4k
IMC の細かすぎる話 2025
smly
2
620
不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用 / iot70_gp_rff_mab
monochromegane
2
160
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
260
Adaptive Experimental Design for Efficient Average Treatment Effect Estimation and Treatment Choice
masakat0
0
110
Featured
See All Featured
It's Worth the Effort
3n
187
28k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
13k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
Navigating Team Friction
lara
189
15k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
Done Done
chrislema
185
16k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Building an army of robots
kneath
306
46k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Embracing the Ebb and Flow
colly
87
4.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
Six Lessons from altMBA
skipperchong
28
4k
Transcript
保険約款と派生書類の 自動対応付け 長岡技術科学大学 丹治 広樹 山本 和英 言語処理学会第17回年次大会 於 豊橋技術科学大学
F3-4
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 保険約款・特約、事業方法書、算出方法書 等
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 章・条のような構造 箇条書き形式 等 保険約款・特約、事業方法書、算出方法書 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等 表形式など、レイアウト重視 章や条による区分はない
派生書類 4 Ⅰ 契約概要のご説明 ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・
(2) 補償内容 主な補償内容は ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類の1章のみに対応 基礎書類の複数の章に対応 複数の書類に対応 重要事項説明書、規定集、パンフレット、広告 等
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6 派生書類のある1文について 基礎書類の対応する章を提示
ベースライン 頻度情報による対応付け 7 派生書類 基礎書類 単語TF・IDF or 単語のIDF 単語TF・IDF
or 単語のIDF 単語ベクトル 単語ベクトル 内積 or コサイン類似度 類似度
対応付けの手法 人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~
②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
基礎書類の手がかり語による対応付け 提案手法1 9 派生書類 基礎書類 手がかり語のヒット数 章のタイトル 条のタイトル 用語の定義
定義文 手がかり語 第1章 : 第2章 : 章のタイトル ・ ・ ・
提案手法2 派生書類の手がかり語による対応付け 10 派生書類 基礎書類 単語のIDF 手がかり語 手がかり語のヒット数
実験条件 使用した資源 自動車損害保険に関する文書 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)
: 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文が対応付けされた
考察 ~頻度情報による手法~ IDFおよび内積を用いた手法が最良 派生書類の文中で繰り返し使用する語は 「保険」「補償」等、対応付けの参考にならない 基礎書類の複数章に言及する文もある 13 基礎書類との対応が文の長さに依存しない
1文中での語の出現回数は意味をもたない TF・IDF より IDF コサイン類似度 より 内積
人手で抽出した手がかり語を用いた場合 派生書類215文から人手で手がかり語を抽出 基礎書類で手がかり語が最も多くヒットした章を提示 派生書類から人手で抽出した手がかり語が 基礎書類に存在した割合が8割程度 考察 ~手がかり語による手法~ 14
ヒット数以外の尺度が必要 人手で抽出した手がかり語を用いても 正解率は5割弱
考察 ~手がかり語の有効性~ 複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語
複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 考察 ~手がかり語の有効性~ 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語 1語で対応付けできる場合と 複数の語を見るべき場合の 判別が重要!
今後の課題 1. 対応付けの精度向上 手がかり語を生かす尺度の検討 複数文を見るべき場合との判別 2. 対応のない文の判定および1対多の対応付け 3.
校正支援システムとしての実用化 16
まとめ 人手による校正を支援するために、基礎書類と 派生書類の自動対応付けを行った IDF と内積を用いた手法により、正解率約7割で 対応付けすることができた 手がかり語による手法は正解率約4割であった
複数の語を見るべき場合との判別が必要 17
ご清聴ありがとうございました