Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款と派生書類の自動対応付け
Search
自然言語処理研究室
March 31, 2011
Research
0
75
保険約款と派生書類の自動対応付け
丹治 広樹, 山本 和英. 保険約款と派生書類の自動対応付け. 言語処理学会第17回年次大会, pp.868-871 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
390
データサイエンス13_解析.pdf
jnlp
0
500
データサイエンス12_分類.pdf
jnlp
0
350
データサイエンス11_前処理.pdf
jnlp
0
470
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
140
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
ウェブ・ソーシャルメディア論文読み会 第31回: The rising entropy of English in the attention economy. (Commun Psychology, 2024)
hkefka385
1
120
EcoWikiRS: Learning Ecological Representation of Satellite Images from Weak Supervision with Species Observation and Wikipedia
satai
3
380
音声感情認識技術の進展と展望
nagase
0
360
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
370
CoRL2025速報
rpc
2
3.3k
Unsupervised Domain Adaptation Architecture Search with Self-Training for Land Cover Mapping
satai
3
330
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
0
220
論文読み会 SNLP2025 Learning Dynamics of LLM Finetuning. In: ICLR 2025
s_mizuki_nlp
0
340
論文紹介:Safety Alignment Should be Made More Than Just a Few Tokens Deep
kazutoshishinoda
0
130
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
430
超高速データサイエンス
matsui_528
1
220
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
150
Featured
See All Featured
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Designing for Performance
lara
610
69k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.1k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
68k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
69
Making Projects Easy
brettharned
120
6.5k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
The Invisible Side of Design
smashingmag
302
51k
Site-Speed That Sticks
csswizardry
13
980
Building Applications with DynamoDB
mza
96
6.8k
Transcript
保険約款と派生書類の 自動対応付け 長岡技術科学大学 丹治 広樹 山本 和英 言語処理学会第17回年次大会 於 豊橋技術科学大学
F3-4
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 保険約款・特約、事業方法書、算出方法書 等
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 章・条のような構造 箇条書き形式 等 保険約款・特約、事業方法書、算出方法書 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等 表形式など、レイアウト重視 章や条による区分はない
派生書類 4 Ⅰ 契約概要のご説明 ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・
(2) 補償内容 主な補償内容は ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類の1章のみに対応 基礎書類の複数の章に対応 複数の書類に対応 重要事項説明書、規定集、パンフレット、広告 等
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6 派生書類のある1文について 基礎書類の対応する章を提示
ベースライン 頻度情報による対応付け 7 派生書類 基礎書類 単語TF・IDF or 単語のIDF 単語TF・IDF
or 単語のIDF 単語ベクトル 単語ベクトル 内積 or コサイン類似度 類似度
対応付けの手法 人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~
②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
基礎書類の手がかり語による対応付け 提案手法1 9 派生書類 基礎書類 手がかり語のヒット数 章のタイトル 条のタイトル 用語の定義
定義文 手がかり語 第1章 : 第2章 : 章のタイトル ・ ・ ・
提案手法2 派生書類の手がかり語による対応付け 10 派生書類 基礎書類 単語のIDF 手がかり語 手がかり語のヒット数
実験条件 使用した資源 自動車損害保険に関する文書 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)
: 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文が対応付けされた
考察 ~頻度情報による手法~ IDFおよび内積を用いた手法が最良 派生書類の文中で繰り返し使用する語は 「保険」「補償」等、対応付けの参考にならない 基礎書類の複数章に言及する文もある 13 基礎書類との対応が文の長さに依存しない
1文中での語の出現回数は意味をもたない TF・IDF より IDF コサイン類似度 より 内積
人手で抽出した手がかり語を用いた場合 派生書類215文から人手で手がかり語を抽出 基礎書類で手がかり語が最も多くヒットした章を提示 派生書類から人手で抽出した手がかり語が 基礎書類に存在した割合が8割程度 考察 ~手がかり語による手法~ 14
ヒット数以外の尺度が必要 人手で抽出した手がかり語を用いても 正解率は5割弱
考察 ~手がかり語の有効性~ 複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語
複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 考察 ~手がかり語の有効性~ 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語 1語で対応付けできる場合と 複数の語を見るべき場合の 判別が重要!
今後の課題 1. 対応付けの精度向上 手がかり語を生かす尺度の検討 複数文を見るべき場合との判別 2. 対応のない文の判定および1対多の対応付け 3.
校正支援システムとしての実用化 16
まとめ 人手による校正を支援するために、基礎書類と 派生書類の自動対応付けを行った IDF と内積を用いた手法により、正解率約7割で 対応付けすることができた 手がかり語による手法は正解率約4割であった
複数の語を見るべき場合との判別が必要 17
ご清聴ありがとうございました