$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款と派生書類の自動対応付け
Search
自然言語処理研究室
March 31, 2011
Research
0
76
保険約款と派生書類の自動対応付け
丹治 広樹, 山本 和英. 保険約款と派生書類の自動対応付け. 言語処理学会第17回年次大会, pp.868-871 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
500
データサイエンス12_分類.pdf
jnlp
0
350
データサイエンス11_前処理.pdf
jnlp
0
480
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
170
「リアル×スキマ時間」を活用したUXリサーチ 〜新規事業を前に進めるためのUXリサーチプロセスの設計〜
techtekt
PRO
0
190
Panopticon: Advancing Any-Sensor Foundation Models for Earth Observation
satai
3
430
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1k
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
280
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
360
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
0
110
EcoWikiRS: Learning Ecological Representation of Satellite Images from Weak Supervision with Species Observation and Wikipedia
satai
3
460
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.2k
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
280
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
220
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
450
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
30
RailsConf 2023
tenderlove
30
1.3k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.7k
The browser strikes back
jonoalderson
0
65
Believing is Seeing
oripsolob
0
12
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Test your architecture with Archunit
thirion
1
2.1k
Amusing Abliteration
ianozsvald
0
63
How to Talk to Developers About Accessibility
jct
1
81
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
500
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Transcript
保険約款と派生書類の 自動対応付け 長岡技術科学大学 丹治 広樹 山本 和英 言語処理学会第17回年次大会 於 豊橋技術科学大学
F3-4
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 保険約款・特約、事業方法書、算出方法書 等
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 章・条のような構造 箇条書き形式 等 保険約款・特約、事業方法書、算出方法書 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等 表形式など、レイアウト重視 章や条による区分はない
派生書類 4 Ⅰ 契約概要のご説明 ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・
(2) 補償内容 主な補償内容は ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類の1章のみに対応 基礎書類の複数の章に対応 複数の書類に対応 重要事項説明書、規定集、パンフレット、広告 等
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6 派生書類のある1文について 基礎書類の対応する章を提示
ベースライン 頻度情報による対応付け 7 派生書類 基礎書類 単語TF・IDF or 単語のIDF 単語TF・IDF
or 単語のIDF 単語ベクトル 単語ベクトル 内積 or コサイン類似度 類似度
対応付けの手法 人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~
②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
基礎書類の手がかり語による対応付け 提案手法1 9 派生書類 基礎書類 手がかり語のヒット数 章のタイトル 条のタイトル 用語の定義
定義文 手がかり語 第1章 : 第2章 : 章のタイトル ・ ・ ・
提案手法2 派生書類の手がかり語による対応付け 10 派生書類 基礎書類 単語のIDF 手がかり語 手がかり語のヒット数
実験条件 使用した資源 自動車損害保険に関する文書 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)
: 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文が対応付けされた
考察 ~頻度情報による手法~ IDFおよび内積を用いた手法が最良 派生書類の文中で繰り返し使用する語は 「保険」「補償」等、対応付けの参考にならない 基礎書類の複数章に言及する文もある 13 基礎書類との対応が文の長さに依存しない
1文中での語の出現回数は意味をもたない TF・IDF より IDF コサイン類似度 より 内積
人手で抽出した手がかり語を用いた場合 派生書類215文から人手で手がかり語を抽出 基礎書類で手がかり語が最も多くヒットした章を提示 派生書類から人手で抽出した手がかり語が 基礎書類に存在した割合が8割程度 考察 ~手がかり語による手法~ 14
ヒット数以外の尺度が必要 人手で抽出した手がかり語を用いても 正解率は5割弱
考察 ~手がかり語の有効性~ 複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語
複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 考察 ~手がかり語の有効性~ 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語 1語で対応付けできる場合と 複数の語を見るべき場合の 判別が重要!
今後の課題 1. 対応付けの精度向上 手がかり語を生かす尺度の検討 複数文を見るべき場合との判別 2. 対応のない文の判定および1対多の対応付け 3.
校正支援システムとしての実用化 16
まとめ 人手による校正を支援するために、基礎書類と 派生書類の自動対応付けを行った IDF と内積を用いた手法により、正解率約7割で 対応付けすることができた 手がかり語による手法は正解率約4割であった
複数の語を見るべき場合との判別が必要 17
ご清聴ありがとうございました