Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款と派生書類の自動対応付け
Search
自然言語処理研究室
March 31, 2011
Research
0
48
保険約款と派生書類の自動対応付け
丹治 広樹, 山本 和英. 保険約款と派生書類の自動対応付け. 言語処理学会第17回年次大会, pp.868-871 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
370
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
98
自然言語処理研究室 研究概要(2013年)
jnlp
0
66
自然言語処理研究室 研究概要(2014年)
jnlp
0
62
自然言語処理研究室 研究概要(2015年)
jnlp
0
110
Other Decks in Research
See All in Research
時系列解析と疫学
kingqwert
2
860
デフスポーツにおける支援技術 〜競技特性・ルールと技術との関係〜
slab
0
130
小説執筆における生成AIの利用
niryuu
0
100
First Authorに俺はなるっ!! IROS’23 CCC2023 FY
shota_nishiyama
0
150
第12回全日本コンピュータビジョン勉強会:画像の自己教師あり学習における大規模データセット
naok615
0
480
推薦結果への説明付加はいつどんなものが嬉しいか
kuri8ive
1
220
Experiments on ROP Attack with Various Instruction Set Architectures
yumulab
0
310
Active Retrieval Augmented Generation
kiyohiro8
3
420
MegaParticles: GPUを利用したStein Particle Filterによる点群6自由度姿勢推定
koide3
1
460
マルチモーダルLLMの応用動向の論文調査
masatoto
7
2.4k
コミュニティ、人、関係性 / Community, The Inner World, Relationships
spring_aki
PRO
1
820
「歴史的農業環境閲覧システム」と「迅速測図」について
wata909
1
530
Featured
See All Featured
It's Worth the Effort
3n
180
27k
Imperfection Machines: The Place of Print at Facebook
scottboms
257
12k
Learning to Love Humans: Emotional Interface Design
aarron
266
39k
The Art of Programming - Codeland 2020
erikaheidi
40
12k
Making the Leap to Tech Lead
cromwellryan
123
8.4k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
39
4.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3k
RailsConf 2023
tenderlove
0
510
How STYLIGHT went responsive
nonsquared
92
4.7k
Why You Should Never Use an ORM
jnunemaker
PRO
50
8.6k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
6.8k
Transcript
保険約款と派生書類の 自動対応付け 長岡技術科学大学 丹治 広樹 山本 和英 言語処理学会第17回年次大会 於 豊橋技術科学大学
F3-4
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2 各種保険協会 ガイドライン 遵守 人手入力 人手校正
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 保険約款・特約、事業方法書、算出方法書 等
基礎書類 3 第1章 賠償責任条項 第1条 (用語の定義) この賠償責任条項において、 ~ ・ ・
・ 第2条 (保険金を支払う場合‐対人賠償) ・ ・ ・ 章・条のような構造 箇条書き形式 等 保険約款・特約、事業方法書、算出方法書 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等
派生書類 4 Ⅰ 契約概要のご説明 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償
自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・ (2) 補償内容 主な補償内容は ~ 重要事項説明書、規定集、パンフレット、広告 等 表形式など、レイアウト重視 章や条による区分はない
派生書類 4 Ⅰ 契約概要のご説明 ~ 10台以上のご契約者の場合、弊社ではご契約いただけません ~ ・ ・ ・
(2) 補償内容 主な補償内容は ~ 補償項目 保険金をお支払する場合 相手方 への賠償 対人賠償 対物賠償 自動車事故により、 ~ ・ ・ ・ ・ ・ ・ ・ ・ ・ 基礎書類の1章のみに対応 基礎書類の複数の章に対応 複数の書類に対応 重要事項説明書、規定集、パンフレット、広告 等
背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生書類 規定集 マニュアル
印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 5 各種保険協会 ガイドライン 遵守 人手による 校正が困難 人手入力 人手校正 数万ページ
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6
目的 派生書類の校正時に基礎書類との 対応箇所を見て確認しなければならない 派生書類と基礎書類の自動対応付けにより 人手による検索等の労力を削減 6 派生書類のある1文について 基礎書類の対応する章を提示
ベースライン 頻度情報による対応付け 7 派生書類 基礎書類 単語TF・IDF or 単語のIDF 単語TF・IDF
or 単語のIDF 単語ベクトル 単語ベクトル 内積 or コサイン類似度 類似度
対応付けの手法 人手により校正するとき、何を参考にするか? 1. 派生書類の文中から手がかりとなる語を選定 2. 基礎書類でその語を検索し、対応を判断 例) ①お車の入替の場合(自動車を新たに取得し ~
②お車の譲渡の場合(ご契約に適用される ~ 約款 第7章 第8条(被保険自動車の入替) 約款 第7章 第7条(被保険自動車の譲渡) 8 1語で対応付け可能!
基礎書類の手がかり語による対応付け 提案手法1 9 派生書類 基礎書類 手がかり語のヒット数 章のタイトル 条のタイトル 用語の定義
定義文 手がかり語 第1章 : 第2章 : 章のタイトル ・ ・ ・
提案手法2 派生書類の手がかり語による対応付け 10 派生書類 基礎書類 単語のIDF 手がかり語 手がかり語のヒット数
実験条件 使用した資源 自動車損害保険に関する文書 基礎書類 (保険約款、特約) : 3,868文 派生書類 (重要事項説明書)
: 964文 11 対応なし 1対1で対応 453文 対約款:215文 対特約:272文 (重複あり487文) 1対多 80文
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法
実験結果 12 重み 尺度 IDF 内積 正解率 69.2% TF・IDF コサイン類似度
56.9% 内積 コサイン類似度 39.2% 57.3% 基礎書類の語 42.5% 派生書類の語 39.2% 関連手法 提案手法1 提案手法2 - - 手法 正解率約7割で 派生書類の文が対応付けされた
考察 ~頻度情報による手法~ IDFおよび内積を用いた手法が最良 派生書類の文中で繰り返し使用する語は 「保険」「補償」等、対応付けの参考にならない 基礎書類の複数章に言及する文もある 13 基礎書類との対応が文の長さに依存しない
1文中での語の出現回数は意味をもたない TF・IDF より IDF コサイン類似度 より 内積
人手で抽出した手がかり語を用いた場合 派生書類215文から人手で手がかり語を抽出 基礎書類で手がかり語が最も多くヒットした章を提示 派生書類から人手で抽出した手がかり語が 基礎書類に存在した割合が8割程度 考察 ~手がかり語による手法~ 14
ヒット数以外の尺度が必要 人手で抽出した手がかり語を用いても 正解率は5割弱
考察 ~手がかり語の有効性~ 複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語
複数の語を用いた場合 派生書類の文に出現した全内容語を基礎書類と照合 派生書類の語を最も網羅していた章を提示 考察 ~手がかり語の有効性~ 15 正解 不正解 人手で抽出した手がかり語
正解 不正解 20件 (9.3%) 67件 (31.2%) 81件 (37.7%) 47件 (21.9%) 複数の語 1語で対応付けできる場合と 複数の語を見るべき場合の 判別が重要!
今後の課題 1. 対応付けの精度向上 手がかり語を生かす尺度の検討 複数文を見るべき場合との判別 2. 対応のない文の判定および1対多の対応付け 3.
校正支援システムとしての実用化 16
まとめ 人手による校正を支援するために、基礎書類と 派生書類の自動対応付けを行った IDF と内積を用いた手法により、正解率約7割で 対応付けすることができた 手がかり語による手法は正解率約4割であった
複数の語を見るべき場合との判別が必要 17
ご清聴ありがとうございました