Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款に対する派生文書の矛盾認識
Search
自然言語処理研究室
March 31, 2010
Research
0
190
保険約款に対する派生文書の矛盾認識
丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
姫路市 -都市OSの「再実装」-
hopin
0
1.7k
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
180
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
140
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
560
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
170
Off-Policy Evaluation and Learning for Matching Markets
yudai00
0
110
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
20
9.8k
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
640
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
660
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
170
When Learned Data Structures Meet Computer Vision
matsui_528
1
4.4k
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
790
Featured
See All Featured
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.2k
The untapped power of vector embeddings
frankvandijk
2
1.6k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
92
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Become a Pro
speakerdeck
PRO
31
5.9k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
570
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Building Adaptive Systems
keathley
44
3k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Balancing Empowerment & Direction
lara
5
960
Git: the NoSQL Database
bkeepers
PRO
432
67k
Transcript
保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英
2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集
マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要
etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3
5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3
6 基礎書類 保険契約の内容・条件・種類を定めたもの 国に許可を得るため法律文のような傾向がある 章・条・項等の箇条書きで構成されている 括弧書きによる注釈を含む
約款 保険の主契約に付随するオプション 約款と同様の体裁をとる 特約(特別約款) etc. 4
7 派生文書 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの 客に理解を促すため図表や敬語を使用している 契約概要 免責事項や個人情報等について書かれたもの
契約概要と同様の体裁をとる 注意喚起情報 5
8 6 本研究における矛盾 数値の間違い 否定表現の間違い 使用している語の不統一 事故の日から180日以内に~
⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment
Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
10 使用した基準 数値の不一致 派生文書に出現した数値が基礎書類に存在しない 時間や日付の不一致 派生文書に出現した日付や時間が基礎書類に存在しない
単語の不一致 派生文書に出現した単語が基礎書類に存在しない 「すべて/いずれか」の不一致 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない 否定表現の不一致 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
11 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
12 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
13 矛盾認識できた例 基礎書類にそろえるべき表現 基礎書類と一致しない数値 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)
クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
14 認識できなかった例 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11
15 誤って認識した例 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12
16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13
17 まとめ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた 書類の増量および再現率の向上を目指す
14
18 発表は以上です ご清聴ありがとうございました