Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款に対する派生文書の矛盾認識
Search
自然言語処理研究室
March 31, 2010
Research
0
180
保険約款に対する派生文書の矛盾認識
丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
390
データサイエンス13_解析.pdf
jnlp
0
490
データサイエンス12_分類.pdf
jnlp
0
350
データサイエンス11_前処理.pdf
jnlp
0
470
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
140
自然言語処理研究室 研究概要(2013年)
jnlp
0
100
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
200
Other Decks in Research
See All in Research
機械学習と数理最適化の融合 (MOAI) による革新
mickey_kubo
1
400
2021年度-基盤研究B-研究計画調書
trycycle
PRO
0
370
Mechanistic Interpretability:解釈可能性研究の新たな潮流
koshiro_aoki
1
480
とあるSREの博士「過程」 / A Certain SRE’s Ph.D. Journey
yuukit
11
4.5k
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
260
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images
satai
3
330
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
170
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
2.2k
論文読み会 SNLP2025 Learning Dynamics of LLM Finetuning. In: ICLR 2025
s_mizuki_nlp
0
290
Generative Models 2025
takahashihiroshi
25
14k
財務諸表監査のための逐次検定
masakat0
0
150
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
140
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
920
Side Projects
sachag
455
43k
Building a Modern Day E-commerce SEO Strategy
aleyda
44
7.8k
Mobile First: as difficult as doing things right
swwweet
225
10k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Music & Morning Musume
bryan
46
6.9k
Done Done
chrislema
185
16k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
34
2.3k
BBQ
matthewcrist
89
9.8k
Unsuck your backbone
ammeep
671
58k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Transcript
保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英
2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集
マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要
etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3
5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3
6 基礎書類 保険契約の内容・条件・種類を定めたもの 国に許可を得るため法律文のような傾向がある 章・条・項等の箇条書きで構成されている 括弧書きによる注釈を含む
約款 保険の主契約に付随するオプション 約款と同様の体裁をとる 特約(特別約款) etc. 4
7 派生文書 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの 客に理解を促すため図表や敬語を使用している 契約概要 免責事項や個人情報等について書かれたもの
契約概要と同様の体裁をとる 注意喚起情報 5
8 6 本研究における矛盾 数値の間違い 否定表現の間違い 使用している語の不統一 事故の日から180日以内に~
⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment
Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
10 使用した基準 数値の不一致 派生文書に出現した数値が基礎書類に存在しない 時間や日付の不一致 派生文書に出現した日付や時間が基礎書類に存在しない
単語の不一致 派生文書に出現した単語が基礎書類に存在しない 「すべて/いずれか」の不一致 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない 否定表現の不一致 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
11 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
12 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
13 矛盾認識できた例 基礎書類にそろえるべき表現 基礎書類と一致しない数値 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)
クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
14 認識できなかった例 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11
15 誤って認識した例 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12
16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13
17 まとめ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた 書類の増量および再現率の向上を目指す
14
18 発表は以上です ご清聴ありがとうございました